国家标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210756204.2 (22)申请日 2022.06.29 (71)申请人 中国人民解 放军火箭军工程大 学 地址 710025 陕西省西安市灞桥区同心路2 号 (72)发明人 朱晨豪 叶霞 陆琪多 杨章平  罗承天 徐翰涛  (74)专利代理 机构 北京高沃 律师事务所 1 1569 专利代理师 杜阳阳 (51)Int.Cl. G06V 30/262(2022.01) G06V 10/82(2022.01) G06N 3/08(2006.01) G06N 3/04(2006.01) G06F 40/30(2020.01) (54)发明名称 一种基于额外语义空间的图像描述生成方 法及系统 (57)摘要 本发明公开了一种基于额外语义空间的图 像描述生 成方法及系统, 涉及图像描述生成技术 领域, 方法包括: 按照实体对目标图像进行划分, 得到多个实体图像向量; 将每个实体图像向量输 入到训练好的区域解码器中, 得到对应的语义信 息向量; 将每个实体图像向量和对应的语义信息 向量输入到语义空间解码器中, 得到目标图像的 描述。 和传统的图像描述生成方法相比, 本发明 根据待测试的图像获取多个待测试的图像向量 和多个相应的语义信息向量, 从而得到描述, 提 高了生成描述的准确性。 权利要求书2页 说明书5页 附图2页 CN 115131798 A 2022.09.30 CN 115131798 A 1.一种基于额外语义空间的图像描述 生成方法, 其特 征在于, 所述方法包括: 按照实体对目标图像进行划分, 得到多个实体图像向量; 将每个实体图像向量输入到训练好的区域 解码器中, 得到对应的语义信息向量; 将每个实体图像向量和对应的语义信 息向量输入到语义空间解码器中, 得到所述目标 图像的描述。 2.根据权利要求1所述的基于额外语义空间的图像描述生成方法, 其特征在于, 所述按 照实体对目标图像进行划分, 得到多个实体图像向量, 具体包括: 使用Fast ‑RCNN算法对目标图像进行目标检测, 得到多个目标实体; 将每个目标实体输入到图像编码器中, 得到对应的实体图像向量。 3.根据权利要求1所述的基于额外语义空间的图像描述生成方法, 其特征在于, 所述训 练后的区域 解码器的确定方法为: 获取训练图像文本向量对; 所述训练图像文本向量对包括: 多个训练图像向量和对应 的训练语义信息向量; 将所述训练图像文本向量对输入到区域解码器中, 根据交叉熵损失函数和强化学习方 法获得所述训练好的区域 解码器。 4.根据权利要求1所述的基于额外语义空间的图像描述生成方法, 其特征在于, 所述将 每个实体图像向量和对应的语义信息向量输入到语义空间解码器中, 得到所述目标图像的 描述, 具体包括: 将每个实体图像向量对应的语义信 息向量调整到 固定长度, 并将每个实体图像向量和 对应的调整到固定长度的语义信息向量输入到语义空间解码 器中, 得到所述目标图像的描 述。 5.根据权利要求3所述的基于额外语义空间的图像描述生成方法, 其特征在于, 所述获 取训练图像文本向量对, 具体包括: 使用Fast ‑RCNN算法对训练图像进行目标检测, 得到训练图像实体; 将所述训练图像实体输入到图像编码器中, 得到多个训练图像向量; 将与所述训练图像对应的训练文本输入到文本编码器中, 得到多个训练语义信息向 量; 利用相似度得分矩阵来匹配训练图像向量和训练语义信息向量得到所述训练图像文 本向量对。 6.一种基于额外语义空间的图像描述 生成系统, 其特 征在于, 包括: 目标图像划分模块, 用于按照实体对目标图像进行划分, 得到多个实体图像向量; 语义信息向量获取模块, 用于将每个实体图像向量输入到训练好的区域解码器中, 得 到对应的语义信息向量; 图像描述生成模块, 用于将每个实体图像向量和对应的语义信 息向量输入到语义空间 解码器中, 得到所述目标图像的描述。 7.根据权利要求6所述的基于额外语义空间的图像描述生成系统, 其特征在于, 所述目 标图像划分模块, 具体包括: 目标检测子模块, 用于使用Fast ‑RCNN算法对目标图像进行目标检测, 得到多个目标实 体;权 利 要 求 书 1/2 页 2 CN 115131798 A 2实体图像向量生成子模块, 用于将每个目标实体输入到 图像编码器中, 得到对应的实 体图像向量。 8.根据权利要求6所述的基于额外语义空间的图像描述生成系统, 其特征在于, 所述语 义信息向量获取模块包括: 区域解码器确定子模块; 所述区域解码器确定子模块具体包括 为: 训练图像文本向量对获取单元, 用于获取训练图像文本向量对; 所述训练图像文本向 量对包括: 多个训练图像向量和对应的训练语义信息向量; 区域解码器确定单元, 用于将所述训练图像文本向量对输入到区域解码器中, 根据交 叉熵损失函数和强化学习方法获得 所述训练好的区域 解码器。 9.根据权利要求6所述的基于额外语义空间的图像描述生成系统, 其特征在于, 所述图 像描述生成模块, 具体包括: 图像描述生成单元, 用于将每个实体图像向量对应的语义信息向量调整到固定长度, 并将每个实体图像向量和对应的调整到固定长度的语义信息 向量输入到语义空间解码器 中, 得到所述目标图像的描述。 10.根据权利要求8所述的基于额外语义空间的图像描述生成系统, 其特征在于, 所述 训练图像文本向量对获取 单元, 具体包括: 训练图像实体获取子单元, 用于使用Fast ‑RCNN算法对训练图像进行目标检测, 得到训 练图像实体; 训练图像向量获取子单元, 用于将所述训练图像实体输入到 图像编码器中, 得到多个 训练图像向量; 训练语义信 息向量获取子单元, 用于将与 所述训练图像对应的训练文本输入到文本编 码器中, 得到多个训练语义信息向量; 训练图像文本向量对获取子单元, 用于利用相似度得分矩阵来匹配训练图像向量和训 练语义信息向量得到所述训练图像文本向量对。权 利 要 求 书 2/2 页 3 CN 115131798 A 3

.PDF文档 专利 一种基于额外语义空间的图像描述生成方法及系统

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于额外语义空间的图像描述生成方法及系统 第 1 页 专利 一种基于额外语义空间的图像描述生成方法及系统 第 2 页 专利 一种基于额外语义空间的图像描述生成方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:08:45上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。