国家标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210756204.2 (22)申请日 2022.06.29 (71)申请人 中国人民解 放军火箭军工程大 学 地址 710025 陕西省西安市灞桥区同心路2 号 (72)发明人 朱晨豪 叶霞 陆琪多 杨章平 罗承天 徐翰涛 (74)专利代理 机构 北京高沃 律师事务所 1 1569 专利代理师 杜阳阳 (51)Int.Cl. G06V 30/262(2022.01) G06V 10/82(2022.01) G06N 3/08(2006.01) G06N 3/04(2006.01) G06F 40/30(2020.01) (54)发明名称 一种基于额外语义空间的图像描述生成方 法及系统 (57)摘要 本发明公开了一种基于额外语义空间的图 像描述生 成方法及系统, 涉及图像描述生成技术 领域, 方法包括: 按照实体对目标图像进行划分, 得到多个实体图像向量; 将每个实体图像向量输 入到训练好的区域解码器中, 得到对应的语义信 息向量; 将每个实体图像向量和对应的语义信息 向量输入到语义空间解码器中, 得到目标图像的 描述。 和传统的图像描述生成方法相比, 本发明 根据待测试的图像获取多个待测试的图像向量 和多个相应的语义信息向量, 从而得到描述, 提 高了生成描述的准确性。 权利要求书2页 说明书5页 附图2页 CN 115131798 A 2022.09.30 CN 115131798 A 1.一种基于额外语义空间的图像描述 生成方法, 其特 征在于, 所述方法包括: 按照实体对目标图像进行划分, 得到多个实体图像向量; 将每个实体图像向量输入到训练好的区域 解码器中, 得到对应的语义信息向量; 将每个实体图像向量和对应的语义信 息向量输入到语义空间解码器中, 得到所述目标 图像的描述。 2.根据权利要求1所述的基于额外语义空间的图像描述生成方法, 其特征在于, 所述按 照实体对目标图像进行划分, 得到多个实体图像向量, 具体包括: 使用Fast ‑RCNN算法对目标图像进行目标检测, 得到多个目标实体; 将每个目标实体输入到图像编码器中, 得到对应的实体图像向量。 3.根据权利要求1所述的基于额外语义空间的图像描述生成方法, 其特征在于, 所述训 练后的区域 解码器的确定方法为: 获取训练图像文本向量对; 所述训练图像文本向量对包括: 多个训练图像向量和对应 的训练语义信息向量; 将所述训练图像文本向量对输入到区域解码器中, 根据交叉熵损失函数和强化学习方 法获得所述训练好的区域 解码器。 4.根据权利要求1所述的基于额外语义空间的图像描述生成方法, 其特征在于, 所述将 每个实体图像向量和对应的语义信息向量输入到语义空间解码器中, 得到所述目标图像的 描述, 具体包括: 将每个实体图像向量对应的语义信 息向量调整到 固定长度, 并将每个实体图像向量和 对应的调整到固定长度的语义信息向量输入到语义空间解码 器中, 得到所述目标图像的描 述。 5.根据权利要求3所述的基于额外语义空间的图像描述生成方法, 其特征在于, 所述获 取训练图像文本向量对, 具体包括: 使用Fast ‑RCNN算法对训练图像进行目标检测, 得到训练图像实体; 将所述训练图像实体输入到图像编码器中, 得到多个训练图像向量; 将与所述训练图像对应的训练文本输入到文本编码器中, 得到多个训练语义信息向 量; 利用相似度得分矩阵来匹配训练图像向量和训练语义信息向量得到所述训练图像文 本向量对。 6.一种基于额外语义空间的图像描述 生成系统, 其特 征在于, 包括: 目标图像划分模块, 用于按照实体对目标图像进行划分, 得到多个实体图像向量; 语义信息向量获取模块, 用于将每个实体图像向量输入到训练好的区域解码器中, 得 到对应的语义信息向量; 图像描述生成模块, 用于将每个实体图像向量和对应的语义信 息向量输入到语义空间 解码器中, 得到所述目标图像的描述。 7.根据权利要求6所述的基于额外语义空间的图像描述生成系统, 其特征在于, 所述目 标图像划分模块, 具体包括: 目标检测子模块, 用于使用Fast ‑RCNN算法对目标图像进行目标检测, 得到多个目标实 体;权 利 要 求 书 1/2 页 2 CN 115131798 A 2实体图像向量生成子模块, 用于将每个目标实体输入到 图像编码器中, 得到对应的实 体图像向量。 8.根据权利要求6所述的基于额外语义空间的图像描述生成系统, 其特征在于, 所述语 义信息向量获取模块包括: 区域解码器确定子模块; 所述区域解码器确定子模块具体包括 为: 训练图像文本向量对获取单元, 用于获取训练图像文本向量对; 所述训练图像文本向 量对包括: 多个训练图像向量和对应的训练语义信息向量; 区域解码器确定单元, 用于将所述训练图像文本向量对输入到区域解码器中, 根据交 叉熵损失函数和强化学习方法获得 所述训练好的区域 解码器。 9.根据权利要求6所述的基于额外语义空间的图像描述生成系统, 其特征在于, 所述图 像描述生成模块, 具体包括: 图像描述生成单元, 用于将每个实体图像向量对应的语义信息向量调整到固定长度, 并将每个实体图像向量和对应的调整到固定长度的语义信息 向量输入到语义空间解码器 中, 得到所述目标图像的描述。 10.根据权利要求8所述的基于额外语义空间的图像描述生成系统, 其特征在于, 所述 训练图像文本向量对获取 单元, 具体包括: 训练图像实体获取子单元, 用于使用Fast ‑RCNN算法对训练图像进行目标检测, 得到训 练图像实体; 训练图像向量获取子单元, 用于将所述训练图像实体输入到 图像编码器中, 得到多个 训练图像向量; 训练语义信 息向量获取子单元, 用于将与 所述训练图像对应的训练文本输入到文本编 码器中, 得到多个训练语义信息向量; 训练图像文本向量对获取子单元, 用于利用相似度得分矩阵来匹配训练图像向量和训 练语义信息向量得到所述训练图像文本向量对。权 利 要 求 书 2/2 页 3 CN 115131798 A 3
专利 一种基于额外语义空间的图像描述生成方法及系统
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:08:45
上传分享
举报
下载
原文档
(525.1 KB)
分享
友情链接
德勤数字化转型新篇章.pdf
数说安全 2022年数据安全市场报告.pdf
DB34-T 3433.2-2019 计量检测数据信息 第 2 部分:采集规范 安徽省.pdf
DB43-T 2091-2021 烤烟与半夏套种技术规程 湖南省.pdf
GB-T 41774-2022 法庭科学 爆炸装置鉴定规程.pdf
JR-T0072-2020 金融行业网络安全等级保护测评指南.pdf
数据安全合规评估方法-1.19发布.pdf
GB-T 40147-2021 科技评估通则.pdf
DB43-T 2574-2023 林业信息化系统运维和服务规范 湖南省.pdf
DB2数据库安全配置基线.doc
ISO IEC 27040-2015.pdf
数据安全能力建设实施指南 V1.0(征求意见稿).pdf
GB-T 17747.2-2011 天然气压缩因子的计算 第2部分:用摩尔组成进行计算.pdf
T-CITS 0004—2023 高性能医用冷藏箱技术要求及检测方法.pdf
GB-T 8630-2013 纺织品 洗涤和干燥后尺寸变化的测定.pdf
T-CSAE 269—2022 智能网联汽车 自动驾驶地图动态信息数据交换格式.pdf
GB-T 17000-2009 全息防伪产品通用技术条件.pdf
GB-T 5156-2022 镁及镁合金热挤压型材.pdf
YD T 3801-2020 电信网和互联网数据安全风险评估实施方法.pdf
LY-T 3104-2019 沟眶象和臭椿沟眶象防治技术规程.pdf
1
/
3
10
评价文档
赞助2.5元 点击下载(525.1 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。