国家标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210678060.3 (22)申请日 2022.06.15 (71)申请人 茅台学院 地址 564507 贵州省遵义市南部新城 (72)发明人 刘赟 田鹏 李浪 沈仕巡 周克 冯华仲 (74)专利代理 机构 贵阳中新专利商标事务所 52100 专利代理师 胡绪东 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/35(2019.01) G06F 40/117(2020.01) G06F 40/126(2020.01) G06F 40/30(2020.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于语义空间映射的零样本图片问答 方法 (57)摘要 本发明公开了一种基于语义空间映射的零 样本图片问答方法, 该方法为: 首先, 将图片信息 提取为图片区域特征; 将问题语句中的名词提取 出来, 利用预先训练的词嵌入表征名词特征; 设 计一个名词指导的注意力网络; 其次, 利用词嵌 入编码问题特征, 并通过语义对齐后的跨模态信 息增强问题特征, 生成问题相关的多模态表示; 设计一个问题指导的注意力网络; 最后, 建立答 案共享的语义空间, 在该空间中进行语义匹配、 语义距离控制以及语义聚类; 问题 ‑图片对的联 合嵌入特征被映射到语义空间中并聚集在对应 的答案周围; 通过在语义空间中寻找 最佳匹配以 进行答案推导。 本发明建模图片和问题之间的特 征关联和实现未标记答案的预测, 提高零样本图 片问答的准确性。 权利要求书2页 说明书5页 附图1页 CN 115017287 A 2022.09.06 CN 115017287 A 1.一种基于语义空间映射的零样本图片问答方法, 其特 征在于: 该 方法包括以下步骤: A、 跨模态语义对齐: 对于图片信息, 利用深度卷积神经网络将其提取为图片区域特征; 对于问题语句, 利用 词性标注工具提取名词性单词, 采用预先训练的词嵌入将名词编码为 对应的名词 特征向量; 设计一个名词指导的注意力网络, 用于探索名词表示的语义信息所 对应的图片区域, 实现跨模态的语义对齐; B、 多模态特征关联学习: 利用词嵌入编码问题句中的单词, 将其与语义对其后的跨模 态信息进行特征融合, 实现问题句的特征增强, 采用循环神经网络建模问题的单词序列特 征, 生成问题相关的多模态表 示; 设计一个问题指导的注意力网络, 用于进行问题相关的多 模态特征和图片信息之间的特 征关联学习, 生成多模态联合嵌入; C、 语义空间映射: 建立一个标记和未标记答案共享的语义空间, 在该空间中进行语义 匹配、 语义距离控制以及语义聚类, 多模态联合嵌入被映射到语义空间中并聚集在对应的 答案嵌入周围; 通过在语义空间中寻找最佳匹配以进 行答案推导, 实现未标记的答案预测, 即零样本图片问答。 2.根据权利要求1所述的一种基于语义空间 映射的零样本图片问答方法, 其特征在于: 步骤A中图片区域特征提取采用的深度卷积神经网络是残差神经网络; 问题语句中的名词 性单词是通过Stanford Pos Tagger工具进行解析而获取的; 名词特征向量通过GloVe词嵌 入进行编码。 3.根据权利要求1所述的一种基于语义空间 映射的零样本图片问答方法, 其特征在于: 步骤A中名词指导的注意力网络是探索名词对应的图片区域, 计算每个图片区域相对于名 词的关联权值; 对于 问题句中的任意一个非名词性单词, 每个图片区域对该单词都具有相 同的关联权值。 4.根据权利要求1所述的一种基于语义空间 映射的零样本图片问答方法, 其特征在于: 步骤B中问题句特征增强是在单词特征增强的基础上实现的; 将单词特征与对应的视觉注 意力计算后的视觉特征按 元素相乘进 行融合, 然后再利用循环神经网络建模问题的单词 序 列, 生成问题相关的多模态 表示。 5.根据权利要求3所述的一种基于语义空间 映射的零样本图片问答方法, 其特征在于: 步骤B中问题指导的注意力网络是将问题相关的多模态表示和图片区域特征映射到同一高 维空间中, 计算两者之间细粒度 的特征关联关系, 并进行特征融合生成问题 ‑图片联合嵌 入。 6.根据权利要求1所述的一种基于语义空间 映射的零样本图片问答方法, 其特征在于: 步骤C中语义空间是一个标记和未标记的答案共享的高维空间, 在该空间中问题的答案以 特征向量的形式存在, 且表达意思相近的两个答案在语义空间中的位置比意思不同的两个 答案之间的位置更近 。 7.根据权利要求6所述的一种基于语义空间 映射的零样本图片问答方法, 其特征在于: 步骤C中语义匹配是指图片 ‑问题的联合嵌入映射到语义空间后, 联合嵌入与正确答案嵌入 之间的匹配度(两个嵌入向量之间的向量相似度)高于它与不 正确答案嵌入之间的匹配度。 8.根据权利要求7所述的一种基于语义空间 映射的零样本图片问答方法, 其特征在于: 步骤C中语义聚类是指具有相同答案的问题 ‑图片对的联合嵌入映射到语义空间后, 联合嵌 入聚集在对应的正确 答案嵌入周围, 而具有不同答案的问题 ‑图片对的联合嵌入映射到语权 利 要 求 书 1/2 页 2 CN 115017287 A 2义空间后分别聚集在各自对应的答案嵌入周围, 即语义空间具有明显的聚类结构。权 利 要 求 书 2/2 页 3 CN 115017287 A 3
专利 一种基于语义空间映射的零样本图片问答方法
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:08:36
上传分享
举报
下载
原文档
(451.0 KB)
分享
友情链接
GB-T 28799.2-2020 冷热水用耐热聚乙烯(PE-RT)管道系统 第2部分:管材.pdf
GB-T 24582-2023 多晶硅表面金属杂质含量测定 酸浸取-电感耦合等离子体质谱法.pdf
GB-T 29828-2013 信息安全技术 可信计算规范 可信连接架构.pdf
GB-T 15843.4-2024 信息技术 安全技术 实体鉴别 第4部分:采用密码校验函数的机制.pdf
T-GDNS 001—2020 广东省网络安全等级保护专家库管理规范.pdf
GB-T 18305-2016 质量管理体系 汽车生产件及相关服务件组织应用GB-T 19001—2008的特别要求.pdf
T-ISEAA 001-2020 网络安全等级保护测评高风险判定指引.pdf
DB34-T 3897-2021 安徽科技大市场运营服务规范 安徽省.pdf
T-GDPIA 12—2020 数字化工厂 改性塑料制造 数据字典.pdf
GB-T 21678-2018 渔业污染事故经济损失计算方法.pdf
GM-T 0062-2018 密码产品随机数检测要求.pdf
奇安信 自动化渗透测试系统-主打PPT.pptx
GB-T 35281-2017 信息安全技术 移动互联网应用服务器安全技术要求.pdf
GB-T 39853.1-2021 供电系统中的电能质量测量 第1部分:电能质量监测设备(PQI).pdf
GB-T 33834-2017 微束分析 扫描电子显微术 生物试样扫描电子显微镜分析方法.pdf
DB32-T 4144-2021 公共信用信息平台运行维护管理规范 江苏省.pdf
DB6501-T 053-2023 智慧水务信息应用系统 乌鲁木齐市.pdf
GB-T 36993-2018 环槽铆钉连接副 技术条件.pdf
GB-T 31845-2015 电工电子设备机械结构 热设计规范.pdf
ISO27001-2013 安言咨询.pdf
1
/
3
9
评价文档
赞助2.5元 点击下载(451.0 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。