国家标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210682483.2 (22)申请日 2022.06.16 (71)申请人 大连理工大 学 地址 116024 辽宁省大连市甘井 子区凌工 路2号 (72)发明人 王语涵 林鸿飞 杨亮  (74)专利代理 机构 大连星河彩舟专利代理事务 所(普通合伙) 2126 3 专利代理师 陈玲玉 杨阳 (51)Int.Cl. G06K 9/62(2022.01) G06F 40/30(2020.01) G06V 10/40(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01)G06N 3/04(2006.01) (54)发明名称 一种对社交媒体多模态信息中讽刺情感识 别的方法 (57)摘要 本发明公开了一种对社交媒体多模态信息 中讽刺情感识别的方法, 充分利用文本、 图像和 图像属性三种模态来解决具有挑战性的多模态 讽刺检测任务。 首先提取图像特征和图像属性特 征, 接着利用图像属性特征与基于RoBERTa的文 本预训练网络连接提取文本特征, 从而将文本模 态、 图像模态和图像属性模态的特征重构并融合 为一个特征向量对讽刺情感进行预测。 本发明在 社交媒体的图文信息数据集上有超 过1%的准确 率提升和超过3%的F1值提升, 证明了多模态分 层融合模型的有效性和三种模态的实用性, 从而 充分发挥文本的上下文信息和不同模态间的相 互作用。 权利要求书2页 说明书4页 附图2页 CN 115169440 A 2022.10.11 CN 115169440 A 1.一种对社交媒体多模态信息中讽刺情感识别的方法, 其特 征在于, 包括 步骤如下: 步骤1, 获得数据元组包括文本和图像, 其中文本信息进行文本特征提取; 图像信息进 行图像特 征和图像属性特 征提取; 步骤2, 将步骤1中的文本特与图像属性特征融合, 进行重构文本 ‑图像属性向量; 重构 步骤1中的图像特 征向量; 重构步骤1中的图像属性特 征向量; 步骤3, 将步骤2中重构后的文本 ‑图像属性特征向量、 图像特征向量、 图像属性特征向 量融合; 步骤4, 将步骤3融合 三种模态的特 征向量进行分类 器分类。 2.根据权利要求1所述对社交媒体多模态信 息中讽刺情 感识别的方法, 其特征在于, 所 述步骤1中文本特征提取具体为: 首先通过RoBERTa预训练模型获取包含 上下文语义信息的 词向量, 然后利用长短时记忆网络LSTM提取上下文相关特征进行深度学习, 最后引入注意 力机制对提取出 的信息分配权重, 突出重点信息进行文本情感分析并进行特征提取, 得到 结果矩阵z; 文本的特 征向量vt由结果矩阵z中每 个向量的算数平均得到, 如公式(1)所示, 其中L代表文本长度。 3.根据权利要求1所述对社交媒体多模态信 息中讽刺情 感识别的方法, 其特征在于, 所 述步骤1中图像特征提取具体为: 以ResNet ‑50 V2网络为基础使用ResNet 50_innovation层 提取特征, 进而获得推文图像的区域原始向量vi, 图像的特征向量va是所有区域原始向量vi 的平均值, 见公式(2), 其中N表示每张图片区域个数。 4.根据权利要求1所述对社交媒体多模态信 息中讽刺情 感识别的方法, 其特征在于, 所 述步骤1中图像属性特征提取具体为: 为每张图像预测5个属性标签ai(i=1,2,3,4,5), 5个 属性标签构成一张图像 的属性原始向量v(ai), 将原始向量放入两层神经网络中获得注意 力权值αi, 最后将权值进行加权平均获得图片属性的特 征向量vatt, 见公式(3), 其中W1和W2是权重矩阵, b1和b2是偏差, Na是属性的数量 为5。 5.根据权利要求1所述对社交媒体多模态信 息中讽刺情 感识别的方法, 其特征在于, 所 述步骤2中, 将文本与图像属性特 征融合: 将图像属性特 征向量vatt作为Bi‑LSTM网络的初始状态, 如公式(4)所示; 其中 分别代表正向LSTM网络的隐层状态和细胞状态, 分别代表负向LSTM 网络的隐层状态和细胞状态, 分号代表向量串联, ReLu表示激活函数, W和b代表权重矩阵和 偏置系数; 经公式(4)的融合后, 将包含文本与图像属性信息的特征向量记作文本 ‑图像属向量权 利 要 求 书 1/2 页 2 CN 115169440 A 2vt'。 6.根据权利要求1所述对社交媒体多模态信 息中讽刺情 感识别的方法, 其特征在于, 所 述步骤2中, 重构三种模态下的特 征向量: 设 是模态m的第i个原始向量, 所述m为文本 ‑图像属性模态、 图像模态或图像属性模 态中的一种; 其中, 文本 ‑图像属性模态下的原始向量为在 LSTM层t时刻的隐藏状态ht、 图像 模态下的原 始向量为vi和图像属性模态下的原 始向量为v(ai); 利用双层神经网络学习计算每个 的权重参数, 利用权重参数对 各模态m的原始向量 加权平均, 得到模态m下的重构特 征向量vm。 7.根据权利要求1所述对社交媒体多模态信 息中讽刺情 感识别的方法, 其特征在于, 所 述步骤3中, 使用双层前馈神经网络计算步骤2得到的不同模态下重构向量的权值分配, 最 终得到一个恒长的融合向量vf。 8.根据权利要求1所述对社交媒体多模态信 息中讽刺情 感识别的方法, 其特征在于, 所 述步骤4中, 将步骤3得到的融合向量输入由两层 全连接神经网络构成的分类器进 行讽刺情 感的判断。权 利 要 求 书 2/2 页 3 CN 115169440 A 3

.PDF文档 专利 一种对社交媒体多模态信息中讽刺情感识别的方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种对社交媒体多模态信息中讽刺情感识别的方法 第 1 页 专利 一种对社交媒体多模态信息中讽刺情感识别的方法 第 2 页 专利 一种对社交媒体多模态信息中讽刺情感识别的方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:08:52上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。