(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210815895.9
(22)申请日 2022.07.12
(71)申请人 重庆邮电大 学
地址 400000 重庆市南岸区南 山街道崇文
路2号
(72)发明人 夏书银 陈涛 戴大伟 王国胤
(74)专利代理 机构 成都行之专利代理事务所
(普通合伙) 51220
专利代理师 喻英
(51)Int.Cl.
G06F 40/30(2020.01)
G06F 40/289(2020.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于细粒度的文本情感抽取方法及相
关产品
(57)摘要
本发明公开了一种基于细粒度的文本情感
抽取方法及相关产品, 涉及自然语 言处理技术领
域, 包括以下步骤: 基于字粒度对输入文本进行
语义特征提取并获得第一语义向量, 基于词粒度
对输入文本进行语义特征提取并获得第二语义
向量; 将第一语义向量与第二语义向量采用拼接
的方式进行叠加, 获得深层次语义表征; 利用降
维线性层和非线性函数对深层次语义表征进行
特征提取, 获的方面特征和观点特征; 构建双向
二维矩阵, 对 方面特征和观点特征进行情感依赖
解析, 获得字级别的情感依赖信息; 将字级别的
情感依赖信息与方面特征及观 点特征结合, 得到
跨度级别的情感依赖信息。 本发 明能深度挖掘出
文本的深层次语义信息, 同时有效解决元素重叠
的问题。
权利要求书3页 说明书8页 附图4页
CN 115204180 A
2022.10.18
CN 115204180 A
1.一种基于细粒度的文本情感抽取 方法, 其特 征在于, 包括以下步骤:
基于字粒度对输入文本进行语义特征提取并获得第 一语义向量, 基于词粒度对输入文
本进行语义特 征提取并获得第二语义向量;
将所述第一语义向量与第二语义向量采用拼接的方式进行叠加, 获得深层次语义表
征;
利用降维线性层和非线性函数对所述深层次语义表征进行特征提取, 获的方面特征和
观点特征;
构建双向二维矩阵, 对所述方面特征和观点特征进行情感依赖解析, 获得字级别的情
感依赖信息;
将所述字级别的情 感依赖信 息与所述方面特征及所述观点特征结合, 得到跨度级别的
情感依赖信息 。
2.根据权利要求1所述的一种基于细粒度的文本情感抽取方法, 其特征在于,在基于字
粒度对输入文本进行语义特 征提取并获得第一语义向量中, 包括:
对所述输入文本进行预处理, 将所述输入文本中的每个字都作为模型的输入, 映射为
高维的字向量;
利用BILSTM网络对所述字向量进行 特征提取, 得到所述第一语义向量。
3.根据权利要求1所述的一种基于细粒度的文本情感抽取方法, 其特征在于,在基于词
粒度对输入文本进行语义特 征提取并获得第二语义向量中, 包括:
对所述输入文本进行预处理, 将整个输入文本用jieba分词工具进行分词, 得到整个输
入文本的所有分词集 合;
利用Word2Vec算法将所述所有分词集 合映射至高维向量空间, 获得高维的词向量;
将所述词向量输入至卷积神经网络的输入层, 利用卷积神经网络的卷积层用多个滤波
器进行特征提取, 接着在卷积神经网络的池化层对提取 的特征在宽度上进行最大池化, 然
后通过全连接层对其特 征进行连接, 最后得到包 含整体的第二语义向量。
4.根据权利要求1所述的一种基于细粒度的文本情感抽取方法, 其特征在于, 在利用降
维线性层和非线性 函数对所述深层次语义表征进行 特征提取中, 特 征提取的计算公式为:
其中,
和
是方面特征和观点特征的表示,
与
为模型的
权重,
与
为模型的偏置项, f( ·)表示非线性 函数。
5.根据权利要求1所述的一种基于细粒度的文本情感抽取方法, 其特征在于, 在构建双
向二维矩阵, 对所述方面特 征和观点特 征进行情感依赖解析中, 包括:
将所述输入文本 中的所有字进行配对, 形成基于方面推导观点的二维矩阵, 其中, 该二
维矩阵的横轴代表观点, 竖轴代表方面, 当该二 维矩阵解析到观点特征 ‑方面特征对之 间的
情感依赖时, 在一个观点的最后一个特征词坐标和一个方面的最后一个特征词坐标上填充
对应的情况极性;
将所述输入文本 中的所有字进行配对, 形成基于观点推导方面的二维矩阵, 其中, 该二权 利 要 求 书 1/3 页
2
CN 115204180 A
2维矩阵的横轴代表方面, 竖轴代表观 点, 当该二 维矩阵解析到方面特征 ‑观点特征对之 间的
情感依赖时, 在一个方面的最后一个特征词坐标和一个观点的最后一个特征词的坐标上填
充对应的情况极性。
6.根据权利要求5所述的一种基于细粒度的文本情感抽取方法, 其特征在于, 进行二维
矩阵解析的公式为:
其中,
代表观点推导方面方 向上方面特征 ‑观点特征对(wi,wj)的第k个依赖类型
的分数,
代表观点推导方面方向上方面特征 ‑观点特征对(wi,wj)分数的概率,
代表方面推导观点方向上观点特征 ‑方面特征对(wi,wj)的第k个依赖类型的分数,
代
表方面推导观点方向上观点特征 ‑方面特征对(wi,wj)分数的概率,wk和bk是产生第k个分数
的权重和偏差 。
7.根据权利要求5所述的一种基于细粒度的文本情感抽取方法, 其特征在于,在获得最
终预测结果后, 还 包括:
对所述跨度级别的情感依赖信息进行解析, 获得文本情感解析 结果集合;
基于文本情感解析结果, 结合类平衡交叉熵损 失函数来训练网络, 通过梯度下降算法
和反向传播 算法, 不断优化损失函数。
8.根据权利要求7所述的一种基于细粒度的文本情感抽取方法, 其特征在于,在获得文
本情感解析 结果集合中:
若方面推导观点的二维矩阵中得到的解析结果无法在观点推导方面的二维矩阵中求
得, 则将此 结果添加至所述文本情感解析 结果集合中;
若观点推导方面的二维矩阵中得到的解析结果无法在方面推导观点的二维矩阵中求
得, 则将此 结果添加至所述文本情感解析 结果集合中;
若在方面推导观点的二维矩阵和观点推导方面的二维矩阵中, 针对于同一个方面和观
点对预测出不同的情感依赖, 则通过两个矩阵模型预测出 的最大感情依赖概率进行判断,
将有最大情感依赖概 率的结果添加至所述 最终预测结果的集 合。
9.一种基于细粒度的文本情感抽取 方法的系统, 其特 征在于, 包括:
语义向量提取层, 用于基于字粒度对输入文本进行语义特征提取并获得第一语义向
量, 基于词粒度对输入文本进行语义特 征提取并获得第二语义向量;
全连接层, 用于将所述第一语义向量与第二语义向量采用拼接的方式进行叠加, 获得
深层次语义表征;
方面‑观点提取层, 用于利用降维线性层和非线性函数对所述深层次语义表征进行特
征提取, 获的方面特 征和观点特 征;
双向二维矩阵层, 用于对所述方面特征和观点特征进行情感依赖解析, 获得字级别的权 利 要 求 书 2/3 页
3
CN 115204180 A
3
专利 一种基于细粒度的文本情感抽取方法及相关产品
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:08:25上传分享