(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210645924.1
(22)申请日 2022.06.09
(71)申请人 有米科技股份有限公司
地址 510006 广东省广州市番禺区小谷围
街青蓝街26号1701
(72)发明人 陈莹莹 黄于晏
(74)专利代理 机构 广州三环 专利商标代理有限
公司 44202
专利代理师 江银会
(51)Int.Cl.
G06F 40/30(2020.01)
G06F 40/216(2020.01)
G06F 16/35(2019.01)
(54)发明名称
一种文本情感分析方法及装置
(57)摘要
本发明公开了一种文本情感分析方法及装
置, 包括: 确定待分析文本对应的文本信息; 将文
本信息输入至文本情感分析模型, 以触发文本情
感分析模型对文本信息进行处理并输出多个情
感分析结果和每个情感分析结果对应的概率信
息; 从所有情感分析结果中确定对应的概率信息
满足预先设定筛选条件的目标情感分析结果, 作
为待分析文本对应的情感分析结果; 其中, 文本
情感分析模型是基于每个子文本标识对应的文
本向量以及每个子文本标识对应的位置向量确
定出所有情感分析结果。 可见, 实施本发明能够
利用文本情感分析模型根据待分析文本的文本
向量以及位置向量确定待分析文本的情感分析
结果, 有利于准确分析文本整体语义, 从而提高
文本情感分析的准确性。
权利要求书3页 说明书17页 附图3页
CN 115081456 A
2022.09.20
CN 115081456 A
1.一种文本情感分析 方法, 其特 征在于, 所述方法包括:
确定待分析文本对应的文本信 息, 所述文本信 息包括至少一个子文本标识以及每个所
述子文本标识对应的文本内容;
将所述文本信 息输入至预先训练好的文本情感分析模型, 以触发所述文本情感分析模
型对所述文本信息进行处理并输出多个情感分析结果以及每个所述情感分析结果所对应
的概率信息;
根据每个所述情感分析结果对应的概率信 息, 从所有所述情 感分析结果中确定对应的
概率信息满足预先设定筛选条件的目标情感分析结果, 作为所述待分析文本对应的情感分
析结果;
其中, 所述文本情 感分析模型是基于每个所述子文本标识对应的文本向量以及每个所
述子文本标识对应的位置向量确定出 所有所述情感分析 结果。
2.根据权利要求1所述的文本情感分析方法, 其特征在于, 所述文本情感分析模型对所
述文本信息进行处 理, 包括:
由所述文本情感分析模型对应的编码结构对所述文本信息执行编码操作得到每个所
述子文本标识对应的编 码结果; 每个所述子文本标识对应的编 码结果包括每个所述子文本
标识对应的文本向量以及每 个所述子文本标识对应的位置向量;
由所述文本情感分析模型的向量处理结构对每个所述子文本标识对应的编码结果进
行向量转换处理, 得到每 个所述子文本标识对应的目标矩阵;
由所述文本情感分析模型的平均池化结构对所述子文本标识对应的目标矩阵执行平
均池化操作, 得到每 个所述子文本标识对应的平均池化结果;
由所述文本情感分析模型的拼接结构对所有所述子文本标识对应的平均池化结果执
行拼接操作得到拼接结果;
由所述文本情感分析模型的全连接层对所述 拼接结果进行处 理。
3.根据权利要求2所述的文本情感分析方法, 其特征在于, 所述文本情感分析模型的向
量处理结构对每个所述子文本标识对应的编码结果进 行向量转换 处理, 得到每个所述子文
本标识对应的目标矩阵, 包括:
当所述文本情感分析模型只包括一个向量处理结构时, 由所述向量处理结构对每个所
述文本标识对应的编码结果进行向量转换处理, 得到每个所述子文本标识对应的目标矩
阵;
当所述文本情感分析模型包括多个文本处理结构时, 对于每个所述子文本标识, 由该
子文本标识相匹配的向量处理结构对该子文本标识对应的编码结果进 行向量转换 处理, 得
到该子文本标识对应的目标矩阵。
4.根据权利要求1 ‑3中任一项所述的文本情感分析方法, 其特征在于, 所述确定待分析
文本对应的文本信息, 包括:
根据预先设定的至少一个子文本标识, 提取待分析文本中每个所述子文本标识对应的
文本要素, 作为该子文本标识对应的文本内容;
以及, 在所述将所述文本信息输入至预先训练好的文本情感分析模型, 以触发所述文
本情感分析模型对所述文本信息进行处理并输出多个情感分析结果以及每个所述情感分
析结果所对应的概 率信息之前, 所述方法还 包括:权 利 要 求 书 1/3 页
2
CN 115081456 A
2对所述文本信息进行 预处理操作;
其中, 所述对所述文本信息进行 预处理操作, 包括:
针对每个所述子文本标识对应的文本内容, 检测该文本 内容中是否存在满足预设清除
条件的待 去除文本要素, 当检测结果 为是时, 去除该文本内容中的所述待 去除文本要素。
5.根据权利要求4所述的文本情感分析方法, 其特征在于, 所述针对每个所述子文本标
识对应的文本内容, 检测该文本内容中是否存在满足预设清除条件的待去除文本要素, 包
括:
针对每个所述子文本标识对应的文本内容, 检测该文本 内容中是否存在要素类型与 预
先设定的第一要 素类型相匹配的第一文本要 素, 当检测出该文本内容中存在所述第一文本
要素时, 确定该文本内容中存在 满足预设清除条件的待去除文本要 素, 其中, 所述待去除文
本要素包括所述第一文本要素; 和/或,
针对每个所述子文本标识对应的文本内容, 检测该文本 内容中是否存在相邻且要素类
型相同以及所述要素类型与预先设定的第二要 素类型相匹配的第二文本要 素, 当检测出该
文本内容中存在所述第二文本要 素时, 确定该文本内容中存在 满足预设清除条件的待去除
文本要素, 其中, 所述待 去除文本要素包括部分所述第二文本要素;
以及, 在所述去除该文本内容中的所述待 去除文本要素之前, 所述方法还 包括:
判断该文本内容中的所述待去除文本要素对该文本内容的情感的影响程度是否大于
预设程度, 当判断结果为否时, 触发执行所述的去除该文本内容中的所述待去除文本要素
的操作。
6.根据权利要求1 ‑3中任一项所述的文本情感分析方法, 其特征在于, 在所述确定待分
析文本对应的文本信息之前, 所述方法还 包括:
当待分析情 感的原始文本 中包括至少两个文本结构时, 确定每个所述文本结构的情感
信息, 其中, 每个所述文本结构的情感信息包括该文本结构对应的情感主体和/或该文本结
构对应的情感客体;
根据每个所述文本结构的情感信息, 从所述原 始文本中确定 至少一个待分析文本;
其中, 所述根据每个所述文本结构的情感信息, 从所述原始文本中确定至少一个待分
析文本, 包括:
当所有所述文本结构的情感信息均匹配时, 将所述原 始文本确定为待分析文本;
当所有所述文本结构的情感信息不均匹配时, 根据每个所述文本结构的情感信息, 对
所有所述文本结构进 行分类, 得到至少两个待分析文本, 其中, 若某一所述待分析文本包括
至少两个所述文本结构, 则该待分析文本中的所有所述文本结构的情感信息均匹配。
7.根据权利要求6所述的文本情感分析方法, 其特征在于, 所述确定每个所述文本结构
的情感信息, 包括:
确定每个所述文本结构对应的至少一个情感实体, 以及确定每个所述文本结构中满足
预设确认条件的确认关键词;
针对每个所述文本结构, 根据 该文本结构中每个所述情感实体在该文本结构中的位置
顺序以及所述确认关键词在该文本结构中的位置顺序, 确定该文本结构中每个所述情感实
体的实体属性, 作为该文本结构的情感信息;
其中, 所述确定每 个所述文本结构中满足预设确认条件的确认关键词, 包括:权 利 要 求 书 2/3 页
3
CN 115081456 A
3
专利 一种文本情感分析方法及装置
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:09:13上传分享