国家标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210674237.2 (22)申请日 2022.06.15 (71)申请人 有米科技股份有限公司 地址 510006 广东省广州市番禺区小谷围 街青蓝街26号1701 (72)发明人 陈莹莹 黄于晏  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 江银会 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/126(2020.01) (54)发明名称 一种文本情感分析模型的构建方法及装置 (57)摘要 本发明公开了一种文本情感分析模型的构 建方法及装置, 包括: 在若干个初始样本文本中 插入内含用于指代未知情感的目标字符的模板 文本, 得到目标样本文本; 将每个目标样本文本 输入情感分析模 型, 得到每个目标样本文本对应 的情感分析结果; 根据所有目标样 本文本对应的 情感分析结果和所有初始样本文本对应的情感 标注结果, 判断情感分析模型是否满足收敛条 件; 若否, 修正模型参数, 并重新执行上述的将每 个目标样本文本输入情感分析模型并判断情感 分析模型是否满足收敛条件的操作, 直至得到满 足收敛条件的目标情感分析模型。 可见, 实施本 发明能够采用模板学习的训练方法训练情感分 析模型, 提高了情感分析模型的训练效果, 进而 提高文本情感分析的准确性。 权利要求书3页 说明书18页 附图4页 CN 115081458 A 2022.09.20 CN 115081458 A 1.一种文本情感分析模型的构建方法, 其特 征在于, 所述方法包括: 确定带有标注信息的若干个初始样本文本; 在每个所述初始样本文本的预设位置插入该初始样本文本匹配的模板文本, 得到若干 个用于模型训练的目标样本文本, 其中, 所述模板文本包括用于指代未知情感的目标字符; 将每个所述目标样本文本输入待训练 的情感分析模型中, 以使所述情感分析模型对每 个所述目标样本文本的文本内容进行分析, 得到每个所述目标样本文本对应的情感分析结 果, 每个所述目标样本文本对应的情感分析结果包括该目标样本文本中的目标字符的预测 结果, 所述预测结果 为相应目标样本文本的情感预测结果; 根据所有所述目标样本文本对应的情感分析结果和所有所述初始样本文本对应的情 感标注结果, 判断所述情感分析模型 是否满足收敛 条件; 当判断结果为否时, 修正所述情感分析模型的模型参数, 并重新执行所述的将每个所 述目标样本文本输入待训练的情感分析模型中, 以使 所述情感分析模型对每个所述目标样 本文本的文本内容进 行分析, 得到每个所述目标样本文本对应的情感分析结果的操作以及 执行所述根据所有所述目标样本文本对应的情感分析结果和所有所述初始样本文本对应 的情感标注结果, 判断所述情感分析模型是否满足收敛条件的操作, 直至得到满足所述收 敛条件的目标情感分析模型, 所述目标情感分析模型用于分析待分析文本的文本情感。 2.根据权利要求1所述的文本情感分析模型的构建方法, 其特征在于, 所述根据 所有所 述目标样本文本对应的情感分析结果和所有 所述初始样本文本对应的情感标注结果, 判断 所述情感分析模型 是否满足收敛 条件, 包括: 对于每个所述目标样本文本, 确定该目标样本文本对应的情 感分析结果与相应的初始 样本文本对应的情感标注结果之间的匹配度, 作为该目标样本文本对应的匹配度; 根据所有所述目标样本文本对应的匹配度, 计算所述情感分析模型的分析准确率; 判断所述分析准确率是否大于等于预设的准确率阈值; 当判断结果为是时, 确定所述情 感分析模型满足收敛条件, 当判断结果为否时, 确定所 述情感分析模型不满足收敛 条件。 3.根据权利要求2所述的文本情感分析模型的构建方法, 其特征在于, 每个所述目标样 本文本的情感预测结果包括一个或多个子预测结果以及每个所述子预测结果对应的概率 信息; 以及, 所述对于每个所述目标样本文本, 确定该目标样本文本对应的情感分析结果与 相应的初始样本文本对应的情感标注结果之间的匹配度, 包括: 对于每个所述目标样本文本, 将该目标样本文本的情 感预测结果中对应的概率信 息满 足预设概 率条件的子预测结果确定为该目标样本文本的目标情感预测结果; 对于每个所述目标样本文本, 确定该目标样本文本的目标情 感预测结果与其相应的初 始样本文本对应的情感标注结果之间的匹配度, 作为该目标样本文本对应的匹配度。 4.根据权利要求1 ‑3中任一项所述的文本情感分析模型的构建方法, 其特征在于, 所述 情感分析模型对每个所述目标样本文本的文本内容进 行分析, 得到每个所述目标样本文本 对应的情感分析 结果, 包括: 由所述情感分析模型对应的编码结构对每个所述目标样本文本执行编码操作, 得到每 个所述目标样本文本对应的编 码结果, 每个所述目标样本文本对应的编码结果包括该目标权 利 要 求 书 1/3 页 2 CN 115081458 A 2样本文本对应的文本向量、 该目标样本文本对应的位置向量以及该目标样本文本对应的句 子向量; 由所述情感分析模型对应的向量处理结构对每个所述目标样本文本对应的编码结果 进行分析, 得到该目标样本文本对应的情感分析 结果; 其中, 所述情感分析模型对应的编码结构对每个所述目标样本文本执行编码操作, 得 到每个所述目标样本文本对应的编码结果, 包括: 由所述情感分析模型对应的编码结构根据每个所述目标样本文本中每个文本要素所 对应的映射编 码信息, 生成该目标样本文本对应的文本向量; 或者, 由所述情感分析模型对 应的编码结构根据每个所述目标样本文本的初始样本文本中每个文本要素对应的映射编 码信息以及该目标样本文本的模板文本中除所述目标字符之外的每个文本要素对应的语 义信息, 生成该目标样本文本对应的文本向量, 其中, 所述模板文本中每个所述文本要素对 应的语义信息包括该文本要素在该文本要素对应的一个或多个词性维度中对应的子语义 信息; 由所述编码结构根据每个所述目标样本文本中每个文本要素在该目标样本文本中对 应的位置信息生成该目标样本文本对应的位置向量以及该目标样本文本对应的句子向量, 其中, 每个所述目标样本文本对应的句子向量用于表示该目标样本文本中每个文本要 素在 该目标样本文本中所属的句子 。 5.根据权利要求1 ‑3中任一项所述的文本情感分析模型的构建方法, 其特征在于, 所述 确定带有标注信息的若干个初始样本文本, 包括: 获取若干个用于模型训练的初始文本; 针对每个所述初始文本, 根据预设的至少一个标注标识, 从该文本中提取每个所述标 注标识对应的文本特 征, 得到每 个所述标注标识对应的文本内容; 根据预设的拼接字符和/或拼接顺序, 对从每个所述初始文本中提取到的所有所述标 注标识对应的文本内容进行拼接操作, 得到带有标注信息的若干个初始样本文本 。 6.根据权利要求1 ‑3中任一项所述的文本情感分析模型的构建方法, 其特征在于, 所述 方法还包括: 确定每个所述初始样本文本中满足预设确 认条件的文本关键词, 并根据每个所述初始 样本文本的文本关键词确定该初始样本文本匹配的模板文本; 其中, 所述根据每个所述初始样本文本的文本关键词确定该初始样本文本匹配的模板 文本, 包括: 根据每个所述初始样本文本的文本关键词确定该初始样本文本对应的情感复杂度; 针对每个所述初始样本文本, 将预设的多个原始模板文本 中与该初始样本文本对应的 情感复杂度相匹配的原始模板文本确定为该初始样本文本对应的目标模板文本, 其中, 所 述原始模板文本包括第一类模板文本和/或第二类模板文本, 所述第一类模板文本对应的 待补充信息为情感程度信息, 所述第二类模板文本对应的待补充信息为情感形容信息; 根据每个所述初始样本文本的文本关键词, 对该初始样本文本对应的目标模板文本中 除所述待补充信息之外的其他文本内容进 行关键词替换操作, 得到该初始样本文本匹配的 模板文本 。 7.根据权利要求1 ‑3中任一项所述的文本情感分析模型的构建方法, 其特征在于, 在所权 利 要 求 书 2/3 页 3 CN 115081458 A 3

.PDF文档 专利 一种文本情感分析模型的构建方法及装置

文档预览
中文文档 26 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种文本情感分析模型的构建方法及装置 第 1 页 专利 一种文本情感分析模型的构建方法及装置 第 2 页 专利 一种文本情感分析模型的构建方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:09:13上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。