国家标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210522355.1 (22)申请日 2022.05.13 (71)申请人 国网江苏省电力有限公司信息通信 分公司 地址 210024 江苏省南京市北京西路20号 (72)发明人 田然 李瑾辉 相增辉 庞渊源  苏杨 王义成 王磊 陈轩 陈鑫  朱晓鸿 王鑫  (74)专利代理 机构 重庆创新专利商标代理有限 公司 50125 专利代理师 易文学 (51)Int.Cl. G06F 40/30(2020.01) G06N 20/10(2019.01) G06K 9/62(2022.01)G06F 16/215(2019.01) (54)发明名称 一种基于文本情感曲线的分析方法 (57)摘要 本发明涉及数据处理技术领域, 具体涉及一 种基于文本情感曲线的分析方法, 包括获取文本 信息; 对文本信息进行预处理, 得到训练集和测 试集; 构建学习模型; 使用训练集和测试集对学 习模型进行训练和测试, 得到监督学习模型; 对 待测文本进行预处理, 得到待测特征; 将待测特 征输入监督学习模型进行训练, 得到情感曲线 图; 对情感曲线图进行分析, 得到分析结果, 本发 明通过建立监督学习模型可实现对待测文本进 行自动分析, 生成情感曲线图, 解决了现有的文 本情感分析方法的人工成本高的问题。 权利要求书1页 说明书4页 附图2页 CN 114970542 A 2022.08.30 CN 114970542 A 1.一种基于文本情感曲线的分析 方法, 其特 征在于, 包括以下步骤: 获取文本信息; 对所述文本信息进行 预处理, 得到训练集和 测试集; 构建学习模型; 使用所述训练集和所述测试集对所述学习模型进行训练和 测试, 得到监 督学习模型; 对待测文本进行 预处理, 得到待测特 征; 将所述待测特 征输入所述 监督学习模型进行训练, 得到情感曲线图; 对所述情感曲线图进行分析, 得到分析 结果。 2.如权利要求1所述的基于文本情感曲线的分析 方法, 其特 征在于, 所述对所述文本信息进行 预处理, 得到训练集和 测试集的具体方式为: 去除所述文本信息中的停用词, 得到过 滤文本; 标记所述过 滤文本的权 重, 得到权重文本; 将所述权 重文本进行划分, 得到训练集和 测试集。 3.如权利要求2所述的基于文本情感曲线的分析 方法, 其特 征在于, 所述标记所述过 滤文本的权 重, 得到权重文本的具体方式为: 标记所述过 滤文本中的关键词; 基于所述关键词提取 所述过滤文本中的前缀词, 得到 权重文本。 4.如权利要求1所述的基于文本情感曲线的分析 方法, 其特 征在于, 所述使用所述训练集和所述测试集对所述学习模型进行训练和测试, 得到监督学习 模 型的具体方式为: 使用所述训练集对所述学习模型进行训练, 得到训练模型; 使用所述测试集对所述训练模型进行测试, 测试通过, 得到监 督学习模型。 5.如权利要求1所述的基于文本情感曲线的分析 方法, 其特 征在于, 所述对待测文本进行 预处理, 得到待测特 征的具体方式为: 去除所述待测文本中的停用词, 得到去除文本; 对所述去除文本进行 特征提取, 得到待测特 征。权 利 要 求 书 1/1 页 2 CN 114970542 A 2一种基于文本情 感曲线的分析方 法 技术领域 [0001]本发明涉及数据处 理技术领域, 尤其涉及一种基于文本情感曲线的分析 方法。 背景技术 [0002]文本情感曲线是一种基于文本情感分析的具体情感模式, 可以通过情感曲线展示 文本的具体情感变化, 一般用于 长文本的情感分析。 [0003]目前, 现有技术公开了一种文本情感分析方法通过人工抓取数据进行标注得到情 感词典, 根据情感词典对文本的情感表达将词语进行正负向和强弱程度区分, 人工成本高。 发明内容 [0004]本发明的目的在于提供一种基于文本情感曲线的分析方法, 旨在解决现有的文本 情感分析 方法的人工成本高的问题。 [0005]为实现上述目的, 本发明提供了一种基于文本情感曲线的分析方法, 包括以下步 骤: [0006]获取文本信息; [0007]对所述文本信息进行 预处理, 得到训练集和 测试集; [0008]构建学习模型; [0009]使用所述训练集和所述测试集对所述学习模型进行训练和测试, 得到监督学习模 型; [0010]对待测文本进行 预处理, 得到待测特 征; [0011]将所述待测特 征输入所述 监督学习模型进行训练, 得到情感曲线图; [0012]对所述情感曲线图进行分析, 得到分析 结果。 [0013]其中, 所述对所述文本信息进行 预处理, 得到训练集和 测试集的具体方式为: [0014]去除所述文本信息中的停用词, 得到过 滤文本; [0015]标记所述过 滤文本的权 重, 得到权重文本; [0016]将所述权 重文本进行划分, 得到训练集和 测试集。 [0017]其中, 所述标记所述过 滤文本的权 重, 得到权重文本的具体方式为: [0018]标记所述过 滤文本中的关键词; [0019]基于所述关键词提取 所述过滤文本中的前缀词, 得到 权重文本。 [0020]其中, 所述使用所述训练集和所述测试集对所述学习模型进行训练和测试, 得到 监督学习模型的具体方式为: [0021]使用所述训练集对所述学习模型进行训练, 得到训练模型; [0022]使用所述测试集对所述训练模型进行测试, 测试通过, 得到监 督学习模型。 [0023]其中, 所述对待测文本进行 预处理, 得到待测特 征的具体方式为: [0024]去除所述待测文本中的停用词, 得到去除文本; [0025]对所述去除文本进行 特征提取, 得到待测特 征。说 明 书 1/4 页 3 CN 114970542 A 3

.PDF文档 专利 一种基于文本情感曲线的分析方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于文本情感曲线的分析方法 第 1 页 专利 一种基于文本情感曲线的分析方法 第 2 页 专利 一种基于文本情感曲线的分析方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:07:59上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。