国家标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210522355.1 (22)申请日 2022.05.13 (71)申请人 国网江苏省电力有限公司信息通信 分公司 地址 210024 江苏省南京市北京西路20号 (72)发明人 田然 李瑾辉 相增辉 庞渊源 苏杨 王义成 王磊 陈轩 陈鑫 朱晓鸿 王鑫 (74)专利代理 机构 重庆创新专利商标代理有限 公司 50125 专利代理师 易文学 (51)Int.Cl. G06F 40/30(2020.01) G06N 20/10(2019.01) G06K 9/62(2022.01)G06F 16/215(2019.01) (54)发明名称 一种基于文本情感曲线的分析方法 (57)摘要 本发明涉及数据处理技术领域, 具体涉及一 种基于文本情感曲线的分析方法, 包括获取文本 信息; 对文本信息进行预处理, 得到训练集和测 试集; 构建学习模型; 使用训练集和测试集对学 习模型进行训练和测试, 得到监督学习模型; 对 待测文本进行预处理, 得到待测特征; 将待测特 征输入监督学习模型进行训练, 得到情感曲线 图; 对情感曲线图进行分析, 得到分析结果, 本发 明通过建立监督学习模型可实现对待测文本进 行自动分析, 生成情感曲线图, 解决了现有的文 本情感分析方法的人工成本高的问题。 权利要求书1页 说明书4页 附图2页 CN 114970542 A 2022.08.30 CN 114970542 A 1.一种基于文本情感曲线的分析 方法, 其特 征在于, 包括以下步骤: 获取文本信息; 对所述文本信息进行 预处理, 得到训练集和 测试集; 构建学习模型; 使用所述训练集和所述测试集对所述学习模型进行训练和 测试, 得到监 督学习模型; 对待测文本进行 预处理, 得到待测特 征; 将所述待测特 征输入所述 监督学习模型进行训练, 得到情感曲线图; 对所述情感曲线图进行分析, 得到分析 结果。 2.如权利要求1所述的基于文本情感曲线的分析 方法, 其特 征在于, 所述对所述文本信息进行 预处理, 得到训练集和 测试集的具体方式为: 去除所述文本信息中的停用词, 得到过 滤文本; 标记所述过 滤文本的权 重, 得到权重文本; 将所述权 重文本进行划分, 得到训练集和 测试集。 3.如权利要求2所述的基于文本情感曲线的分析 方法, 其特 征在于, 所述标记所述过 滤文本的权 重, 得到权重文本的具体方式为: 标记所述过 滤文本中的关键词; 基于所述关键词提取 所述过滤文本中的前缀词, 得到 权重文本。 4.如权利要求1所述的基于文本情感曲线的分析 方法, 其特 征在于, 所述使用所述训练集和所述测试集对所述学习模型进行训练和测试, 得到监督学习 模 型的具体方式为: 使用所述训练集对所述学习模型进行训练, 得到训练模型; 使用所述测试集对所述训练模型进行测试, 测试通过, 得到监 督学习模型。 5.如权利要求1所述的基于文本情感曲线的分析 方法, 其特 征在于, 所述对待测文本进行 预处理, 得到待测特 征的具体方式为: 去除所述待测文本中的停用词, 得到去除文本; 对所述去除文本进行 特征提取, 得到待测特 征。权 利 要 求 书 1/1 页 2 CN 114970542 A 2一种基于文本情 感曲线的分析方 法 技术领域 [0001]本发明涉及数据处 理技术领域, 尤其涉及一种基于文本情感曲线的分析 方法。 背景技术 [0002]文本情感曲线是一种基于文本情感分析的具体情感模式, 可以通过情感曲线展示 文本的具体情感变化, 一般用于 长文本的情感分析。 [0003]目前, 现有技术公开了一种文本情感分析方法通过人工抓取数据进行标注得到情 感词典, 根据情感词典对文本的情感表达将词语进行正负向和强弱程度区分, 人工成本高。 发明内容 [0004]本发明的目的在于提供一种基于文本情感曲线的分析方法, 旨在解决现有的文本 情感分析 方法的人工成本高的问题。 [0005]为实现上述目的, 本发明提供了一种基于文本情感曲线的分析方法, 包括以下步 骤: [0006]获取文本信息; [0007]对所述文本信息进行 预处理, 得到训练集和 测试集; [0008]构建学习模型; [0009]使用所述训练集和所述测试集对所述学习模型进行训练和测试, 得到监督学习模 型; [0010]对待测文本进行 预处理, 得到待测特 征; [0011]将所述待测特 征输入所述 监督学习模型进行训练, 得到情感曲线图; [0012]对所述情感曲线图进行分析, 得到分析 结果。 [0013]其中, 所述对所述文本信息进行 预处理, 得到训练集和 测试集的具体方式为: [0014]去除所述文本信息中的停用词, 得到过 滤文本; [0015]标记所述过 滤文本的权 重, 得到权重文本; [0016]将所述权 重文本进行划分, 得到训练集和 测试集。 [0017]其中, 所述标记所述过 滤文本的权 重, 得到权重文本的具体方式为: [0018]标记所述过 滤文本中的关键词; [0019]基于所述关键词提取 所述过滤文本中的前缀词, 得到 权重文本。 [0020]其中, 所述使用所述训练集和所述测试集对所述学习模型进行训练和测试, 得到 监督学习模型的具体方式为: [0021]使用所述训练集对所述学习模型进行训练, 得到训练模型; [0022]使用所述测试集对所述训练模型进行测试, 测试通过, 得到监 督学习模型。 [0023]其中, 所述对待测文本进行 预处理, 得到待测特 征的具体方式为: [0024]去除所述待测文本中的停用词, 得到去除文本; [0025]对所述去除文本进行 特征提取, 得到待测特 征。说 明 书 1/4 页 3 CN 114970542 A 3
专利 一种基于文本情感曲线的分析方法
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:07:59
上传分享
举报
下载
原文档
(596.8 KB)
分享
友情链接
Domino服务器安全配置基线.doc
GB-T 42442.1-2023 智慧城市 智慧停车 第1部分:总体要求.pdf
GB-T 42452-2023 系统与软件工程 功能规模测量 COSMIC方法.pdf
GB-T 17694-2009 地理信息 术语.pdf
T-CSBM 0037—2023 纺织品 医用纺粘法非织造布 抗菌抗病毒型.pdf
T-CSAE 102—2019 电动汽车充电桩安装服务规范.pdf
GB-T 10059-2023 电梯试验方法.pdf
GW0205-2014 国家电子政务外网 跨网数据安全交换技术要求与实施指南.pdf
GB-T 9473-2022 读写作业台灯性能要求.pdf
GB-T 15852.1-2020 信息技术 安全技术 消息鉴别码 第1部分:采用分组密码的机制.pdf
GB-T 42430-2023 血液、尿液中乙醇、甲醇、正丙醇、丙酮、异丙醇和正丁醇检验.pdf
T-ZZB 2404—2021 N,N-二异丙基碳二亚胺.pdf
GB-T 32151.12-2018 温室气体排放核算与报告要求 第12部分 纺织服装企业.pdf
GB-T 35678-2017 公共安全 人脸识别应用 图像技术要求.pdf
GB-T 40753.4-2024 供应链安全管理体系 ISO 28000实施指南 第4部分:以符合GB-T 38702为管理目标实施ISO 28000的附加特定指南.pdf
GA-T 1983-2022 少年儿童道路交通安全文明教育指南.pdf
OWASP大语言模型应用程序十大风险V1.0.pdf
GB-T 23021-2022 信息化和工业化融合管理体系 生产设备管理能力成熟度评价.pdf
GM-T 0025-2014 SSL VPN网关产品规范.pdf
GB-T 15317-2009 燃煤工业锅炉节能监测.pdf
1
/
3
8
评价文档
赞助2.5元 点击下载(596.8 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。