专利 一种基于文本情感曲线的分析方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210522355.1 (22)申请日 2022.05.13 (71)申请人国网江苏省电力有限公司信息通信分公司地址 210024 江苏省南京市北京西路20号 (72)发明人田然　李瑾辉　相增辉　庞渊源　苏杨　王义成　王磊　陈轩　陈鑫　朱晓鸿　王鑫　 (74)专利代理机构重庆创新专利商标代理有限公司 50125 专利代理师易文学 (51)Int.Cl. G06F 40/30(2020.01) G06N 20/10(2019.01) G06K 9/62(2022.01)G06F 16/215(2019.01) (54)发明名称一种基于文本情感曲线的分析方法 (57)摘要本发明涉及数据处理技术领域，具体涉及一种基于文本情感曲线的分析方法，包括获取文本信息；对文本信息进行预处理，得到训练集和测试集；构建学习模型；使用训练集和测试集对学习模型进行训练和测试，得到监督学习模型；对待测文本进行预处理，得到待测特征；将待测特征输入监督学习模型进行训练，得到情感曲线图；对情感曲线图进行分析，得到分析结果，本发明通过建立监督学习模型可实现对待测文本进行自动分析，生成情感曲线图，解决了现有的文本情感分析方法的人工成本高的问题。权利要求书1页说明书4页附图2页 CN 114970542 A 2022.08.30 CN 114970542 A 1.一种基于文本情感曲线的分析方法，其特征在于，包括以下步骤：获取文本信息；对所述文本信息进行预处理，得到训练集和测试集；构建学习模型；使用所述训练集和所述测试集对所述学习模型进行训练和测试，得到监督学习模型；对待测文本进行预处理，得到待测特征；将所述待测特征输入所述监督学习模型进行训练，得到情感曲线图；对所述情感曲线图进行分析，得到分析结果。 2.如权利要求1所述的基于文本情感曲线的分析方法，其特征在于，所述对所述文本信息进行预处理，得到训练集和测试集的具体方式为：去除所述文本信息中的停用词，得到过滤文本；标记所述过滤文本的权重，得到权重文本；将所述权重文本进行划分，得到训练集和测试集。 3.如权利要求2所述的基于文本情感曲线的分析方法，其特征在于，所述标记所述过滤文本的权重，得到权重文本的具体方式为：标记所述过滤文本中的关键词；基于所述关键词提取所述过滤文本中的前缀词，得到权重文本。 4.如权利要求1所述的基于文本情感曲线的分析方法，其特征在于，所述使用所述训练集和所述测试集对所述学习模型进行训练和测试，得到监督学习模型的具体方式为：使用所述训练集对所述学习模型进行训练，得到训练模型；使用所述测试集对所述训练模型进行测试，测试通过，得到监督学习模型。 5.如权利要求1所述的基于文本情感曲线的分析方法，其特征在于，所述对待测文本进行预处理，得到待测特征的具体方式为：去除所述待测文本中的停用词，得到去除文本；对所述去除文本进行特征提取，得到待测特征。权　利　要　求　书 1/1 页 2 CN 114970542 A 2一种基于文本情感曲线的分析方法技术领域 [0001]本发明涉及数据处理技术领域，尤其涉及一种基于文本情感曲线的分析方法。背景技术 [0002]文本情感曲线是一种基于文本情感分析的具体情感模式，可以通过情感曲线展示文本的具体情感变化，一般用于长文本的情感分析。 [0003]目前，现有技术公开了一种文本情感分析方法通过人工抓取数据进行标注得到情感词典，根据情感词典对文本的情感表达将词语进行正负向和强弱程度区分，人工成本高。发明内容 [0004]本发明的目的在于提供一种基于文本情感曲线的分析方法，旨在解决现有的文本情感分析方法的人工成本高的问题。 [0005]为实现上述目的，本发明提供了一种基于文本情感曲线的分析方法，包括以下步骤： [0006]获取文本信息； [0007]对所述文本信息进行预处理，得到训练集和测试集； [0008]构建学习模型； [0009]使用所述训练集和所述测试集对所述学习模型进行训练和测试，得到监督学习模型； [0010]对待测文本进行预处理，得到待测特征； [0011]将所述待测特征输入所述监督学习模型进行训练，得到情感曲线图； [0012]对所述情感曲线图进行分析，得到分析结果。 [0013]其中，所述对所述文本信息进行预处理，得到训练集和测试集的具体方式为： [0014]去除所述文本信息中的停用词，得到过滤文本； [0015]标记所述过滤文本的权重，得到权重文本； [0016]将所述权重文本进行划分，得到训练集和测试集。 [0017]其中，所述标记所述过滤文本的权重，得到权重文本的具体方式为： [0018]标记所述过滤文本中的关键词； [0019]基于所述关键词提取所述过滤文本中的前缀词，得到权重文本。 [0020]其中，所述使用所述训练集和所述测试集对所述学习模型进行训练和测试，得到监督学习模型的具体方式为： [0021]使用所述训练集对所述学习模型进行训练，得到训练模型； [0022]使用所述测试集对所述训练模型进行测试，测试通过，得到监督学习模型。 [0023]其中，所述对待测文本进行预处理，得到待测特征的具体方式为： [0024]去除所述待测文本中的停用词，得到去除文本； [0025]对所述去除文本进行特征提取，得到待测特征。说　明　书 1/4 页 3 CN 114970542 A 3

专利 一种基于文本情感曲线的分析方法

专利一种基于文本情感曲线的分析方法