国家标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210852952.0 (22)申请日 2022.07.20 (71)申请人 杭州数政科技有限公司 地址 310012 浙江省杭州市西湖区教工路 198号7幢5 03 (72)发明人 周志凯 张嘎 钟君凯 王雯 王东旭 王宁 罗康建 (51)Int.Cl. G06F 40/30(2020.01) G06F 16/35(2019.01) G06K 9/62(2022.01) G06N 3/08(2006.01) (54)发明名称 一种基于自监督神经网络的涉传线索识别 方法 (57)摘要 本发明公开了一种基于自监督神经网络的 涉传线索识别方法, 包括: 文本表征模块、 编码解 码模块和模式识别模块; 所述文本表征模块用于 接收传舆情文本, 并负责文本的编码表征工作, 用于将自然语言转化为机器可以计算的高维张 量; 所述编码解码模块用于文本的编码与转译工 作, 并将文本表征模块传输出的文本表征转译为 涉传表征; 以及所述模式识别模块用于对涉传转 译表征的识别判断, 将涉传表征通过激活函数转 化为涉传的概 率, 最后输出 涉传线索文本 。 权利要求书2页 说明书5页 附图3页 CN 115169358 A 2022.10.11 CN 115169358 A 1.一种基于自监 督神经网络的涉传线索识别方法, 其特 征在于, 包括: 一文本表征模块; 所述文本表征模块用于接收传舆情文本, 并负责文本的编码表征工 作, 用于将自然语言转 化为机器可以计算的高维张量; 一编码解码模块; 所述编码解码模块用于文本的编码与转译工作, 并将文本表征模块 传输出的文本表征转译为涉传表征; 以及 一模式识别模块; 所述模式识别模块用于对涉传转译表征的识别判断, 将涉传表征通 过激活函数转 化为涉传的概 率, 最后输出 涉传线索文本 。 2.如权利要求1所述的一种基于自监督神经网络的涉传线索识别方法, 其特征在于, 所 述文本表征模块的内部逻辑为在输入层分别对输入的舆情文本和涉传模式文本进行表征 学习。 3.如权利要求2所述的一种基于自监督神经网络的涉传线索识别方法, 其特征在于, 所 述文本表征模型通过引入涉传舆情文本, 修改特征词的表征张量; 其中, 引入的涉传舆情文 本为经过人工标注的涉传舆情报道, 涉传舆情文本包含具备人员链、 资金链特征, 能够为后 续海量舆情文本表征提供参 考。 4.如权利要求2所述的一种基于自监督神经网络的涉传线索识别方法, 其特征在于, 所 述文本表征模块的算法为基于Transformer改造的双向语义编码模 型BERT, 同时, 为了在文 本表征过程中, 提高对涉传关键词的警觉度, 添加了基于涉传线索识别场景的训练语料, 作 为预训练语 言模型增量训练的样本, 在表征层之后, 为了提取涉传 线索的表达范式, 采用相 对位置编 码的方案, 形成文本的相对位置编 码; 最后, 通过张量的加法运算将文本表征编码 与相对位置编码相加, 完成对文本相对位置的信息融合。 5.如权利要求1或2或3或4所述的一种基于自监督神经网络的涉传线索识别方法, 其特 征在于, 所述编码解码模块为主干网络the Transformer的Encoder ‑Decoder部分, 通过相 对位置编码与QKV序列编 码完成表征编码, 利用掩码 语言模型训练, 完成舆情文本的涉传转 译。 6.如权利要求5所述的一种基于自监督神经网络的涉传线索识别方法, 其特征在于, 所 述编码解码模块将不同长度的编码结果、 键值和解码结果进行组合训练; 并将编码信息传 入掩码自注意力模型对信息进行解码训练, 完成涉传行为模式的转译工作。 7.如权利要求6所述的一种基于自监督神经网络的涉传线索识别方法, 其特征在于, 所 述转译工作的算法如下: 其中, Q代表待查询的单词Query, K代表待查询的键值Key, V代表键值对应的结果 Value, Attention代表一个单词在句子中的注意力分值, d代表矩阵的维度, softmax为多分 类问题的激活函数。 8.如权利要求1或2或3或4所述的一种基于自监督神经网络的涉传线索识别方法, 其特 征在于, 所述模式识别模块为整个网络的输出层, 由一个前向神经网络叠加 一个模式识别 算法, 得到模型的模式识别结果, 之后由线性转化得到归一值, 并传 入多分类器得到涉传线 索类型与涉传相似度。权 利 要 求 书 1/2 页 2 CN 115169358 A 29.如权利要求8所述的一种基于自监督神经网络的涉传线索识别方法, 其特征在于, 所 述模块采用PCA主成分分析法作为模式识别算法, 由于上一模块中转译的涉传编码为高维 张量, PCA在模式识别判断中有特定的优 越性, 可以由特 征轴分析判断涉传线索。权 利 要 求 书 2/2 页 3 CN 115169358 A 3
专利 一种基于自监督神经网络的涉传线索识别方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:08:27
上传分享
举报
下载
原文档
(527.2 KB)
分享
友情链接
DB31-T 1446-2023 公共数据安全分级指南 上海市.pdf
GB-T 30761-2014 扁桃仁.pdf
YD-T 4028-2022 基于RoCE协议的数据中心高速以太无损网络测试方法.pdf
T-SSITS 204—2023 工业应用移动机器人与其调度系统数据接口规范.pdf
SF-T 0008-2017 全国司法行政信息化总体技术规范.pdf
LD-T04-2022 人力资源社会保障网络安全监测和应急处置规范.pdf
GB-T 21393-2008 公路运输能源消耗统计及分析方法.pdf
T-CSPSTC 75—2021 微动探测技术规程.pdf
T-CEC 617—2022 高海拔地区交流输变电设备外绝缘配置.pdf
CCSP认证考试大纲 中文版 2022.pdf
T-CEC 5074—2022 抽水蓄能电站工程施工总进度编制导则.pdf
GB-T 12452-2022 水平衡测试通则.pdf
GB-T 41648-2022 旅游民宿基本要求与等级划分.pdf
GB-T 446-2023 全精炼石蜡.pdf
DB11-T 1344-2016 信息安全等级保护检查规范 北京市.pdf
GB-T 23020-2013工业企业信息化和工业化融合评估规范.pdf
GB-T 31439.2-2015 波形梁钢护栏 第2部分:三波形梁钢护栏.pdf
GB-T 31509-2015 信息安全技术 信息安全风险评估实施指南 .pdf
GBJ 93-86 工业自动化仪表施工验收.pdf
工业控制系统信息安全防护指南.pdf
1
/
3
11
评价文档
赞助2.5元 点击下载(527.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。