国家标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210713652.4 (22)申请日 2022.06.22 (71)申请人 海南大学 地址 570203 海南省海口市人民大道58号 海南大学 (72)发明人 章冬 张硕 曹竹芸 叶春杨 周辉 (74)专利代理 机构 海南盛亿专利代理事务所 (普通合伙) 46005 专利代理师 陈景帅 (51)Int.Cl. G06F 40/216(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于多维特征的虚假信息检测系统及 其方法 (57)摘要 本发明属于信息检测技术领域, 公开了一种 基于多维特征的虚假信息检测系统及其方法, 所 述的系统包括历史评论文本采集单元、 待检测评 论文件接收单元、 数据库单元、 虚假信息检测单 元以及人机交互单元; 所述的方法包括如下步 骤: 获取历史的评论文本数据集, 并基于历史的 评论文本 数据集建立虚假信息检测模 型; 获取待 检测评论文件, 并对待检测评论文件进行预处 理, 得到待检测词集; 将待检测词集进行处理, 得 到对应的多维特征; 将多维特征输入虚假信息检 测模型, 得到虚假信息检测结果。 本发明解决了 现有技术存在的效率和准确性低, 实用性低, 效 果差, 无法识别评论信息中的关键特 征的问题。 权利要求书2页 说明书5页 附图2页 CN 114997144 A 2022.09.02 CN 114997144 A 1.一种基于多维特征的虚假信 息检测系统, 其特征在于: 包括历史评论文本采集单元、 待检测评论文件接收单元、 数据库单元、 虚假信息检测单元以及人机交互单元, 所述的数据 库单元分别与历史评论文本采集单元、 待检测评论文件接 收单元、 虚假信息检测单元以及 人机交互单元连接, 所述的历史评论文本采集单元连接有外部的历史评论文本数据库, 所 述的虚假信息检测单 元建立有能够提取多维特 征的虚假信息检测模型。 2.根据权利要求1所述的基于多维特征的虚假信 息检测系统, 其特征在于: 所述的数据 库单元设置有用户信息数据库、 评论文本数据库、 待检测词集数据库、 特征数据库以及虚 假 信息检测结果数据库。 3.根据权利要求1所述的基于多维特征的虚假信 息检测系统, 其特征在于: 所述的虚假 信息检测模型基于A ttention‑Bi‑LSTM‑CNN混合算法建立。 4.一种基于多维特征的虚假信息检测方法, 基于如权利要求1所述的虚假信息检测系 统, 其特征在于: 包括如下步骤: 获取历史的评论文本数据集, 并基于历史的评论文本数据集建立虚假信息检测模型; 获取待检测评论文件, 并对待检测评论文件进行 预处理, 得到待检测词集; 将待检测词集进行处 理, 得到对应的多维特 征; 将多维特 征输入虚假信息检测模型, 得到虚假信息检测结果。 5.根据权利要求4所述的基于多维特征的虚假信 息检测方法, 其特征在于: 建立虚假信 息检测模型, 包括如下步骤: 对带有真假标识的历史 的评论文本数据集进行预处理, 得到预处理后的评论文本数据 集, 每条预处理后的评论文本数据均包括若干单词实体; 提取当前预处理后的评论文本数据的每条评论语句中词频大于词频阙值的所有单词 实体, 构成历史评论词集; 遍历所有的预处 理后的评论文本数据, 得到所有的历史评论词集; 将所有的历史评论词集输入Attention ‑Bi‑LSTM‑CNN混合模型进行训练, 得到虚假信 息检测模型。 6.根据权利要求5所述的基于多维特征的虚假信 息检测方法, 其特征在于: 所述的虚假 信息检测模型包括依 次连接的输入层、 并联 的语义特征获取模块与行为特征获取模块、 第 一全连接层、 分类层以及输出层, 所述的语义特征获取模块为设置有Attention机制的Bi ‑ LSTM神经网络结构, 所述的行为特征获取模块为设置有Attention机制的CNN神经网络结 构。 7.根据权利要求6所述的基于多维特征的虚假信 息检测方法, 其特征在于: 所述的语义 特征获取模块包括依次连接的词向量转换子模块、 Bi ‑LSTM子模块、 注 意力层以及第二全连 接层, 所述的词向量 转换子模块与输入层连接, 所述的第二全连接层与第一全连接层连接; 所述的行为特征获取模块包括依次连接的特征矩阵获取子模块、 卷积层、 最大池化层 以及第三全连接层, 所述的卷积层与最大池化层之间并联有注意力矩阵获取子模块, 所述 的特征矩阵获取子模块与输入层连接, 所述的第三全连接层与第一全连接层连接 。 8.根据权利要求7所述的基于多维特征的虚假信 息检测方法, 其特征在于: 所述的获取 待检测评论文件, 并对待检测评论文件进行 预处理, 包括如下步骤: 若待检测评论文件只包含单一的待检测的评论文本数据, 对单一的待检测的评论文本权 利 要 求 书 1/2 页 2 CN 114997144 A 2数据进行预处理, 得到待检测评论文件的预处理后的评论文本数据, 预处理后的评论文本 数据包括若干单词实体; 提取当前待检测评论文件的评论语句中词频大于词频阙值的所有单词实体, 构 成待检 测评论词集; 若待检测评论文件包含若干待检测的评论文本数据, 对待检测评论文件中每条待检测 的评论文本数据进行预处理, 得到预处理后的评论文本数据集, 每条预处理后的评论文本 数据均包括若干单词实体; 提取当前预处理后的评论文本数据的每条评论语句中词频大于词频阙值的所有单词 实体, 构成待检测评论词集; 遍历所有的预处 理后的评论文本数据, 得到所有的待检测评论词集。 9.根据权利要求8所述的基于多维特征的虚假信 息检测方法, 其特征在于: 所述的多维 特征为由语义特征和行为特征融合构成, 所述的行为特征包括评论者行为特征和商家行为 特征, 所述的评论者行为特征包括评论者昵称和评论者信誉等级, 所述的商家行为特征包 括商家信誉等级和商家评分。 10.根据权利要求9所述的基于多维特征的虚假信息检测方法, 其特征在于: 获取虚假 信息检测结果, 包括如下步骤: 将待检测评论文件的多维特征输入虚假信 息检测模型, 与历史的评论文本数据的多维 特征进行匹配并计算两者的相似度; 若相似度超过相似度阈值, 则将历史 的评论文本数据对应的真假标识作为待检测评论 文件的预测的真假标识; 将待检测评论文件的预测的真假标识和对应的待检测评论词集作为虚假信息检测结 果进行输出。权 利 要 求 书 2/2 页 3 CN 114997144 A 3
专利 一种基于多维特征的虚假信息检测系统及其方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:07:45
上传分享
举报
下载
原文档
(517.3 KB)
分享
友情链接
GB-T 37027-2018 信息安全技术 网络攻击定义及描述规范.pdf
GB-T 24554-2022 燃料电池发动机性能试验方法.pdf
GB-T 7729-2021 冶金产品化学分析 分光光度法通则.pdf
DL-T 741-2019 架空输电线路运行规程.pdf
GB-T 41554-2022 地理空间观测平台及传感器资源元数据.pdf
GB-T 32386-2015 电子工业用气体 六氟化钨.pdf
XF 95-2015 灭火器维修.pdf
GB-T 5907.5-2015 消防词汇 第5部分:消防产品.pdf
GB-T 41620-2022 科学技术研究项目评价实施指南 应用研究项目.pdf
中国电信 云网安全技术白皮书 2022.pdf
DB13-T 2338.3-2016 谷子抗病虫性鉴定技术规程 第3部分:白发病 河北省.pdf
法律法规 青海省行政机构设置和编制管理条例2004-05-29.pdf
DB4401-T 42-2020 市政燃气管道安全评估规则 广州市.pdf
GB-T 33356-2016 新型智慧城市评价指标_.pdf
GB-T 31506-2022 信息安全技术 政务网站系统安全指南.pdf
DB2201-T 16-2022 城市智能体数据治理技术规范 长春市.pdf
GB-T 15846-2006 集装箱门框密封条.pdf
GB-T 36466-2018 信息安全技术 工业控制系统风险评估实施指南.pdf
GB-T 34224-2017 生物产品中功能性微生物检测.pdf
专利 一种轴承质量检测装置及方法.PDF
1
/
3
10
评价文档
赞助2.5元 点击下载(517.3 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。