国家标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210538427.1 (22)申请日 2022.05.18 (71)申请人 吉林大学 地址 130000 吉林省长 春市前进大街269 9 号 (72)发明人 白洪涛 贾燕鹏 陈哲楷 郑修远 刘轩赫 郭军豪 (74)专利代理 机构 北京远大卓悦知识产权代理 有限公司 1 1369 专利代理师 王雪娇 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/35(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于内容关键词和神经网络的图书馆 书籍分类方法 (57)摘要 本发明公开了一种基于内容关键词和神经 网络的图书馆书籍分类方法, 包括: 步骤一、 建立 8层基于双向长短期记忆神经网络的模型, 包括 依次连接的嵌入层、 空间随机失活层、 长短期记 忆层、 第一随机失活层、 全 连接层、 第二随机失活 层、 全连接层和激活函数层; 步骤二、 将待分类的 图书随机抽取一页进行文本识别, 将识别后的文 本进行数据预处理获得向量数据; 步骤三、 将所 述向量数据输入所述模型中, 获得预测分类结 果。 本发明结合循环神经网络对自然语 言处理的 准确性, 同时通过长短期记忆神经网络在很大程 度上解决循环神经网络在较长时间步存在的梯 度爆炸和梯度消失问题, 实现准确的中文图书分 类功能。 权利要求书2页 说明书5页 附图2页 CN 115062105 A 2022.09.16 CN 115062105 A 1.一种基于内容关键词和神经网络的图书馆书籍分类方法, 其特征在于, 包括如下步 骤: 步骤一、 建立8层基于双向长短期记忆神经网络的模型, 包括依次连接的嵌入层、 空间 随机失活层、 长 短期记忆层、 第一随机失活层、 第一全连接层、 第二随机失活层、 第二全连接 层和激活函数层; 步骤二、 将待分类的图书随机抽取一页进行文本识别, 将识别后的文本进行数据预处 理获得向量数据; 步骤三、 将所述向量数据输入所述模型中, 获得 预测分类结果。 2.如权利要求1所述的基于内容关键词和神经网络的图书馆书籍分类方法, 其特征在 于, 所述嵌入层嵌入维度为128, 所述空间随机失活层参数为0.25, 所述第一随机失活层参 数为0.25, 所述第二随机失活层参数为0.3 。 3.如权利要求2所述的基于内容关键词和神经网络的图书馆书籍分类方法, 其特征在 于, 所述激活函数层为Sigmo ld层。 4.如权利要求3所述的基于内容关键词和神经网络的图书馆书籍分类方法, 其特征在 于, 所述长短期记 忆层的遗 忘门的计算公式为: ft=σ(Wf·[ht‑1,xt]+bf); 式中, ft为经过LS TM层需要遗忘丢弃的状态信息, σ 为通过sigmoid层将输入映射到0到1 之间的值, Wf为遗忘门权重矩阵, ht‑1为t‑1时刻结点LSTM层的状态输出, xt为t时刻的输入, bf为遗忘门偏置值。 5.如权利要求4所述的基于内容关键词和神经网络的图书馆书籍分类方法, 其特征在 于, 所述长短期记 忆层的输入门的计算公式为: it=σ(Wi·[ht‑1,xt]+bi); 式中, it为更新过后的输入信息, Wi为输入门权 重矩阵, bi为输入门偏置值。 6.如权利要求5所述的基于内容关键词和神经网络的图书馆书籍分类方法, 其特征在 于, 所述长短期记 忆层的输出门的计算公式为: ot=σ(Wo·[ht‑1,xt]+bo); 式中, ot为LSTM层的输出信息, Wo为输出门权 重矩阵, bo为输出门偏置值。 7.如权利要求6所述的基于内容关键词和神经网络的图书馆书籍分类方法, 其特征在 于, 所述长短期记 忆层的记 忆细胞更新的计算公式为: ht=ot×tanh(Ct); 式中, ht为记忆细胞t时刻的最终输出, Ct为t时刻记忆细胞状态, Ct‑1为t‑1时刻记忆细 胞状态, 为候选向量, Wc为记忆细胞权 重矩阵, bc为记忆细胞偏置值。 8.如权利要求7所述的基于内容关键词和神经网络的图书馆书籍分类方法, 其特征在 于, 所述数据预处 理包括依次进行的文本预处 理和文本向量 化。 9.如权利要求8所述的基于内容关键词和神经网络的图书馆书籍分类方法, 其特征在权 利 要 求 书 1/2 页 2 CN 115062105 A 2于, 所述文本预处 理包括如下步骤: 步骤1、 将文本中的书名、 关键词和摘要合并成关键信息, 再与关键信息所在行对应的 中国图书分类号 生成新的数据集; 步骤2、 剔除所述关键信息中的非中文信息和无用的中文信息; 步骤3、 对所述关键信息进行分词, 从词序列中剔除包 含于停用词表中的词。 10.如权利要求9所述的基于 内容关键词和神经网络的图书馆书籍分类方法, 其特征在 于, 所述文本向量 化包括如下步骤: 步骤1、 对所述词序列进行 数字编码; 步骤2、 将数字编码后的词序列进行截取或填充为长度为10 0的词向量; 步骤3、 将所述词向量 转换为张量形式获得向量数据。权 利 要 求 书 2/2 页 3 CN 115062105 A 3
专利 一种基于内容关键词和神经网络的图书馆书籍分类方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:07:27
上传分享
举报
下载
原文档
(523.7 KB)
分享
友情链接
GB-T 34590.1-2022 道路车辆 功能安全 第1部分:术语.pdf
SL-T 450—2021 堰塞湖风险等级划分与应急处置技术规范.pdf
GB-T 41339.4-2023 海洋生态修复技术指南 第4部分:海草床生态修复.pdf
T-CHTS 10045—2021 公路货运车辆超限超载动态监测系统技术要求.pdf
JR-T0138-2016 银团贷款业务技术指南.pdf
GB-T 13389-2014 掺硼掺磷掺砷硅单晶电阻率与掺杂剂浓度换算规程.pdf
企业云原生数据防泄漏(DLP)架构与运营实践指南--胡恺健 - 202206.pdf
GM-T 0079-2020 可信计算平台直接匿名证明规范.pdf
T-ZZB 1424—2019 节能低噪音三相干式电力变压器.pdf
GoogleCloud 自动化安全运营中心soc建设指南 OfficeofCISO AutonomicSecurityOperations 10x 英文 .pdf
T-ISC 0022—2023 数字孪生城市平台技术要求.pdf
GB-T 33565-2017 信息安全技术 无线局域网接入系统安全技术要求(评估保障级2级增强).pdf
GB-T 41870-2022 工业互联网平台 企业应用水平与绩效评价.pdf
HB 8675-2022 系留气球升空试验通用要求.pdf
2021-信通院-数据安全风险分析及应对策略研究.pdf
国家医疗保障局关于加强网络安全和数据保护工作的指导意见.pdf
GB-T 39622-2020 挖泥船重力抓斗.pdf
GB-T 37988-2019 信息安全技术 数据安全能力成熟度模型.pdf
GB-T 33697-2017 公路交通气象监测设施技术要求.pdf
GB/T 38825-2020 民用飞机复合材料制件铆接要求.pdf
1
/
3
10
评价文档
赞助2.5元 点击下载(523.7 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。