国家标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210574304.3 (22)申请日 2022.05.25 (71)申请人 湖南中医药大学 地址 410208 湖南省长 沙市岳麓区含浦科 教园象嘴路1号湖南中 医药大学 (72)发明人 丁长松 高婉卿 李力松 黄辛迪 梁杨 (74)专利代理 机构 长沙瀚顿知识产权代理事务 所(普通合伙) 43223 专利代理师 吴亮 朱敏 (51)Int.Cl. G16H 70/40(2018.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于特征偏差对齐的方剂功效分类方 法 (57)摘要 本发明公开了一种基于特征偏差对齐的方 剂功效分类方法, 包括以下步骤: S1, 数据预处理 模块: 将方剂以最小语义单元进行划分, 对同物 异名中药进行替换, 利用语言模 型对最小语义单 元进行预训练; S2, 数据增广模块: 基于方剂语义 单元顺序性弱的特点, 对原始样 本进行随机乱序 处理, 生成副样本, 所述原始样本与所述副样本 共同构成训练样本; S3, 深度学习特征提取网络 模块: 采用深度学习模型对所述训练样本进行特 征提取, 得到训练样本 特征图; S4, 特征偏差对齐 无参网络模块: 基于度量学习, 对所述训练样本 特征图进行偏差计算; S5, 融合特征偏差对齐的 优化函数: 将所述训练样本特征图偏差计算作为 交叉熵损失函数的正则项, 共同参与网络参数的 更新计算, 提升网络样本特 征的学习能力。 权利要求书2页 说明书7页 附图1页 CN 114822874 A 2022.07.29 CN 114822874 A 1.一种基于特 征偏差对齐的方剂功效分类方法, 其特 征在于, 所述方法包括以下步骤: S1, 数据预处理模块: 将方剂以最小语义单元进行划分, 对同物异名中药进行替换, 利 用语言模型对最小语义单 元进行预训练; S2, 数据增广模块: 基于方剂语义单元顺序性弱的特点, 对原始样本进行随机乱序处 理, 生成副样本, 所述原 始样本与所述副样本共同构成训练样本; S3, 深度学习特征提取网络模块: 采用深度学习模型对所述训练样本进行特征提取, 得 到训练样本特 征图; S4, 特征偏差对齐无参网络模块: 基于度量学习, 对所述训练样本特征图进行偏差计 算; S5, 融合特征偏差对齐的优化函数: 将所述训练样本特征图偏差计算作为交叉熵损失 函数的正则项, 共同参与网络参数的更新计算, 提升网络样本特 征的学习能力。 2.根据权利要求1所述的方剂功效分类方法, 其特征在于, 在步骤S1的所述数据 预处理 模块中, 利用方剂组成弱语序特点, 采用人工智能技术提升深度学习模型在方剂功效分类 上的性能。 3.根据权利要求1所述的方剂功效分类方法, 其特征在于, 步骤S1的所述数据预处理模 块还包括: S11, 中药单元抽取, 针对方剂数据, 以每味中药名为最小语义单元, 进行原始方剂组成 划分与清洗; S12, 最小语义单元替换, 构建中药别名库, 针对方剂中存在的同物异名、 同名异物中药 进行替换; S13, 中药向量化表示, 采用自然语言处理领域词向量技术, 对方剂样本进行预训练, 获 得中药的初始化向量表示。 4.根据权利要求3所述的方剂功效分类方法, 其特征在于, 步骤S11的所述中药单元抽 取中, 以有功效的方剂数据为有标签方剂数据, 无功效的方剂数据为无标签方剂数据; 以所 述无标签方剂数据进 行无监督的语言模型训练, 所述有标签方剂数据中的中药进 行检索获 得对应的词向量表示。 5.根据权利要求1所述的方剂功效分类方法, 其特征在于, 步骤S2所述数据增广模块 中, 对每一个方剂样本中的中药组成进行随机排序, 改变原有的顺序, 形成一个副样本, 其 他特征均不改变, 所述原 始样本与所述副样本共同构成训练样本 。 6.根据权利要求5所述的方剂功效分类方法, 其特征在于, 步骤S3中所述深度学习特征 提取网络模块中, 采用深度学习模型进行特征提取, 所述原始样本与所述副样本同时进行 训练, 得到所述训练样本的特征图, 将训练样本特征图进行归一化得到模型预测的所述原 始样本与所述副样本标签分布结果。 7.根据权利要求1所述的方剂功效分类方法, 其特征在于, 步骤S4的所述特征偏差对齐 无参网络模块中, 采用度量学习方法, 对比所述原始样本与所述副样本的预测输出是否相 等; 若相等, 则表明网络对所述原 始样本与所述副样本学习到 了相近的特 征; 若不相等, 则表明网络对所述原 始样本与所述副样本学习到的特 征存在差异。 8.根据权利要求7所述的方剂功效分类方法, 其特征在于, 所述原始样本与 所述副样本权 利 要 求 书 1/2 页 2 CN 114822874 A 2预测输出不相等时, 利用距离公式计算所述原始样本的特征图和所述副 样本的特征图 以及 预测输出之间的距离; 相等, 赋予0值。 9.根据权利要求1所述的方剂功效分类方法, 其特征在于, 步骤S5的所述融合特征偏差 对齐的优化函数, 对所述原始样本、 所述副样本和所述原始样本的真实标签进行交叉熵损 失计算; 将所述原始样本、 所述副 样本的特征图距离、 所述原始样本与所述副 样本标签分布 距离作为交叉熵计算的正则项参与网络的可训练参数的梯度计算, 进行参数 更新。 10.根据权利要求9所述的方剂功效分类方法, 其特征在于, 训练完成后的深度学习模 型, 用以方剂功效分类。权 利 要 求 书 2/2 页 3 CN 114822874 A 3
专利 一种基于特征偏差对齐的方剂功效分类方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:08:18
上传分享
举报
下载
原文档
(540.3 KB)
分享
友情链接
YD-T 4194-2023 5G终端基于NR的语音解决方案(VoNR)技术要求.pdf
NY-T 4261-2022 农业大数据安全管理指南.pdf
GB-T 30825-2014 热处理温度测量.pdf
GB-T 28788-2012 公路地理信息数据采集与质量控制.pdf
T-GDATCM 0009—2023 厚朴 厚朴 煮散饮片.pdf
MZ-T 156-2020 低视力康复服务规范.pdf
GB-T 41974.1-2022 塑料 色母料 第1部分:命名系统和分类基础.pdf
GB-T 24421.4-2023 服务业组织标准化工作指南 第4部分:标准实施及评价.pdf
GB-T 42467.8-2023 中医临床名词术语 第8部分:眼科学.pdf
T-CNHAW 0011—2024 干眼诊疗中心分级建设要求.pdf
GB-T 32924-2016 信息安全技术 网络安全预警指南.pdf
T-QGCML 544—2022 井下移动瓦斯抽采泵站建设规范.pdf
GB-T 22939.6-2008 家用和类似用途电器包装 电冰箱的特殊要求.pdf
GB-T 42467.4-2023 中医临床名词术语 第4部分:肛肠科学.pdf
Oracle安全配置基线.doc
T-CRHA 019—2023 人胆系上皮组织类器官构建、质量控制与保藏操作指南.pdf
GB-T 24106-2009 岩土工程仪器术语及符号.pdf
GB-T 32394-2015 信息技术 中文Linux操作系统运行环境扩充要求.pdf
GB-T 40692-2021 政务信息系统定义和范围.pdf
GB-T 42767-2023 城市垃圾收集装置设置通用要求.pdf
1
/
3
11
评价文档
赞助2.5元 点击下载(540.3 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。