国家标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210546304.2 (22)申请日 2022.05.19 (71)申请人 丁子轩 地址 212001 江苏省镇江市京口区千秋桥 北6号5幢5 01室 (72)发明人 丁子轩 丁子恒 袁鑫妍 丁腊春 周莲英 武增辉 陆杨 (74)专利代理 机构 南京中高专利代理有限公司 32333 专利代理师 吴瑾 (51)Int.Cl. G16H 10/60(2018.01) G06N 3/08(2006.01) G06N 3/04(2006.01) G06K 9/62(2022.01)G06F 40/30(2020.01) G06V 10/764(2022.01) G06V 10/774(2022.01) (54)发明名称 一种基于四角 号码的电子病历文本分类系 统及方法 (57)摘要 本发明公开了一种基于四角 号码的电子病 历文本分类系统及方法, 通过先识别出电子病历 中的文字及图片, 再对文字及图片实现对应提 取, 将中文文字转换成经四角号码编码的数字形 式, 再根据四角号码的同码异字为中文文字进行 序号编码以及根据词性为中文文字进行词性编 码, 让中文文字转换成计算可识别的、 与中文文 字对应的以数字形式表征的文字编码, 同时将文 本中的图片进行数字图片值编码, 再通过编码拼 接模块形成与电子病历对应的电子病历编码, 以 实现电子病历的语义识别与文本分类的目标。 权利要求书2页 说明书8页 附图2页 CN 114822747 A 2022.07.29 CN 114822747 A 1.一种基于四角号码的电子病历文本分类系统, 其特 征在于: 所述系统包括: 电子病历读取模块, 所述电子病历读取模块读取电子病历信息; 电子病历图文识别模块, 所述电子病历图文识别模块连接电子病历读取模块以对电子 病历进行识别, 并将电子病历 中的文字送入电子病历文字提取模块, 将电子病历 中的图片 送入电子病历图片提取模块; 电子病历文字提取模块, 所述电子病历文字提取模块连接所述电子病历图文识别模块 以对识别出的电子病历中的文字进行提取; 电子病历图片提取模块, 所述电子病历图片提取模块连接所述电子病历图文识别模块 以对识别出的电子病历中的图片进行提取; 文字多层编码模块, 所述文字多层编码模块连接所述电子病历文字提取模块以对提取 的文字进行文字编码; 数字图片编码模块, 所述数字图片编码模块连接所述电子病历图片提取模块以对提取 的图片进行图片编码; 编码拼接模块, 所述编码拼接模块同时连接所述文字多层编码模块以及所述数字图片 编码模块, 以将文字编码和图片编码送入 对应的预设模型中以形成对应的电子病历编码; 电子病历分类模块, 所述电子病历分类模块通过卷积神经网络连接预设模型, 以对电 子病历编码进行分类; 病历分类存储模块, 病历分类存储模块根据分类后的电子病历编码对电子病历进行分 类存储。 2.根据权利要求1所述的一种基于四角号码的电子病历文本分类系统, 其特征在于: 所 述文字多层编 码模块包括四角号码层编 码模块、 序号层编 码模块、 以及词性层编 码模块, 所 述四角号码层编码模块根据提取的文字的对应四角号码进 行四角号码编码, 所述序号层编 码模块根据提取的文字的对应序号进 行序号编 码, 所述词性编 码模块根据提取的文字的对 应词性进行词性编码。 3.根据权利要求2所述的一种基于四角号码的电子病历文本分类系统, 其特征在于: 所 述四角号码层编码模块连接输入单元, 以通过输入单元预先向四角号码层编码模块录入与 文字对应的四角号码, 以及通过输入单元周期性向四角号码层编 码模块更新与文字对应的 四角号码。 4.根据权利要求2所述的一种基于四角号码的电子病历文本分类系统, 其特征在于: 所 述序号层编 码模块在提取的文字的对应四角号码相同时, 为提取的文字进 行相同四角号码 的序号编码。 5.根据权利要求2所述的一种基于四角号码的电子病历文本分类系统, 其特征在于: 所 述词性层编码模块进 行词性编码时根据的词性至少包括有常规词性、 姓氏词性、 代词词性、 数字词性、 字母词性、 及符号词性。 6.根据权利要求2所述的一种基于四角号码的电子病历文本分类系统, 其特征在于: 所 述文字多层编 码模块还包括彼此连接的优先需求单元和顺序确定单元, 所述优先需求单元 获取文本特征优先级, 以形成文本特征优先级指 令, 再将该指 令发送至顺序确定单元, 所述 顺序确定单 元根据文本特 征优先级对四角号码编码、 序号编码、 以及词性编码进行排序。 7.根据权利要求1所述的一种基于四角号码的电子病历文本分类系统, 其特征在于: 所权 利 要 求 书 1/2 页 2 CN 114822747 A 2述预设模型至少包括多层数据并行模型及单层数据串行模型。 8.根据权利要求7所述的一种基于四角号码的电子病历文本分类系统, 其特征在于: 所 述图片编码根据图片色彩选择进入多层数据并行模型及单层数据串行模型中的对应一种; 当图片色彩包括彩色时, 所述图片编码选择进入多层数据并行模型; 当图片色彩仅 为灰度时, 所述图片编码选择进入单层数据串行模型或多层数据并行模 型中的任意 一种。 9.根据权利要求8所述的一种基于四角号码的电子病历文本分类系统, 其特征在于: 所 述文字编码选择进入与所述图片编码相同的多层数据并行模型及单层数据串行模型中的 对应一种。 10.一种基于四角号码的电子病历文本分类方法, 其特征在于: 所述方法包括以下步 骤: 1)电子病历读取模块读取电子病历信息; 2)电子病历图文识别 模块对电子病历进行识别, 并将电子病历中的文字送入电子病历 文字提取模块, 将电子病历中的图片送入电子病历图片提取模块; 3)电子病历文字提取模块连接对识别出的电子病历中的文字进行提取; 电子病历图片 提取模块对识别出的电子病历中的图片进行提取; 4)文字多层编码模块对提取的文字进行文字编码; 数字图片编码模块连接所述电子病 历图片提取模块以对提取的图片进行图片编码; 5)编码拼接模块将文字编码和图片编码拼接后送入对应的预设模型中以形成对应的 电子病历编码; 6)电子病历分类模块 通过卷积神经网络对预设模型 形成的电子病历编码进行分类; 7)病历分类存 储模块根据分类后的电子病历编码对电子病历进行分类存 储。权 利 要 求 书 2/2 页 3 CN 114822747 A 3
专利 一种基于四角号码的电子病历文本分类系统及方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:07:35
上传分享
举报
下载
原文档
(584.0 KB)
分享
友情链接
DB37-T 3304-2018 信息安全技术 云计算运维安全管理规范 山东省.pdf
LY-T 3159-2019 细木工板生产节能技术规范.pdf
GB-T 43269-2023 信息安全技术 网络安全应急能力评估准则.pdf
GB-T 10045-2018 非合金钢及细晶粒钢药芯焊丝.pdf
GB-T 19483-2016 无绳电话的电磁兼容性要求及测量方法.pdf
思度安全-DSMM-007 数据脱敏安全管理规范V1.0.pdf
GB-T 3782-2016 乙炔炭黑.pdf
关于档案部门使用政务云平台过程中加强档案信息安全管理的意见.pdf
T-HMDSXH 003—2022 电商产业园区数字化建设与管理指南.pdf
商用密码应用安全性测评机构管理办法(试行).pdf
GMT 0051-2016 密码设备管理 对称密钥管理技术规范.pdf
GB-T 32914-2016 信息安全技术 信息安全服务提供方管理要求.pdf
DB13-T 5406-2021 耕地地力主要指标分级诊断 河北省.pdf
思度安全-DSMM-012 数据接口安全管理规范V1.0.pdf
GB-T 18867-2014 电子工业用气体 六氟化硫.pdf
GB-T 26765-2023 机动车安全技术检验业务信息系统及联网规范.pdf
GB-T 35274-2017 信息安全技术 大数据服务安全能力要求 .pdf
GB-T 32064-2015 建筑用材料导热系数和热扩散系数瞬态平面热源测试法.pdf
GB-T 42708-2023 金融网络安全威胁信息共享指南.pdf
GB-T 35381.1-2017 农林拖拉机和机械 串行控制和通信数据网络 第1部分:数据通信通用标准.pdf
1
/
3
13
评价文档
赞助2.5元 点击下载(584.0 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。