国家标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210546304.2 (22)申请日 2022.05.19 (71)申请人 丁子轩 地址 212001 江苏省镇江市京口区千秋桥 北6号5幢5 01室 (72)发明人 丁子轩 丁子恒 袁鑫妍 丁腊春  周莲英 武增辉 陆杨  (74)专利代理 机构 南京中高专利代理有限公司 32333 专利代理师 吴瑾 (51)Int.Cl. G16H 10/60(2018.01) G06N 3/08(2006.01) G06N 3/04(2006.01) G06K 9/62(2022.01)G06F 40/30(2020.01) G06V 10/764(2022.01) G06V 10/774(2022.01) (54)发明名称 一种基于四角 号码的电子病历文本分类系 统及方法 (57)摘要 本发明公开了一种基于四角 号码的电子病 历文本分类系统及方法, 通过先识别出电子病历 中的文字及图片, 再对文字及图片实现对应提 取, 将中文文字转换成经四角号码编码的数字形 式, 再根据四角号码的同码异字为中文文字进行 序号编码以及根据词性为中文文字进行词性编 码, 让中文文字转换成计算可识别的、 与中文文 字对应的以数字形式表征的文字编码, 同时将文 本中的图片进行数字图片值编码, 再通过编码拼 接模块形成与电子病历对应的电子病历编码, 以 实现电子病历的语义识别与文本分类的目标。 权利要求书2页 说明书8页 附图2页 CN 114822747 A 2022.07.29 CN 114822747 A 1.一种基于四角号码的电子病历文本分类系统, 其特 征在于: 所述系统包括: 电子病历读取模块, 所述电子病历读取模块读取电子病历信息; 电子病历图文识别模块, 所述电子病历图文识别模块连接电子病历读取模块以对电子 病历进行识别, 并将电子病历 中的文字送入电子病历文字提取模块, 将电子病历 中的图片 送入电子病历图片提取模块; 电子病历文字提取模块, 所述电子病历文字提取模块连接所述电子病历图文识别模块 以对识别出的电子病历中的文字进行提取; 电子病历图片提取模块, 所述电子病历图片提取模块连接所述电子病历图文识别模块 以对识别出的电子病历中的图片进行提取; 文字多层编码模块, 所述文字多层编码模块连接所述电子病历文字提取模块以对提取 的文字进行文字编码; 数字图片编码模块, 所述数字图片编码模块连接所述电子病历图片提取模块以对提取 的图片进行图片编码; 编码拼接模块, 所述编码拼接模块同时连接所述文字多层编码模块以及所述数字图片 编码模块, 以将文字编码和图片编码送入 对应的预设模型中以形成对应的电子病历编码; 电子病历分类模块, 所述电子病历分类模块通过卷积神经网络连接预设模型, 以对电 子病历编码进行分类; 病历分类存储模块, 病历分类存储模块根据分类后的电子病历编码对电子病历进行分 类存储。 2.根据权利要求1所述的一种基于四角号码的电子病历文本分类系统, 其特征在于: 所 述文字多层编 码模块包括四角号码层编 码模块、 序号层编 码模块、 以及词性层编 码模块, 所 述四角号码层编码模块根据提取的文字的对应四角号码进 行四角号码编码, 所述序号层编 码模块根据提取的文字的对应序号进 行序号编 码, 所述词性编 码模块根据提取的文字的对 应词性进行词性编码。 3.根据权利要求2所述的一种基于四角号码的电子病历文本分类系统, 其特征在于: 所 述四角号码层编码模块连接输入单元, 以通过输入单元预先向四角号码层编码模块录入与 文字对应的四角号码, 以及通过输入单元周期性向四角号码层编 码模块更新与文字对应的 四角号码。 4.根据权利要求2所述的一种基于四角号码的电子病历文本分类系统, 其特征在于: 所 述序号层编 码模块在提取的文字的对应四角号码相同时, 为提取的文字进 行相同四角号码 的序号编码。 5.根据权利要求2所述的一种基于四角号码的电子病历文本分类系统, 其特征在于: 所 述词性层编码模块进 行词性编码时根据的词性至少包括有常规词性、 姓氏词性、 代词词性、 数字词性、 字母词性、 及符号词性。 6.根据权利要求2所述的一种基于四角号码的电子病历文本分类系统, 其特征在于: 所 述文字多层编 码模块还包括彼此连接的优先需求单元和顺序确定单元, 所述优先需求单元 获取文本特征优先级, 以形成文本特征优先级指 令, 再将该指 令发送至顺序确定单元, 所述 顺序确定单 元根据文本特 征优先级对四角号码编码、 序号编码、 以及词性编码进行排序。 7.根据权利要求1所述的一种基于四角号码的电子病历文本分类系统, 其特征在于: 所权 利 要 求 书 1/2 页 2 CN 114822747 A 2述预设模型至少包括多层数据并行模型及单层数据串行模型。 8.根据权利要求7所述的一种基于四角号码的电子病历文本分类系统, 其特征在于: 所 述图片编码根据图片色彩选择进入多层数据并行模型及单层数据串行模型中的对应一种; 当图片色彩包括彩色时, 所述图片编码选择进入多层数据并行模型; 当图片色彩仅 为灰度时, 所述图片编码选择进入单层数据串行模型或多层数据并行模 型中的任意 一种。 9.根据权利要求8所述的一种基于四角号码的电子病历文本分类系统, 其特征在于: 所 述文字编码选择进入与所述图片编码相同的多层数据并行模型及单层数据串行模型中的 对应一种。 10.一种基于四角号码的电子病历文本分类方法, 其特征在于: 所述方法包括以下步 骤: 1)电子病历读取模块读取电子病历信息; 2)电子病历图文识别 模块对电子病历进行识别, 并将电子病历中的文字送入电子病历 文字提取模块, 将电子病历中的图片送入电子病历图片提取模块; 3)电子病历文字提取模块连接对识别出的电子病历中的文字进行提取; 电子病历图片 提取模块对识别出的电子病历中的图片进行提取; 4)文字多层编码模块对提取的文字进行文字编码; 数字图片编码模块连接所述电子病 历图片提取模块以对提取的图片进行图片编码; 5)编码拼接模块将文字编码和图片编码拼接后送入对应的预设模型中以形成对应的 电子病历编码; 6)电子病历分类模块 通过卷积神经网络对预设模型 形成的电子病历编码进行分类; 7)病历分类存 储模块根据分类后的电子病历编码对电子病历进行分类存 储。权 利 要 求 书 2/2 页 3 CN 114822747 A 3

.PDF文档 专利 一种基于四角号码的电子病历文本分类系统及方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于四角号码的电子病历文本分类系统及方法 第 1 页 专利 一种基于四角号码的电子病历文本分类系统及方法 第 2 页 专利 一种基于四角号码的电子病历文本分类系统及方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:07:35上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。