国家标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210657254.5 (22)申请日 2022.06.10 (71)申请人 达而观数据 (成 都) 有限公司 地址 610000 四川省成 都市中国 (四川) 自 由贸易试验区成都市天府新区湖畔路 北段366号1栋3楼1号 (72)发明人 吴万杰 文敏 白良俊 纪传俊 纪达麒 陈运文 (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 马迪 (51)Int.Cl. G06V 30/148(2022.01) G06V 30/19(2022.01) G06V 30/41(2022.01)G06F 40/295(2020.01) G06F 40/30(2020.01) (54)发明名称 一种图像的语义识别方法、 装置、 设备和存 储介质 (57)摘要 本发明公开了一种图像的语义识别方法、 装 置、 设备和存储介质。 包括: 根据样本字符识别结 果进行训练获取信息抽取训练模 型; 对待测图像 进行光学字符识别获取待测字 符识别结果; 根据 待测字符识别结果进行分割处理获取待测语料, 将待测语料输入信息抽取训练模型获取待测图 像的语义识别结果。 通过较少的样 本字符识别结 果进行训练所 获取的信息抽取训练模 型, 来对待 测字符识别结果进行信息抽取, 从而在无需大量 标注数据的情况下, 就可以实现对 具有多样式文 本分布的图像进行有效的语义识别。 权利要求书2页 说明书9页 附图3页 CN 114898374 A 2022.08.12 CN 114898374 A 1.一种图像的语义识别方法, 其特 征在于, 包括: 根据样本 字符识别结果进行训练获取信息抽取训练模型; 对待测图像进行光学字符识别获取待测字符识别结果; 根据所述待测字符识别结果进行分割处理获取待测语料, 将所述待测语料输入所述信 息抽取训练模型获取 所述待测图像的语义识别结果。 2.根据权利要求1所述的方法, 其特征在于, 所述根据样本字符识别文本进行训练获取 信息抽取训练模型之前, 还 包括: 获取样本图像, 其中, 所述样本图像中包 含字符; 对所述样本图像进行光学字符识别获取包含文本信息和文本位置的所述样本字符识 别结果, 其中, 所述文本位置包含所述文本信息在所述样本图像的起始点位置、 高度和宽 度。 3.根据权利要求1所述的方法, 其特征在于, 所述根据样本字符识别结果进行训练获取 信息抽取训练模型, 包括: 对所述样本字符识别结果按照指定特征进行聚类获取初始簇团, 其中, 每个初始簇团 中包含至少一个完整语义; 对所述初始簇团进行去噪处理获取样本簇团, 并根据所述样本簇团进行训练获取信 息 抽取训练模型。 4.根据权利要求3所述的方法, 其特征在于, 所述根据所述样本簇团进行训练获取信 息 抽取训练模型, 包括: 确定实体抽取模板, 并根据 所述实体抽取模板和所述样本簇团构建训练语料, 其中, 每 个所述训练语料中包 含实体抽取模板的置信度; 根据所述训练语料对初始信息模型进行训练, 获取 所述信息抽取训练模型。 5.根据权利要求1所述的方法, 其特征在于, 所述对待测图像进行光学字符识别获取待 测字符识别结果, 包括: 对所述待测图像进行光学字符识别获取文本信息和文本位置的所述待测字符识别结 果, 其中, 所述文本位置包 含所述文本信息在所述待测图像的起始点 位置、 高度和宽度。 6.根据权利要求4所述的方法, 其特征在于, 所述根据所述待测字符识别结果进行分割 处理获取待测语料, 将所述待测语料输入所述信息抽取训练模型获取所述待测图像的语义 识别结果, 包括: 对所述待测字符识别结果进行聚类处 理获取待测簇团; 根据所述实体抽取模板和所述待测簇团构建待测语料, 其中, 每个待测语料对应至少 两个实体抽取模板; 将所述待测语料输入所述信 息抽取训练模型, 获取待测语料所对应的每个实体抽取模 板的语言概 率; 获取概率最高的实体抽取模板, 并将所述实体抽取模板对应的实体作为所述待测图像 的语义识别结果。 7.根据权利要求1所述的方法, 其特征在于, 所述将所述待测语料输入所述信 息抽取训 练模型获取 所述待测图像的语义识别结果之后, 还 包括: 对所述语义识别结果进行检测;权 利 要 求 书 1/2 页 2 CN 114898374 A 2当确定检测结果 不符合要求时进行报警提 示。 8.一种图像的语义识别装置, 其特 征在于, 包括: 模型训练模块, 用于根据样本 字符识别结果进行训练获取信息抽取训练模型; 待测字符识别结果获取模块, 用于对待测图像进行光学字符识别获取待测字符识别结 果; 语义识别模块, 用于根据所述待测字符识别结果进行分割处理获取待测语料, 将所述 待测语料输入所述信息抽取训练模型获取 所述待测图像的语义识别结果。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所 述至少一个处理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑7中任一项所述的 方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机指 令, 所述计算机指令用于使处 理器执行时实现权利要求1 ‑7中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114898374 A 3
专利 一种图像的语义识别方法、装置、设备和存储介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:07:09
上传分享
举报
下载
原文档
(539.6 KB)
分享
友情链接
YD T 1730-2024 电信网和互联网安全风险评估规范.pdf
GB-T 2847-2005 用于水泥中的火山灰质混合材料.pdf
GB-T 43575-2023 区块链和分布式记账技术 系统测试规范.pdf
GB/T 36448-2018 集装箱式数据中心机房通用规范.pdf
防病毒安全管理制度.pdf
GB-T 17314-2011 籼型杂交水稻三系原种生产技术操作规程.pdf
GB-T 27563-2011 工业用N-甲基-2-吡咯烷酮.pdf
DB35-T 1771-2018 印度豇豆栽培与利用技术规范 福建省.pdf
GB 21347-2023 工业硅和镁单位产品能源消耗限额.pdf
YD-T 4177.1-2022 移动互联网应用程序(APP)收集使用个人信息最小必要评估规范 第1部分:总则.pdf
东吴证券 AI搜索行业深度 大模型催生搜索行业变革机遇,产品百花齐放效果几何 .pdf
YD-T 面向云计算的安全运营中心能力要求 送审稿.pdf
DB3302-T 165-2018 杨梅矮化早果丰产栽培技术规程 宁波市.pdf
GB-T 35121-2017 全程供应链管理服务平台参考功能框架.pdf
GB-T 16277-2021 道路施工与养护机械设备 沥青混凝土摊铺机.pdf
GB-T 1859.2-2015 往复式内燃机 声压法声功率级的测定 第2部分:简易法.pdf
GB-T 28123-2011 工业氦.pdf
GB-T 3220-2011 集装箱吊具.pdf
GB-T 40170-2021 质粒抽提及检测通则.pdf
GB-T 34960.4-2017信息技术服务治理第4部分审计导则.pdf
1
/
3
15
评价文档
赞助2.5元 点击下载(539.6 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。