国家标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210671093.5 (22)申请日 2022.06.14 (71)申请人 广州探迹科技有限公司 地址 510000 广东省广州市番禺区小谷围 街青蓝街26号5 03 (72)发明人 陈开冉 黎展 谢智权 黄东阳 (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 陈志明 (51)Int.Cl. G06F 40/295(2020.01) G06F 40/30(2020.01) G06F 40/247(2020.01) G06F 40/242(2020.01) G06K 9/62(2022.01) (54)发明名称 一种基于提示的命名实体识别方法、 装置及 终端设备 (57)摘要 本发明公开了本发明提供了一种基于提示 的命名实体识别方法、 装置及终端设备, 通过结 合待测语句与提示语集合中的提示语, 将结合提 示语的待测语句输入到预训练模型中进行命名 实体的识别, 相比于现有技术通过大量的计算资 源和微调数据进行预训练模型微调, 本发明通过 提示语的设计, 能够挖掘预训练模 型潜在的语义 能力, 使得预训练模型在提示语的作用下则增强 了识别效果, 有利于预训练模型能够依据少量数 据进行命名实体识别, 从而提高了命名实体识别 的效率。 权利要求书2页 说明书10页 附图2页 CN 115034223 A 2022.09.09 CN 115034223 A 1.一种基于提 示的命名实体识别方法, 其特 征在于, 包括: 获取待测语句; 根据预设的提 示语集合, 获得所述待测语句的提 示语; 将所述待测语句和所述提示语, 输入至预训练模型中, 获得所述待测语句的生成式命 名实体。 2.根据权利要求1所述的基于提示的命名实体识别方法, 其特征在于, 在所述获得所述 待测语句的生成式命名实体之后, 还 包括: 通过预设的同义词集合对所述生成式命名实体进行映射, 获得生成式命名实体的若干 个同义词汇; 根据所述若干个同义词汇, 分别与所述待测语句进行匹配, 获得最优 命名实体。 3.根据权利要求2所述的基于提示的命名实体识别方法, 其特征在于, 所述根据 所述若 干个同义词汇, 与所述待测语句进行匹配, 获得最优 命名实体, 具体为: 根据所述若干个同义词汇, 分别与待测语句的每 个语句进行匹配, 获得相似度; 根据相似度最高的同义词汇, 获得 所述最优命名实体。 4.根据权利要求3所述的基于提示的命名实体识别方法, 其特征在于, 所述提示语集合 的训练方法, 包括: 获取待训练实体类型, 将所述待训练实体类型输入至词向量模型中, 获得所述待训练 实体类型的词向量; 根据所述待训练实体类型的词向量, 通过余弦距离计算, 获得若干个待训练实体类型 的相似词; 其中, 所述待训练实体类型 的词向量分别与所述若干个相似词的词向量之间的 余弦距离小于预设值; 根据所述待训练实体 类型和所述若干个相似词, 设计若干个待选提 示语; 分别测试所述若干个待选提示语的验证指标, 根据验证指标达到预设值的待选提示 语, 获得所述提示语集合。 5.根据权利要求2所述的基于提示的命名实体识别方法, 其特征在于, 所述同义词集合 的训练方法, 包括: 获取命名词典; 其中, 所述命名词典由开源数据构建; 根据所述命名词典中的每 个原词汇, 通过词向量模型, 获得每 个所述原词汇的相似词; 分别测试每个所述原词汇的相似词的验证指标, 根据验证指标达到预设值的相似词, 作为每个所述原词汇的同义词汇; 汇总每个所述原词汇以及对应的同义词汇, 获得 所述同义词集 合。 6.根据权利要求3至5任一所述的基于提示的命名实体识别方法, 其特征在于, 所述词 向量模型的训练方法, 包括: 获取命名词典; 其中, 所述命名词典由开源数据构建; 根据所述命名词典的所有词汇, 分别输入至预训练模型中, 获得每 个词汇的高维向量; 根据每个词汇的高维向量, 获得每 个词汇的词向量。 7.根据权利要求2所述的基于提示的命名实体识别方法, 其特征在于, 所述将所述待测 语句和所述 提示语, 输入至预训练模型中, 获得 所述待测语句的生成式命名实体, 具体为: 所述提示语包括若干个备选提 示语;权 利 要 求 书 1/2 页 2 CN 115034223 A 2将所述待测语句分别和所述若干个备选提 示语互相组合, 获得若干个拼接语句; 将所述若干个拼接语句分别输入到预训练模型中, 获得若干个待选命名实体; 在所述若干个待选命名实体中, 计算重合度, 将重合度最高的待选命名实体输出为生 成式命名实体。 8.一种基于提示的命名实体识别装置, 其特征在于, 包括: 数据获取模块、 提示语获取 模块和数据生成模块; 所述数据获取模块, 用于获取待测语句; 所述提示语获取模块, 用于根据预设的提 示语集合, 获得所述待测语句的提 示语; 所述数据生成模块, 用于将所述待测语句和所述提示语, 输入至预训练模型中, 获得所 述待测语句的生成式命名实体。 9.一种计算机终端设备, 其特征在于, 包括处理器、 存储器以及存储在所述存储器 中且 被配置为由所述处理器执行的计算机程序, 所述处理器执行所述计算机程序时实现如权利 要求1至7中任意 一项所述的一种基于提 示的命名实体识别方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质包括存储的计算 机程序, 其中, 在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权 利要求1至7中任意 一项所述的一种基于提 示的命名实体识别方法。权 利 要 求 书 2/2 页 3 CN 115034223 A 3
专利 一种基于提示的命名实体识别方法、装置及终端设备
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:07:55
上传分享
举报
下载
原文档
(412.4 KB)
分享
友情链接
青海省节能监察办法.pdf
GB-T 32918.2-2016 信息安全技术 SM2椭圆曲线公钥密码算法 第2部分:数字签名算法.pdf
GB-T 42777-2023 基于文本数据的金融风险防控 知识图谱构建技术框架指南.pdf
GB-T 25745-2010 铸造铝合金热处理.pdf
GB-T 14728.2-2008 双臂操作助行器具 要求和试验方法 第2部分:轮式助行架.pdf
T-SXAGS 0012—2020 山西好粮油 小麦粉.pdf
YD-T 0219-2019 电信网和互联网数据安全评估规范.pdf
T-NIFA 26—2023 移动金融客户端应用软件上架资质指引.pdf
GB-T 43026-2023 公共安全视频监控联网信息安全测试规范.pdf
数据资产管理制度.pdf
CSA 医疗健康网络安全手册.pdf
YD-T 4011-2022 5G网络管理技术要求 总体要求.pdf
GB-T 39662-2020 基金行业数据集中备份接口规范.pdf
GB-T 36007-2018 锄草机器人通用技术条件.pdf
YD-T 2699-2014 电信网和互联网安全防护基线配置要求及检测要求-安全设备.pdf
NY-T 2922-2016 梨种质资源描述规范.pdf
T-NMAAA 0002—2021 营运机动车停运损失鉴定评估规范.pdf
GB-T 33452-2016 洗染术语.pdf
DB52-T 1636.1-2021 机关事务云 第1部分:数据技术要求 贵州省.pdf
CISSP官方学习指南(OSG)第9版 中文版.pdf
1
/
3
15
评价文档
赞助2.5元 点击下载(412.4 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。