国家标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210563887.X (22)申请日 2022.05.23 (71)申请人 北京爱奇艺科技有限公司 地址 100080 北京市海淀区海淀北一 街2号 11层1101 (72)发明人 张轩玮 (74)专利代理 机构 北京润泽恒知识产权代理有 限公司 1 1319 专利代理师 吕俊秀 (51)Int.Cl. G06F 40/58(2020.01) G06F 40/30(2020.01) G06F 40/284(2020.01) (54)发明名称 一种文本翻译方法、 装置、 电子设备及存储 介质 (57)摘要 本申请提供一种文本翻译方法、 装置、 电子 设备及存储介质, 该方法包括: 在待翻译为目标 语言的第一文本包括第一短语的情况下, 将第一 短语替换为第一目标人名并标记得到第二文本, 第一目标人名对应于目标语言、 第一短语对应于 源语言, 第一短语对应于人名语义和至少一种非 人名语义, 且第一短语在第一文本中的真实语义 为人名; 将第二文本输入目标翻译模 型获取目标 文本; 目标翻译模型用于识别处于标记状态的第 一目标人名并输出、 将第二文本中区别于第一目 标人名的文本翻译为目标语言并输出。 本申请可 以防止第一短语在需要翻译为人名语义词语时 被翻译为非人名语义的词语, 从而可以准确地翻 译第一文本, 提高了文本翻译的准确度。 权利要求书2页 说明书9页 附图1页 CN 115062631 A 2022.09.16 CN 115062631 A 1.一种文本翻译方法, 其特 征在于, 所述方法包括: 在待翻译为目标语言的第 一文本包括第 一短语的情况下, 将所述第 一短语替换为第 一 目标人名并标记, 得到第二文本, 所述第一目标人名对应于所述目标语 言、 所述第一短语对 应于源语言, 所述第一短语对应于人名语义和至少一种非人名语义, 且所述第一短语在所 述第一文本中的真实语义 为人名; 将所述第二文本 输入目标翻译模型, 获取 所述第一文本对应的目标文本; 其中, 所述目标翻译模型用于识别处于标记状态的所述第一目标人名并输出、 将所述 第二文本中区别于所述第一目标人名的文本翻译为所述目标语言并输出, 所述目标文本对 应于所述目标语言。 2.根据权利要求1所述的文本翻译方法, 其特征在于, 在所述将所述第 一短语替换为第 一目标人名并标记之前, 所述方法还 包括: 获取包括所述第 一文本的文本集合对应的人名库, 所述人名库中存储有所述文本集合 对应的至少一个第一人名, 所述第一人名对应于 至少一种非人名语义; 在检测到所述第 一文本包括所述第 一人名的情况下, 将所述第 一文本中的第 一人名确 定为所述第一短语。 3.根据权利要求2所述的文本翻译方法, 其特征在于, 所述人名库包括每一第 一人名分 别对应的目标 人名; 所述方法还 包括: 在所述人名库中, 检索与所述第一短语对应的目标 人名; 将检索到的所述目标 人名确定为所述第一目标 人名。 4.根据权利要求1所述的文本翻译方法, 其特征在于, 所述将所述第 一短语替换为第 一 目标人名并标记, 包括: 在所述第一目标 人名之前插 入第一符号, 在所述第一目标 人名之后插 入第二符号; 其中, 所述第一符号为指示开始识别的初始符号、 所述第二符号为指示停止识别的终 止符号。 5.根据权利要求4所述的文本翻译方法, 其特征在于, 所述将所述第 二文本输入目标翻 译模型, 获取 所述第一文本对应的目标文本, 包括: 基于所述目标翻译模型对所述第 一符号和所述第 二符号进行识别, 确定处于标记状态 的所述第一目标 人名; 基于所述目标翻译模型对所述第 二文本中区别于所述第 一目标人名的文本进行翻译, 得到对应于所述目标语言的第三文本; 基于所述目标翻译模型将所述目标人名复制到所述第 三文本中的目标位置, 得到所述 目标文本; 其中, 所述目标位置基于所述第一目标 人名在所述第二文本中的位置确定 。 6.根据权利要求1所述的文本翻译方法, 其特 征在于, 所述方法还 包括: 获取多个训练文本, 所述训练文本对应于所述源语言, 所述训练文本中包括被标记的 第二短语, 所述第二短语对应于所述目标语言; 针对每一所述训练文本, 获取所述训练文本对应的第一翻译文本, 所述第一翻译文本 对应于所述目标语言;权 利 要 求 书 1/2 页 2 CN 115062631 A 2根据多个所述训练文本以及每个所述训练文本对应的所述第 一翻译文本, 进行模型训 练, 在完成一次模型训练之后, 获取所述第一翻译文本与第二翻译文本的匹配度, 所述第二 翻译文本为训练得到的翻译模型的输出 结果; 在所述匹配度小于预设比例时, 重复模型训练的过程, 直至所述第一翻译文本与第二 翻译文本的匹配度大于所述预设比例时, 停止模型训练, 获取 所述目标翻译模型。 7.一种文本翻译装置, 其特 征在于, 所述装置包括: 处理模块, 用于在待翻译为目标语言的第一文本包括第一短语的情况下, 将所述第一 短语替换为第一目标人名并标记, 得到第二文本, 所述第一目标人名对应于所述目标语言、 所述第一短语对应于源语言, 所述第一短语对应于人名语义和至少一种非人名语义, 且所 述第一短语在所述第一文本中的真实语义 为人名; 第一获取模块, 用于将所述第二文本输入目标翻译模型, 获取所述第一文本对应的目 标文本; 其中, 所述目标翻译模型用于识别处于标记状态的所述第一目标人名并输出、 将所述 第二文本中区别于所述第一目标人名的文本翻译为所述目标语言并输出, 所述目标文本对 应于所述目标语言。 8.一种电子设备, 其特 征在于, 包括: 至少一个处 理器; 以及 与所述至少一个处理器通信连接的存储器; 其中, 所述存储器存储有可被所述至少一 个处理器执行 的指令, 所述指令被所述至少一个处理器执行, 以使所述至少一个处理器能 够执行权利要求1至 6中任一项所述的文本翻译方法。 9.一种存储有计算机指令的非瞬时计算机可读存储介质, 其特征在于, 所述计算机指 令用于使所述计算机执 行权利要求1至 6中任一项所述的文本翻译方法。 10.一种计算机程序产品, 其特征在于, 包括计算机程序, 所述计算机程序在被处理器 执行时实现权利要求1至 6中任一项所述的文本翻译方法。权 利 要 求 书 2/2 页 3 CN 115062631 A 3
专利 一种文本翻译方法、装置、电子设备及存储介质
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 14:09:20
上传分享
举报
下载
原文档
(449.8 KB)
分享
友情链接
LD-T04-2022 人力资源社会保障网络安全监测和应急处置规范.pdf
DB61-T 1358-2020 曳引驱动家用电梯检验规范 陕西省.pdf
专利 隐私计算、隐私数据和联邦学习的互联互通方法及装置.PDF
DL-T 920-2019 六氟化硫气体中空气、四氟化碳、六氟乙烷和八氟丙烷的测定 气相色谱法.pdf
NB-T 10607—2021 水力发电厂门禁系统设计导则.pdf
DB15-T 1874—2020 公共大数据安全管理指南 内蒙古自治区.pdf
GB-T 38408-2019 皮革 材质鉴别 显微镜法.pdf
DB37-T 4440.3—2021 城市轨道交通互联互通体系规范 信号系统 第3部分:工程设计 山东省.pdf
GB-T 29307-2022 电动汽车用驱动电机系统可靠性试验方法.pdf
T-SHPPA 010—2021 药品生产数字化质量保证技术要求.pdf
GB-T 18513-2022 中国主要进口木材名称.pdf
GB-T 35394-2017 无损检测 X射线数字成像检测 系统特性.pdf
T-CFA 03110323—2022 铸件加工单元数字化技术要求.pdf
GB 18384-2020 电动汽车安全要求.pdf
GB-T 28827.7-2022 信息技术服务 运行维护 第7部分:成本度量规范.pdf
GB-T 30998-2014信息技术软件安全保障规范.pdf
GB-T 30583-2014 承压设备焊后热处理规程.pdf
GB-T 37580-2019 聚乙烯 PE 埋地燃气管道腐蚀控制工程全生命周期要求.pdf
GB-T 16604-2017 涤纶工业长丝.pdf
JR-T 0002-2016 银行卡自动柜员机(ATM)终端技术规范.pdf
1
/
3
13
评价文档
赞助2.5元 点击下载(449.8 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。