国家标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210563887.X (22)申请日 2022.05.23 (71)申请人 北京爱奇艺科技有限公司 地址 100080 北京市海淀区海淀北一 街2号 11层1101 (72)发明人 张轩玮  (74)专利代理 机构 北京润泽恒知识产权代理有 限公司 1 1319 专利代理师 吕俊秀 (51)Int.Cl. G06F 40/58(2020.01) G06F 40/30(2020.01) G06F 40/284(2020.01) (54)发明名称 一种文本翻译方法、 装置、 电子设备及存储 介质 (57)摘要 本申请提供一种文本翻译方法、 装置、 电子 设备及存储介质, 该方法包括: 在待翻译为目标 语言的第一文本包括第一短语的情况下, 将第一 短语替换为第一目标人名并标记得到第二文本, 第一目标人名对应于目标语言、 第一短语对应于 源语言, 第一短语对应于人名语义和至少一种非 人名语义, 且第一短语在第一文本中的真实语义 为人名; 将第二文本输入目标翻译模 型获取目标 文本; 目标翻译模型用于识别处于标记状态的第 一目标人名并输出、 将第二文本中区别于第一目 标人名的文本翻译为目标语言并输出。 本申请可 以防止第一短语在需要翻译为人名语义词语时 被翻译为非人名语义的词语, 从而可以准确地翻 译第一文本, 提高了文本翻译的准确度。 权利要求书2页 说明书9页 附图1页 CN 115062631 A 2022.09.16 CN 115062631 A 1.一种文本翻译方法, 其特 征在于, 所述方法包括: 在待翻译为目标语言的第 一文本包括第 一短语的情况下, 将所述第 一短语替换为第 一 目标人名并标记, 得到第二文本, 所述第一目标人名对应于所述目标语 言、 所述第一短语对 应于源语言, 所述第一短语对应于人名语义和至少一种非人名语义, 且所述第一短语在所 述第一文本中的真实语义 为人名; 将所述第二文本 输入目标翻译模型, 获取 所述第一文本对应的目标文本; 其中, 所述目标翻译模型用于识别处于标记状态的所述第一目标人名并输出、 将所述 第二文本中区别于所述第一目标人名的文本翻译为所述目标语言并输出, 所述目标文本对 应于所述目标语言。 2.根据权利要求1所述的文本翻译方法, 其特征在于, 在所述将所述第 一短语替换为第 一目标人名并标记之前, 所述方法还 包括: 获取包括所述第 一文本的文本集合对应的人名库, 所述人名库中存储有所述文本集合 对应的至少一个第一人名, 所述第一人名对应于 至少一种非人名语义; 在检测到所述第 一文本包括所述第 一人名的情况下, 将所述第 一文本中的第 一人名确 定为所述第一短语。 3.根据权利要求2所述的文本翻译方法, 其特征在于, 所述人名库包括每一第 一人名分 别对应的目标 人名; 所述方法还 包括: 在所述人名库中, 检索与所述第一短语对应的目标 人名; 将检索到的所述目标 人名确定为所述第一目标 人名。 4.根据权利要求1所述的文本翻译方法, 其特征在于, 所述将所述第 一短语替换为第 一 目标人名并标记, 包括: 在所述第一目标 人名之前插 入第一符号, 在所述第一目标 人名之后插 入第二符号; 其中, 所述第一符号为指示开始识别的初始符号、 所述第二符号为指示停止识别的终 止符号。 5.根据权利要求4所述的文本翻译方法, 其特征在于, 所述将所述第 二文本输入目标翻 译模型, 获取 所述第一文本对应的目标文本, 包括: 基于所述目标翻译模型对所述第 一符号和所述第 二符号进行识别, 确定处于标记状态 的所述第一目标 人名; 基于所述目标翻译模型对所述第 二文本中区别于所述第 一目标人名的文本进行翻译, 得到对应于所述目标语言的第三文本; 基于所述目标翻译模型将所述目标人名复制到所述第 三文本中的目标位置, 得到所述 目标文本; 其中, 所述目标位置基于所述第一目标 人名在所述第二文本中的位置确定 。 6.根据权利要求1所述的文本翻译方法, 其特 征在于, 所述方法还 包括: 获取多个训练文本, 所述训练文本对应于所述源语言, 所述训练文本中包括被标记的 第二短语, 所述第二短语对应于所述目标语言; 针对每一所述训练文本, 获取所述训练文本对应的第一翻译文本, 所述第一翻译文本 对应于所述目标语言;权 利 要 求 书 1/2 页 2 CN 115062631 A 2根据多个所述训练文本以及每个所述训练文本对应的所述第 一翻译文本, 进行模型训 练, 在完成一次模型训练之后, 获取所述第一翻译文本与第二翻译文本的匹配度, 所述第二 翻译文本为训练得到的翻译模型的输出 结果; 在所述匹配度小于预设比例时, 重复模型训练的过程, 直至所述第一翻译文本与第二 翻译文本的匹配度大于所述预设比例时, 停止模型训练, 获取 所述目标翻译模型。 7.一种文本翻译装置, 其特 征在于, 所述装置包括: 处理模块, 用于在待翻译为目标语言的第一文本包括第一短语的情况下, 将所述第一 短语替换为第一目标人名并标记, 得到第二文本, 所述第一目标人名对应于所述目标语言、 所述第一短语对应于源语言, 所述第一短语对应于人名语义和至少一种非人名语义, 且所 述第一短语在所述第一文本中的真实语义 为人名; 第一获取模块, 用于将所述第二文本输入目标翻译模型, 获取所述第一文本对应的目 标文本; 其中, 所述目标翻译模型用于识别处于标记状态的所述第一目标人名并输出、 将所述 第二文本中区别于所述第一目标人名的文本翻译为所述目标语言并输出, 所述目标文本对 应于所述目标语言。 8.一种电子设备, 其特 征在于, 包括: 至少一个处 理器; 以及 与所述至少一个处理器通信连接的存储器; 其中, 所述存储器存储有可被所述至少一 个处理器执行 的指令, 所述指令被所述至少一个处理器执行, 以使所述至少一个处理器能 够执行权利要求1至 6中任一项所述的文本翻译方法。 9.一种存储有计算机指令的非瞬时计算机可读存储介质, 其特征在于, 所述计算机指 令用于使所述计算机执 行权利要求1至 6中任一项所述的文本翻译方法。 10.一种计算机程序产品, 其特征在于, 包括计算机程序, 所述计算机程序在被处理器 执行时实现权利要求1至 6中任一项所述的文本翻译方法。权 利 要 求 书 2/2 页 3 CN 115062631 A 3

.PDF文档 专利 一种文本翻译方法、装置、电子设备及存储介质

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种文本翻译方法、装置、电子设备及存储介质 第 1 页 专利 一种文本翻译方法、装置、电子设备及存储介质 第 2 页 专利 一种文本翻译方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:09:20上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。