【技术实现步骤摘要】
文本处理方法、装置、设备及存储介质
本申请涉及计算机
,尤其涉及一种文本处理方法、装置、设备及存储介质。
技术介绍
机器翻译,又可以称为自动翻译,是利用计算机将一种自然语言转换为另一种自然语言的过程,比如将中文文本转换为英文文本,或者将英文文本转换为中文文本。在大多数具有机器翻译功能的产品中,对于给定的源端输入,翻译系统通常只输出相应的机器译文。在实际应用场景中,由于缺乏真实的人工翻译译文作为翻译结果的参考答案,很难判断机器译文的准确度,从而降低用户对产品的关注度。因此,在机器翻译的应用中,如何有效地对文本进行翻译成为研究的热点问题。
技术实现思路
本专利技术实施例提供了一种文本处理方法、装置、设备以及存储介质,在翻译文本过程中,不仅可以输出待翻译文本的目标译文,还可以得到用于反映目标译文准确性的质量评分,提高了文本翻译的丰富性。一方面,本专利技术实施例提供了一种文本处理方法,包括:显示文本翻译界面,所述文本翻译界面包括接收待翻译文本的第一区域;当所述第一区域中存在待翻译文本时,调用翻译处理模型中的翻译子模型对所述待翻译文本进行翻译处理,得到所述待翻译文本对应的目标译文;调用所述翻译处理模型中的质量评分子模型基于所述待翻译文本和所述目标译文进行评分处理,得到所述目标译文的翻译质量评分;在所述文本翻译界面包括的第二区域中显示所述目标译文以及所述翻译质量评分。一方面,本专利技术实施例提供了一种文本处理装置,其特征在于,包括:显示单元 ...
【技术保护点】
1.一种文本处理方法,其特征在于,包括:/n显示文本翻译界面,所述文本翻译界面包括接收待翻译文本的第一区域;/n当所述第一区域中存在待翻译文本时,调用翻译处理模型中的翻译子模型对所述待翻译文本进行翻译处理,得到所述待翻译文本对应的目标译文;/n调用所述翻译处理模型中的质量评分子模型基于所述待翻译文本和所述目标译文进行评分处理,得到所述目标译文的翻译质量评分;/n在所述文本翻译界面包括的第二区域中显示所述目标译文以及所述翻译质量评分。/n
【技术特征摘要】
1.一种文本处理方法,其特征在于,包括:
显示文本翻译界面,所述文本翻译界面包括接收待翻译文本的第一区域;
当所述第一区域中存在待翻译文本时,调用翻译处理模型中的翻译子模型对所述待翻译文本进行翻译处理,得到所述待翻译文本对应的目标译文;
调用所述翻译处理模型中的质量评分子模型基于所述待翻译文本和所述目标译文进行评分处理,得到所述目标译文的翻译质量评分;
在所述文本翻译界面包括的第二区域中显示所述目标译文以及所述翻译质量评分。
2.如权利要求1所述的方法,其特征在于,所述第二区域包括触发控件,当所述触发控件被触发为第一状态时,所述第二区域中显示所述目标译文和所述目标译文对应的翻译质量评分;当所述触发控件被触发为第二状态时,所述第二区域中显示所述待翻译文本、所述目标译文以及所述目标译文对应的翻译质量评分。
3.如权利要求1所述的方法,其特征在于,所述翻译子模型包括编码器、解码器和注意机制,所述待翻译文本包括至少一个词,所述调用所述翻译处理模型中的所述翻译子模型对所述待翻译文本进行翻译处理得到目标译文,包括:
调用所述翻译子模型中的编码器对所述至少一个词包括的每个词进行编码处理,得到所述每个词对应的源端隐状态;
当对所述待翻译文本中的任意词进行翻译处理时,调用注意机制基于所述至少一个词中其他词与所述任意词的关联度对所述每个词的源端隐状态进行统一化处理得到处理结果,并将所述处理结果传输至所述解码器中;
调用所述解码器对所述处理结果进行解码处理,得到目标端隐状态,并基于所述目标端隐状态生成任意词对应的译文单词;
基于每个词对应的译文单词生成目标译文。
4.如权利要求3所述的方法,其特征在于,所述编码器包括至少一层或多层编码层,每个词对应的源端隐状态包括至少一个或多个,任意一个编码层中每个词的源端隐状态组成相应编码层对应的源端隐状态集合,所述源端隐状态集合的数量为一个或多个;所述解码器包括至少一个解码层,每个译文单词对应的目标端隐状态的数量为一个或多个,任意一个解码层中每个译文单词对应的目标端隐状态组成相应解码层对应的目标端隐状态集合,所述目标端隐状态集合的数量为一个或多个;
所述调用所述翻译处理模型中的所述质量评分子模型基于所述待翻译文本和所述目标译文进行评分处理,得到所述目标译文对应的翻译质量评分,包括:
基于所述源端隐状态集合确定第一源端隐状态集合,以及基于所述目标端隐状态集合确定第一目标端隐状态集合;
将所述第一源端隐状态集合和所述第一目标端隐状态集合传输至所述质量评分子模型中,以控制所述质量评分子模型进行评分处理,得到所述目标译文对应的翻译质量评分。
5.如权利要求4所述的方法,其特征在于,所述质量评分子模型包括第一特征提取器和第二特征提取器,所述将所述第一源端隐状态集合和所述第一目标端隐状态集合传输至所述质量评分子模型中,以控制所述评分质量子模型进行评分处理,得到所述目标译文对应的翻译质量评分,包括:
将所述第一源端隐状态集合包括的每个源端隐状态,以及所述第一目标端隐状态集合中包括的每个目标端隐状态进行拼接转置处理,并将拼接转置处理的结果作为所述第一特征提取器的输入矩阵;
对所述第一特征提取器的输入矩阵进行特征提取处理,得到所述第一特征提取器对应的第一输出矩阵;
对所述第一输出矩阵进行特征提取处理,得到所述第二特征提取器对应的第二输出矩阵;
基于所述第二输出矩阵获取所述翻译质量评价相关信息,并将所述翻译质量评价相关信息输入到评分函数中进行评分,得到所述目标译文对应...
【专利技术属性】
技术研发人员:张祥文,谢军,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。