一种基于机器学习模型的翻译方法和系统技术方案

技术编号:39410852 阅读:7 留言:0更新日期:2023-11-19 16:02
本说明书实施例提供一种基于机器学习模型的翻译方法和系统,该方法包括:获取源对象的录入数据;根据录入数据,通过第一模型确定预翻译结果;根据预翻译结果,生成至少一个候选翻译数据;基于至少一个候选翻译数据,通过语义复杂度评估模型确定至少一个候选翻译数据的语义复杂度;基于对话连贯度和历史对话中目标对象接收到的目标翻译结果,确定目标对象的语义易懂度,其中,基于对话特征序列,确定时序连贯度,基于源对象与目标对象间的对话文本序列,确定语义连贯度,基于时序连贯度和语义连贯度,确定对话连贯度;基于至少一个候选翻译数据的语义复杂度和目标对象的语义易懂度,确定目标翻译结果;向目标对象输出目标翻译结果。果。果。

【技术实现步骤摘要】
一种基于机器学习模型的翻译方法和系统


[0001]本说明书涉及机器学习
,特别涉及一种基于机器学习模型的翻译方法和系统。

技术介绍

[0002]机器翻译是通过计算机将一种自然语言文本(源文本)翻译为另一种自然语言文本(目标译文),以实现不同语种之间的转换。
[0003]CN106202059B提出了一种机器翻译方法,该方法通过生成顺向翻译文以及针对多个不同的顺向翻译文的每一个来向第一语言逆向翻译而得到的多个逆向翻译文,并选择一个逆向翻译文,输出与之对应的顺向翻译文,以满足用户的翻译需求。但该翻译策略未考虑用户的个体差异,例如表达方式、理解能力、接受能力等,所提供翻译结果的准确度不高,用户使用仍存在一定的难度。
[0004]因此,期望提供一种基于机器学习模型的翻译方法和系统,以适应用户的个体差异,提高翻译结果的准确度,改善用户体验。

技术实现思路

[0005]本说明书的实施例之一提供一种基于机器学习模型的翻译方法,所述方法由处理器执行,所述方法包括:获取源对象的录入数据,所述源对象包括提供当前对话内容的对象;根据所述录入数据,通过第一模型确定预翻译结果,所述第一模型为机器学习模型;根据所述预翻译结果,生成至少一个候选翻译数据;基于所述至少一个候选翻译数据,通过语义复杂度评估模型确定所述至少一个候选翻译数据的语义复杂度,所述语义复杂度评估模型为机器学习模型;基于对话连贯度以及历史对话中目标对象接收到的目标翻译结果,通过语义易懂度评估模型确定所述目标对象的语义易懂度,所述目标对象包括接收所述当前对话内容的对象;所述语义易懂度评估模型为机器学习模型;其中,所述对话连贯度的确定包括:基于对话特征序列,确定时序连贯度;所述对话特征序列包括所述源对象与所述目标对象之间至少一轮历史对话的对话特征;所述对话特征包括所述源对象的相邻两条录入数据的时间间隔、和/或所述目标对象的身份转换时间间隔;基于所述源对象与所述目标对象间的对话文本序列,通过语义连贯评估模型确定语义连贯度;所述语义连贯评估模型为机器学习模型;基于所述时序连贯度以及所述语义连贯度,确定所述对话连贯度;基于所述至少一个候选翻译数据的所述语义复杂度以及所述目标对象的所述语义易懂度,确定目标翻译结果;向所述目标对象输出所述目标翻译结果。
[0006]本说明书的实施例之一提供一种基于机器学习模型的翻译系统,所述系统包括获取模块、翻译模块以及输出模块;所述获取模块被配置为获取源对象的录入数据,所述源对象包括提供当前对话内容的对象;所述翻译模块被配置为:根据所述录入数据,通过第一模型确定预翻译结果,所述第一模型为机器学习模型;根据所述预翻译结果,生成至少一个候选翻译数据;基于所述至少一个候选翻译数据,通过语义复杂度评估模型确定所述至少一
个候选翻译数据的语义复杂度,所述语义复杂度评估模型为机器学习模型;基于对话连贯度以及历史对话中目标对象接收到的目标翻译结果,通过语义易懂度评估模型确定所述目标对象的语义易懂度,所述目标对象包括接收所述当前对话内容的对象;所述语义易懂度评估模型为机器学习模型;其中,所述对话连贯度的确定包括:基于对话特征序列,确定时序连贯度;所述对话特征序列包括所述源对象与所述目标对象之间至少一轮历史对话的对话特征;所述对话特征包括所述源对象的相邻两条录入数据的时间间隔、和/或所述目标对象的身份转换时间间隔;基于所述源对象与所述目标对象间的对话文本序列,通过语义连贯评估模型确定语义连贯度;所述语义连贯评估模型为机器学习模型;基于所述时序连贯度以及所述语义连贯度,确定所述对话连贯度;基于所述至少一个候选翻译数据的所述语义复杂度以及所述目标对象的所述语义易懂度,确定目标翻译结果;所述输出模块被配置为向所述目标对象输出所述目标翻译结果。
[0007]本说明书一个或多个实施例提供一种基于机器学习模型的翻译装置,所述装置包括至少一个处理器以及至少一个存储器;所述至少一个存储器用于存储计算机指令;所述至少一个处理器用于执行所述计算机指令中的至少部分指令以实现上述的基于机器学习模型的翻译方法。
[0008]本说明书一个或多个实施例提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的基于机器学习模型的翻译方法。
附图说明
[0009]本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:图1是根据本说明书一些实施例所示的基于机器学习模型的翻译系统的系统结构图;图2是根据本说明书一些实施例所示的基于机器学习模型的翻译方法的示例性流程图;图3是根据本说明书一些实施例所示的确定语义易懂度的示例性示意图;图4是根据本说明书一些实施例所示的第二模型的示例性示意图;图5是根据本说明书一些实施例所示的确定语音生成数据的示例性示意图;图6是根据本说明书一些实施例所示的确定语速接受度的示例性示意图。
具体实施方式
[0010]为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
[0011]应当理解,本文使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,
则可通过其他表达来替换所述词语。
[0012]如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
[0013]图1是根据本说明书一些实施例所示的一种基于机器学习模型的翻译系统的系统结构图。在一些实施例中,基于机器学习模型的翻译系统100包括获取模块110、翻译模块120以及输出模块130。
[0014]在一些实施例中,获取模块110可以被配置为获取源对象的录入数据。其中,源对象包括提供当前对话内容的对象。
[0015]关于源对象、录入数据的说明可以参见图2及其相关说明。
[0016]在一些实施例中,翻译模块120可以被配置为根据录入数据,通过第一模型确定预翻译结果,其中,第一模型为机器学习模型;根据预翻译结果,生成至少一个候选翻译数据;基于至少一个候选翻译数据,通过语义复杂度评估模型确定至少一个候选翻译数据的语义复杂度,其中,语义复杂度评估模型为机器学习模型;基于对话连贯度以及历史对话中目标对象接收到的目标翻译结果,通过语义易懂度评估模型确定目标对象的语义易懂度,目标对象包括接收当前对话内容的对象;其中,语义本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习模型的翻译方法,所述方法由处理器执行,其特征在于,所述方法包括:获取源对象的录入数据,所述源对象包括提供当前对话内容的对象;根据所述录入数据,通过第一模型确定预翻译结果,所述第一模型为机器学习模型;根据所述预翻译结果,生成至少一个候选翻译数据;基于所述至少一个候选翻译数据,通过语义复杂度评估模型确定所述至少一个候选翻译数据的语义复杂度,所述语义复杂度评估模型为机器学习模型;基于对话连贯度以及历史对话中目标对象接收到的目标翻译结果,通过语义易懂度评估模型确定所述目标对象的语义易懂度,所述目标对象包括接收所述当前对话内容的对象;所述语义易懂度评估模型为机器学习模型;其中,所述对话连贯度的确定包括:基于对话特征序列,确定时序连贯度;所述对话特征序列包括所述源对象与所述目标对象之间至少一轮历史对话的对话特征;所述对话特征包括所述源对象的相邻两条录入数据的时间间隔、和/或所述目标对象的身份转换时间间隔;基于所述源对象与所述目标对象间的对话文本序列,通过语义连贯评估模型确定语义连贯度;所述语义连贯评估模型为机器学习模型;基于所述时序连贯度以及所述语义连贯度,确定所述对话连贯度;基于所述至少一个候选翻译数据的所述语义复杂度以及所述目标对象的所述语义易懂度,确定目标翻译结果;向所述目标对象输出所述目标翻译结果。2.根据权利要求1所述的方法,其特征在于,所述根据所述预翻译结果,生成至少一个候选翻译数据包括:根据所述预翻译结果、所述目标对象的所述语义易懂度,通过第二模型生成所述至少一个候选翻译数据,所述第二模型为机器学习模型。3.根据权利要求1所述的方法,其特征在于,所述目标翻译结果包括语音生成数据;所述方法还包括:基于所诉至少一个候选翻译数据的所述语义复杂度、所述目标对象的所述语义易懂度、所述目标对象的语速接受度中至少一种,确定所述语音生成数据;其中,所述语速接受度表征所述目标对象对于所述语音生成数据的语速的接受程度;所述目标对象的所述语速接受度的确定包括:根据所述对话连贯度、所述目标对象的所述语义易懂度、语音特征序列中至少一种,确定所述目标对象的所述语速接受度;其中,所述语音特征序列包括历史语音生成数据对应的语音特征,所述历史语音生成数据为所述源对象与所述目标对象之间至少一轮历史对话的语音生成数据,所述语音特征包括所述历史语音生成数据中至少一个分段的语音长度和所述至少一个分段的文本长度。4.根据权利要求3所述的方法,所述根据所述对话连贯度、所述目标对象的所述语义易懂度、语音特征序列中至少一种,确定所述目标对象的所述语速接受度还包括:确定所述目标对象的录入特征,所述录入特征包括录入文字时的录入速度;根据所述目标对象的所述录入特征,确定所述目标对象的所述语速接受度。
5.一种基于机器学习模型的翻译系统,其特征在于,所述系统包括获取模块、翻译模块以及输出模块;所述获取模块被配置为获取源对象的录入数据,所述源对象包括提供当前对话内容的对象;所述翻译模...

【专利技术属性】
技术研发人员:杨阳潘彦蓉张晔张小兵童凯张梦醒曾珂曹宁刘睿孙艳艳张帅
申请(专利权)人:果不其然无障碍科技苏州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1