System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及数据处理,特别是涉及一种语言转换方法及装置。
技术介绍
1、随着人们之间交流和合作的国际化趋势,跨越语言障碍成为了一项重要的挑战。尤其是随着互联网的发展,人们之间的在线交流与合作日益普遍,在这种在线的通信场景中,基于翻译的跨语言通信是重要需求之一。
2、随着互联网技术的发展,相关技术中,利用在线翻译工具辅助人们进行跨语言沟通,其中,在线翻译工具能够提供翻译能力,实现语言转换,辅助人们交流。例如,待翻译的文本的语言类型是中文,实现语言转换后,可以得到例如语音类型是英文的文本。
3、然而,相关技术中的翻译方式存在翻译不准确的问题,导致语言转换后的文本准确性差,如此,难以很好地辅助用户之间的沟通、交流,用户体验较差。
技术实现思路
1、为了解决上述技术问题,本申请提供了一种语言转换方法及装置,能够保障翻译结果的准确性。
2、本申请实施例公开了如下技术方案:
3、一方面,本申请实施例提供了一种语言转换方法,所述方法包括:
4、获取待翻译的初始文本;
5、确定所述初始文本对应的语境信息;
6、根据所述语境信息对所述初始文本进行纠错处理,得到待定文本;所述待定文本和所述初始文本具有相同的语言类型;
7、对所述待定文本进行语言转换,得到目标文本;所述目标文本和所述待定文本具有不同的语言类型。
8、另一方面,本申请实施例提供了一种语言转换装置,所述装置包括获取单元、确定单元、处理单
9、所述获取单元,用于获取待翻译的初始文本;
10、所述确定单元,用于确定所述初始文本对应的语境信息;
11、所述处理单元,用于根据所述语境信息对所述初始文本进行纠错处理,得到待定文本;所述待定文本和所述初始文本具有相同的语言类型;
12、所述转换单元,用于对所述待定文本进行语言转换,得到目标文本;所述目标文本和所述待定文本具有不同的语言类型。
13、由上述技术方案可以看出,针对待翻译的初始文本,可以根据初始文本对应的语境信息对初始文本进行纠错处理,得到待定文本,且待定文本和初始文本具有相同的语言类型。由于语境信息能够帮助理解初始文本可能的正确含义,故基于语境信息进行纠错处理,能够使得待定文本相较于初始文本更为准确,如此,可以基于待定文本进行翻译有利于保障翻译结果的准确性。具体的,可以对待定文本进行语言转换,得到目标文本,目标文本与待定文本具有不同的语言类型,即目标文本与初始文本具有不同的语言类型,目标文本可以是指完成翻译后得到的文本。可见,本申请在翻译之前,增加了纠错处理的步骤,且是基于待翻译的初始文本的语境信息进行纠错的,提高待定文本的准确性,更加准确的待定文本相较于初始文本,有利于保障翻译的准确性,得到更为准确的目标文本。
本文档来自技高网...【技术保护点】
1.一种语言转换方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述确定所述初始文本对应的语境信息,包括:
3.根据权利要求1所述的方法,其特征在于,若所述初始文本为句文本,所述句文本包括多个词文本,所述确定所述初始文本对应的语境信息,包括:
4.根据权利要求1所述的方法,其特征在于,所述对所述待定文本进行语言转换,得到目标文本,包括:
5.根据权利要求4所述的方法,其特征在于,所述语言转换模型为预先训练好的翻译大模型中的目标子模型,所述翻译大模型包括多个子模型,所述目标子模型为所述多个子模型中的一个子模型,所述翻译大模型包括特征映射层和多个输出层,所述特征映射层和一个输出层构成一个子模型,不同子模型的输出层不同,所述根据所述待定文本,通过预先训练好的语言转换模型进行所述语言转换,输出所述目标文本,包括:
6.根据权利要求5所述的方法,其特征在于,所述特征映射层包括多层Transformer网络。
7.根据权利要求1所述的方法,其特征在于,所述获取待翻译的初始文本,包括:
< ...【技术特征摘要】
1.一种语言转换方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述确定所述初始文本对应的语境信息,包括:
3.根据权利要求1所述的方法,其特征在于,若所述初始文本为句文本,所述句文本包括多个词文本,所述确定所述初始文本对应的语境信息,包括:
4.根据权利要求1所述的方法,其特征在于,所述对所述待定文本进行语言转换,得到目标文本,包括:
5.根据权利要求4所述的方法,其特征在于,所述语言转换模型为预先训练好的翻译大模型中的目标子模型,所述翻译大模型包括多个子模型,所述目标子模型为所述多个子模型中的一个子模型,所述翻译大模型包括特征映射层和多个输出层,所述特征映射层和一个输出层构成一个子模型,不同子模型的输出层不...
【专利技术属性】
技术研发人员:闫布福,孙连鹏,于鑫,
申请(专利权)人:北京声智科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。