一种语言转换方法及装置制造方法及图纸

技术编号：40677493 阅读：2 留言：0更新日期：2024-03-18 19:16

本申请公开了一种语言转换方法及装置，针对待翻译的初始文本，可以根据初始文本对应的语境信息对初始文本进行纠错处理，得到待定文本，且待定文本和初始文本具有相同的语言类型。由于语境信息能够帮助理解初始文本可能的正确含义，故基于语境信息进行纠错处理，能够使得待定文本相较于初始文本更为准确。接着，可以对待定文本进行语言转换，得到目标文本，目标文本与待定文本具有不同的语言类型，目标文本可以是指完成翻译后得到的文本。可见，在翻译之前，增加了纠错处理的步骤，且是基于待翻译的初始文本的语境信息进行纠错的，提高待定文本的准确性，更加准确的待定文本相较于初始文本，有利于保障翻译的准确性，得到更为准确的目标文本。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及数据处理，特别是涉及一种语言转换方法及装置。

技术介绍

1、随着人们之间交流和合作的国际化趋势，跨越语言障碍成为了一项重要的挑战。尤其是随着互联网的发展，人们之间的在线交流与合作日益普遍，在这种在线的通信场景中，基于翻译的跨语言通信是重要需求之一。

2、随着互联网技术的发展，相关技术中，利用在线翻译工具辅助人们进行跨语言沟通，其中，在线翻译工具能够提供翻译能力，实现语言转换，辅助人们交流。例如，待翻译的文本的语言类型是中文，实现语言转换后，可以得到例如语音类型是英文的文本。

3、然而，相关技术中的翻译方式存在翻译不准确的问题，导致语言转换后的文本准确性差，如此，难以很好地辅助用户之间的沟通、交流，用户体验较差。

技术实现思路

1、为了解决上述技术问题，本申请提供了一种语言转换方法及装置，能够保障翻译结果的准确性。

2、本申请实施例公开了如下技术方案：

3、一方面，本申请实施例提供了一种语言转换方法，所述方法包括：

4、获取待翻译的初始文本；

5、确定所述初始文本对应的语境信息；

6、根据所述语境信息对所述初始文本进行纠错处理，得到待定文本；所述待定文本和所述初始文本具有相同的语言类型；

7、对所述待定文本进行语言转换，得到目标文本；所述目标文本和所述待定文本具有不同的语言类型。

8、另一方面，本申请实施例提供了一种语言转换装置，所述装置包括获取单元、确定单元、处理单元和转换单元：

9、所述获取单元，用于获取待翻译的初始文本；

10、所述确定单元，用于确定所述初始文本对应的语境信息；

11、所述处理单元，用于根据所述语境信息对所述初始文本进行纠错处理，得到待定文本；所述待定文本和所述初始文本具有相同的语言类型；

12、所述转换单元，用于对所述待定文本进行语言转换，得到目标文本；所述目标文本和所述待定文本具有不同的语言类型。

13、由上述技术方案可以看出，针对待翻译的初始文本，可以根据初始文本对应的语境信息对初始文本进行纠错处理，得到待定文本，且待定文本和初始文本具有相同的语言类型。由于语境信息能够帮助理解初始文本可能的正确含义，故基于语境信息进行纠错处理，能够使得待定文本相较于初始文本更为准确，如此，可以基于待定文本进行翻译有利于保障翻译结果的准确性。具体的，可以对待定文本进行语言转换，得到目标文本，目标文本与待定文本具有不同的语言类型，即目标文本与初始文本具有不同的语言类型，目标文本可以是指完成翻译后得到的文本。可见，本申请在翻译之前，增加了纠错处理的步骤，且是基于待翻译的初始文本的语境信息进行纠错的，提高待定文本的准确性，更加准确的待定文本相较于初始文本，有利于保障翻译的准确性，得到更为准确的目标文本。

本文档来自技高网...

【技术保护点】

1.一种语言转换方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述确定所述初始文本对应的语境信息，包括：

3.根据权利要求1所述的方法，其特征在于，若所述初始文本为句文本，所述句文本包括多个词文本，所述确定所述初始文本对应的语境信息，包括：

4.根据权利要求1所述的方法，其特征在于，所述对所述待定文本进行语言转换，得到目标文本，包括：

5.根据权利要求4所述的方法，其特征在于，所述语言转换模型为预先训练好的翻译大模型中的目标子模型，所述翻译大模型包括多个子模型，所述目标子模型为所述多个子模型中的一个子模型，所述翻译大模型包括特征映射层和多个输出层，所述特征映射层和一个输出层构成一个子模型，不同子模型的输出层不同，所述根据所述待定文本，通过预先训练好的语言转换模型进行所述语言转换，输出所述目标文本，包括：

6.根据权利要求5所述的方法，其特征在于，所述特征映射层包括多层Transformer网络。

7.根据权利要求1所述的方法，其特征在于，所述获取待翻译的初始文本，包括：

<...

【技术特征摘要】

1.一种语言转换方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述确定所述初始文本对应的语境信息，包括：

3.根据权利要求1所述的方法，其特征在于，若所述初始文本为句文本，所述句文本包括多个词文本，所述确定所述初始文本对应的语境信息，包括：

4.根据权利要求1所述的方法，其特征在于，所述对所述待定文本进行语言转换，得到目标文本，包括：

5.根据权利要求4所述的方法，其特征在于，所述语言转换模型为预先训练好的翻译大模型中的目标子模型，所述翻译大模型包括多个子模型，所述目标子模型为所述多个子模型中的一个子模型，所述翻译大模型包括特征映射层和多个输出层，所述特征映射层和一个输出层构成一个子模型，不同子模型的输出层不...

【专利技术属性】
技术研发人员：闫布福，孙连鹏，于鑫，
申请(专利权)人：北京声智科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人