程序翻译模型的获取方法、程序翻译方法和装置制造方法及图纸

技术编号：38938939 阅读：10 留言：0更新日期：2023-09-25 09:39

本申请提供了一种程序翻译模型的获取方法、程序翻译方法和装置，用于提高程序翻译准确性，降低人力物力投入。其中程序翻译模型的获取方法，包括：获取训练数据；其中，所述训练数据包括多个编程语言的代码字段；根据所述训练数据对大语言模型进行微调，获取程序翻译模型。程序翻译方法，包括：确定目标编程语言；将待翻译代码字段输入程序翻译模型，获取所述程序翻译模型输出的目标代码字段；其中，所述目标代码字段采用所述目标编程语言编写，所述目标代码字段与所述待翻译代码字段的含义一致，所述程序翻译模型为应用程序翻译模型的获取方法获得的模型。方法获得的模型。方法获得的模型。

全部详细技术资料下载

【技术实现步骤摘要】
程序翻译模型的获取方法、程序翻译方法和装置

[0001]本申请涉及信息
，具体涉及一种程序翻译模型的获取方法、程序翻译方法和装置。

技术介绍

[0002]随着软件开发的高速发展，程序员们需要在各种编程语言之间进行频繁的代码转换。尽管现有的许多编程语言在设计上具有通用性，但它们在语法、结构和库支持方面可能存在显著差异。因此，人工在不同编程语言之间转换代码是一项耗时且容易出错的工作，研究人员尝试研发能够自动将一种编程语言转换为另一种编程语言的工具。
[0003]相关技术中的一些翻译工具，存在需要人工定义翻译规则、无法实现语义级别的翻译或者需要大量训练样本等问题，投入人力物力成本高，翻译效果不佳。因此，如何实现一种高效、便捷、以及低人力投入的编程语言翻译是当前需要解决的问题。

技术实现思路

[0004]本申请提供了一种程序翻译模型的获取方法、程序翻译方法和装置，能够实现便捷高效、以及低人力投入的编程语言翻译。
[0005]第一方面，本申请提供一种程序翻译模型的获取方法，包括：获取训练数据；其中，训练数据包括多个编程语言的代码字段；根据训练数据对大语言模型进行微调，获取程序翻译模型。
[0006]上述实施方式中，大语言模型已完成逻辑预训练，充分学习到文本中的语法规则、上下文关系、以及语义信息等关键特征，需要根据编程语言的代码字段等信息进行微调以实现编程语言的翻译。对训练数据要求低，人力投入少，且能够保证翻译效果，提升用户的使用体验。常见大语言模型均用于文字分析、图像识别等场景，不...

【技术保护点】

【技术特征摘要】
1.一种程序翻译模型的获取方法，其特征在于，包括：获取训练数据；其中，所述训练数据包括多个编程语言的代码字段；根据所述训练数据对大语言模型进行微调，获取程序翻译模型。2.根据权利要求1所述的方法，其特征在于，所述训练数据包括第一参数，所述根据所述训练数据对大语言模型进行微调之前，所述方法还包括：对所述第一参数执行注意力处理；其中，所述第一参数包括以下参数中的至少一个：所述多个编程语言的编程范式、所述多个编程语言的非标准语法和所述多个编程语言的库调用；所述根据所述训练数据对大语言模型进行微调，获取程序翻译模型，包括：根据所述训练数据对所述大语言模型进行微调，获取预训练模型；根据所述第一参数对所述预训练模型进行微调，获取所述程序翻译模型。3.根据权利要求2所述的方法，其特征在于，所述对所述第一参数执行注意力处理，包括：对所述第一参数进行数据增强。4.根据权利要求1至3中任一项所述的方法，其特征在于，所述训练数据包括第一参数，所述根据所述训练数据对大语言模型进行微调之前，所述方法还包括：提高微调的损失函数中所述第一参数的权重。5.一种程序翻译方法，其特征在于，包括：确定目标编程语言；将待翻译代码字段输入程序翻译模型，获取所述程序翻译模型输出的目标代码字段；其中，所述目标代码字段采用所述目标编程语言编写，所述目标代码字段与所述待翻译代码字段的含义一致，所述程序翻译模型为应用权利要求1至4中任一...

【专利技术属性】
技术研发人员：胡云齐，李鉴庭，
申请(专利权)人：深圳派氪司科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人