一种基于中间表示的C到Rust代码翻译大模型构建方法技术

技术编号:43773296 阅读:70 留言:0更新日期:2024-12-24 16:12
本发明专利技术属于软件工程领域,具体为一种基于中间表示的C到Rust代码翻译大模型构建方法,可用于构建高效的代码翻译大模型,从而提高将C代码翻译为Rust代码的效率。该方法主要分为两个阶段。首先通过Github等软件项目托管平台收集大量的Rust代码,并将其转换为对应的中间表示,用于训练大模型实现从中间表示到Rust代码的翻译。然后本发明专利技术通过收集功能语义相同的C代码和Rust代码,并将C代码转换为对应的中间表示,从而微调大模型,对齐C到Rust代码翻译过程中的中间表示差异。本发明专利技术可用于将软件项目中用C语言编写的代码,自动翻译为功能语义相同的Rust代码。

【技术实现步骤摘要】

本专利技术属于软件工程领域,具体为一种基于中间表示的c到rust代码翻译大模型构建方法,可用于构建高效的代码翻译大模型,从而提高将c代码翻译为rust代码的效率。


技术介绍

1、rust是一种内存和类型安全的编程语言,其性能与c等低级语言相当。因为rust的类型检查器可以确保代码中不存在未定义行为,因此rust也被称为“安全的c语言”。据微软估计,其所有的安全漏洞中有70%是由于内存安全问题,如果用rust编写代码,则可以大部分或完全消除这些内存安全问题。由于rust的安全优势,rust已被用于firecracker等主流的开源项目,并且linus torvalds最近也宣称将支持使用rust作为linux内核的开发语言。

2、c语言是一种广泛使用的系统编程语言,但其糟糕的语言级安全机制,导致软件系统中常出现严重错误和漏洞。因此,鉴于rust的安全性和性能优势,使得开发者十分希望能将使用c语言编写的代码自动翻译为rust代码。目前,主流的c到rust代码翻译方法可分为两类,即基于规则的方法和基于大模型的方法。基于规则的方法通过使用预定义的规则和本文档来自技高网...

【技术保护点】

1.一种基于中间表示的C到Rust代码翻译大模型构建方法,其特征在于,包括如下步骤:

【技术特征摘要】

1.一种基于中间表示的c到rust代码翻译...

【专利技术属性】
技术研发人员:周志德江贺李晓晨
申请(专利权)人:大连理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1