基于反编译Decom-Transformer模型实现信创适配的方法技术

技术编号:43891208 阅读:19 留言:0更新日期:2025-01-03 13:06
本发明专利技术涉及基于反编译Decom‑Transformer模型实现信创适配的方法,通过获取数据;并进行装载和特征提取;提取的特征进行特征嵌入,并构建Decom‑Transformer模型得到Encoder模型和Decoder模型;使用Encoder模型和Decoder模型生成汇编语言;根据生成的汇编语言生成大语言模型;最终使用生成的大语言模型生成高级语言。由于二进制文件ELF或者PE等结构的语义表达空间小,基本形式为操作码和操作数,以及文件结构的关键字,所以训练出的模型小,能够在CPU上运行,节省成本。同时本发明专利技术反编译效率高,速度快;通过人工智能直接转换针对二进制文件进行反编译成想要的高级语言,操作简单,有利于学习底层软件的结构以及开发逻辑,促进国产化信创产品的生态链发展。

【技术实现步骤摘要】

本专利技术属于程序编译,尤其是基于反编译decom-transformer模型实现信创适配的方法。


技术介绍

1、现有的反编译技术一般通过下面的步骤进行:首先解析二进制文件的格式,提取出其中的指令、数据和元数据。这通常涉及对文件头、段表和符号表的分析。然后,将二进制指令转换为汇编代码。这一步骤需要了解目标处理器的指令集架构(isa),以正确地解释每条指令的含义。分析程序的控制流图(cfg),识别出函数、循环、条件分支等结构。这有助于理解程序的逻辑和执行路径。分析程序中的数据流,跟踪变量的定义和使用。这有助于恢复出变量的类型和作用域。将汇编代码转换为高级语言结构,如函数、循环、条件语句等。这一步骤通常涉及模式匹配和语法分析,以生成伪代码或接近原始源代码的代码。通过分析变量的使用方式,推断出它们的类型。这有助于生成更准确和可读的高级语言代码。对生成的代码进行优化,去除冗余代码和无用代码,使其更接近原始源代码。这种方法基本是基于规则的方法。

2、现有技术存在以下缺点:

3、1、基于规则的方法,对人要求比较高,实现难度大,效率低下。

本文档来自技高网...

【技术保护点】

1.基于反编译Decom-Transformer模型实现信创适配的方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于反编译Decom-Transformer模型实现信创适配的方法,其特征在于:所述步骤1中获取的数据包括:汇编语言文件、指令集规范、ABI规范、ELF文件和辅助信息,其中汇编语言文件、指令集规范、ABI规范、ELF文件为x86二进制文件,辅助信息为多样化的ARM文件,包括应用程序、库和操作系统二进制文件。

3.根据权利要求1所述的基于反编译Decom-Transformer模型实现信创适配的方法,其特征在于:所述步骤2的具体实现方法为:将步...

【技术特征摘要】

1.基于反编译decom-transformer模型实现信创适配的方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于反编译decom-transformer模型实现信创适配的方法,其特征在于:所述步骤1中获取的数据包括:汇编语言文件、指令集规范、abi规范、elf文件和辅助信息,其中汇编语言文件、指令集规范、abi规范、elf文件为x86二进制文件,辅助信息为多样化的arm文件,包括应用程序、库和操作系统二进制文件。

3.根据权利要求1所述的基于反编译decom-transformer模型实现信创适配的方法,其特征在于:所述步骤2的具体实现方法为:将步骤1中获取的数据进行读取到内存中。

4.权利要求1所述的基于反编译decom-transformer模型实现信创适配的方法,其特征在于:所述步骤3包括以下步骤:

5.根据权利要求1所述的基于反编译decom-transformer模型实现信创适配的方法,其特征在于:所述步骤4中构建的decom-transformer模型结构和传统的transformer结构相同,但根据elf和pe文件格式的特...

【专利技术属性】
技术研发人员:薛超李亚辉王汝杰陈东亮孙杜宾唐波王思俊
申请(专利权)人:天地伟业技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1