一种基于大语言模型的反编译结果优化方法和系统技术方案

技术编号:40161926 阅读:39 留言:0更新日期:2024-01-26 23:35
本发明专利技术涉及一种基于大语言模型的反编译结果优化方法和系统。该方法包括:裁判角色通过与大语言模型交互获得反编译结果的优化方案;根据裁判角色获得的优化方案,建议者角色通过与大语言模型交互获得具体的整改措施;操作员角色将建议者角色获得的整改措施施加于反编译结果,并检查函数语义是否被改变,根据函数语义的变化确定是否接受整改措施。本发明专利技术设计了一种基于通用大语言模型的反编译结果优化方法来自动地为反编译结果增加语义信息,去除冗余变量,简化控制结构。与当前一流反编译器的结果相比,该技术能通过上述优化措施进一步提高反编译结果的可读性,辅助逆向分析人员理解二进制程序。

【技术实现步骤摘要】

本专利技术属于软件技术、信息安全,涉及软件逆向工程技术,具体涉及一种基于大语言模型的反编译结果优化方法和系统


技术介绍

1、反编译是逆向技术的一种,旨在将通过编译生成的可执行程序翻译成高级语言的形式,是编译技术的逆向过程。通过对反汇编结果数据流的分析,反编译器能够通过预定义的规则和算法对程序的结构进行恢复。但是,和编程人员手动编写的高级语言相比,反编译器输出的结果缺少语义信息,并且往往包含很多冗余的变量和控制结构,影响了逆向分析人员对可执行程序的理解。细究造成这种结果的原因,编译过程中语义信息的丢失导致了反编译结果中语义的缺失。语义信息,例如变量名称和注释信息,不影响编译后程序的运行。因此,出于缩小程序体积、软件保护等目的,这些信息在编译过程中往往会被去除,进而导致反编译器无法在结果中添加程序语义信息。结构恢复算法的缺陷导致反编译结果中冗余的变量和控制结构。程序的控制结构多变,结构恢复算法在尽量保证恢复准确性的基础上,缺少对恢复结果简洁性的保证。

2、大语言模型是自然语言处理中的一种技术,大语言模型的研究范式大致分为三个阶段。第一个阶段是采用本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的反编译结果优化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述裁判角色通过与大语言模型交互获得反编译结果的优化方案,包括:

3.根据权利要求1所述的方法,其特征在于,所述建议者角色通过与大语言模型交互获得具体的整改措施,包括:

4.根据权利要求3所述的方法,其特征在于,所述预定义规则包括:(1)结构简化的优化优于其它优化;(2)添加注释的优化优于变量重命名优化。

5.根据权利要求1所述的方法,其特征在于,所述操作员角色将来自建议者角色的整改措施施加于反编译结果上,并调用函数语义变化检测...

【技术特征摘要】

1.一种基于大语言模型的反编译结果优化方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述裁判角色通过与大语言模型交互获得反编译结果的优化方案,包括:

3.根据权利要求1所述的方法,其特征在于,所述建议者角色通过与大语言模型交互获得具体的整改措施,包括:

4.根据权利要求3所述的方法,其特征在于,所述预定义规则包括:(1)结构简化的优化优于其它优化;(2)添加注释的优化优于变量重命名优化。

5.根据权利要求1所述的方法,其特征在于,所述操作员角色将来自建议者角色的整改措施施加于反编译结果上,并调用函数语义变化检测方法对优化前后函数的语义变化进行检测,如果函数语义发生变化,则将相应的整改措施筛除,如果施加整改措施后函数语义没有发生改变,则接受整改措施...

【专利技术属性】
技术研发人员:梁瑞刚胡佩威陈恺
申请(专利权)人:中国科学院信息工程研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1