PE文件源代码一致性的判定方法及装置制造方法及图纸

技术编号:2911567 阅读:304 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种PE文件源代码一致性的判定方法及装置,通过对PE文件的公开结构进行分析,当各待分析PE文件所包含的段的数目相同、包含的关键段的内容相同时,即可判定各待分析PE文件是基于相同的源代码,这种PE文件源代码一致性的判定方法及装置,不依赖于原始源代码的内容,可以不访问源代码库,保证了源代码库的保密安全性。

【技术实现步骤摘要】

本专利技术涉及一种PE文件源代码一致性的判定方法及装置
技术介绍
在软件开发的过程中,开发人员会周期性或者不定期地对代码库中的源代码进行编译,而随着dailybuild(日常编译)技术的引入,产品可时刻不停地进行编译,从而产生大量的PE文件,由于编译时嵌入了一些与编译时间、编译器版本等相关的信息,这些信息被编译进入PE文件内部,导致即使是基于相同源代码的PE文件,多次编译以后的二进制文件对比也不尽相同,产品版本号也不停地发生变化,此外,在添加数字签名技术以后,数字签名机制及hash机制也会造成对PE文件的二进制格式基础上的修改。虽然可以通过自动化测试技术进行一些技术上的测试保障,测试人员还是需要确认在编译过程中有哪些模块进行了源代码级别的变更,以便于测试人员确定测试重点,此外,对于软件版本发布人员而言,需要确认测试通过的版本与当前准备发布的版本是不是基于相同的源代码,如果是基于相同的源代码,则可以进行发布。在现有技术中,在判断两个PE文件是否基于相同的源代码时,通常是对比两次编译时两个PE文件所对应的所有的源代码文件,判断这些源代码的内容是否相同,若源代码相同,则是基于相同的源代码,这种判定方式,要访问生成PE文件的所有源代码,需要较高的源代码库的权限,甚至会威胁到源代码库的保密安全。
技术实现思路
本专利技术的目的在于提供一种基于PE文件,不需访问源代码库,即可判定PE文件内容是否基于相同的源代码的方法及装置,即PE文件源代码一致性的判定方法及装置,可以不影响源代码库的安全性。-->为达到上述目的,本专利技术采用以下技术方案:一种PE文件源代码一致性的判定方法,包括步骤:判断各PE文件所包含的段的数目是否相同;若是,枚举所述各PE文件所包含的段,并判断所述各PE文件所具有的关键段的内容是否相同,若相同,则判定所述各PE文件内容是基于相同的源代码,若不相同,则判定所述各PE文件内容是基于不同的源代码;若否,则判定所述各PE文件基于不同的源代码。一种PE文件源代码一致性的判定装置,包括:段数目判别模块,用于判断各PE文件所包含的段的数目是否相同,若不相同,则比较结果处理模块判定所述各PE文件是基于不同的源代码;段枚举模块,用于当所述段数目判别模块判断结果为相同时,对所述各PE文件所包含的段进行枚举;关键段判别模块,用于判断所述段枚举模块所枚举的当前枚举段是否为关键段,若是,则判断各关键段是否相同,若否,则不进行判断;比较结果处理模块,用于根据所述段数目判别模块及所述关键段判别模块的判别结果,判断所述各PE文件内容是否基于相同的源代码,当所述段数目判别模块判定结果为相同且所述关键段判别模块判定结果为相同时,所述比较结果处理模块判定所述各PE文件内容是基于相同的源代码。根据本专利技术的PE文件源代码一致性的判定方法及其装置,其可以根据PE文件的公开结构,获得PE文件所包含的段的数目及类型,对于来源于相同的源代码的PE文件,其包含的段的数目相同,且所包含的关键段的内容也相同,即,当所对比的各待分析PE文件所包含的段的数目相同,且所包含的各关键段的内容也相同时,即可确定各待分析PE文件是基于相同的源代码,本专利技术的侦测方式不需要依赖于PE文件所对应的原始的源代码,操作方便,且不会影响源代码库的安全性。-->附图说明图1是本专利技术PE文件源代码一致性的判定方法的实施例一的流程示意图;图2是本专利技术PE文件源代码一致性的判定方法的实施例二的流程示意图;图3是本专利技术PE文件源代码一致性的判定装置的较佳实施例的结构示意图。具体实施方式本专利技术的PE文件源代码一致性的判定方法,可以对两个及两个以上的PE文件是不是基于相同的源代码进行判定。根据PE文件的公开结构(通常是线性的数据流),可以获得PE文件所包含的段的数目及类型,对于由相同的源代码所生成的PE文件,其所包含的段的数目必须相同,因为段数目的制定需要修改源代码的内容,从而,当检测出各PE文件所包含的段的数目不相同时,即可直接判定各PE文件是来源于不同的源代码;此外,对于相同的源代码,即使其编译多次,其某些段的内容都是不会发生变化的,称之为关键段,通常情况下,这些段的名称是确定的,例如:.text段,这个段为代码段,其所包含的内容是指令代码,如果这个段的内容发生了变化,其所对应的源代码也一定是被修改过,即,如果是基于相同的源代码,各PE文件所包含的该.text段必然包含相同的内容;.data段,这个段为初始化数据段,包括了源代码编译时被初始化的全局和静态变量,因此,如果这个段的内容发生了变化,那么,源代码也必然被修改过;.idata段,这个段相当于一个导入表,包含了外来模块的函数以及数据信息,因此,如果这个段的内容发生了变化,则必然对其所对应的源代码进行了修改。基于此,本专利技术的PE文件源代码一致性的判定方法,包括以下步骤:判断各PE文件所包含的段的数目是否相同;若是,枚举所述各PE文件所包含的段,并判断所述各PE文件所具有的关-->键段的内容是否相同,若相同,则判定所述各PE文件内容是基于相同的源代码,若不相同,则判定所述各PE文件内容是基于不同的源代码;若否,则判定所述各PE文件基于不同的源代码。根据本专利技术的PE文件源代码一致性的判定方法,可以不需要依赖于PE文件所对应的源代码的内容,可直接根据PE文件的公开结构,对各待分析PE文件内容是不是基于相同的源代码进行判断,当检测出各PE文件所包含的段的数目不相同时,即可直接判定各PE文件是来源于不同的源代码;当各PE文件所包含的段的数目相同且所包含的各关键段的内容相同时,即可以判定各PE文件是基于相同的源代码,从而,应用本专利技术的判定方式,不需要依赖于原始的源代码内容,即可对PE文件的源代码的一致性进行判定,可以不影响源代码的安全性,操作便捷。[0]当判断了PE文件是否基于相同的源代码时,即可进行具体应用时的下一步应用操作过程,比如,当判定PE文件是基于不同的源代码时,可以对PE文件重新进行测试,当判定PE文件是基于相同的源代码时,则可以对确定的PE文件施行自动版本发布,或者做软件版本管理,或者是其他的应用操作过程,根据具体应用需要及环境的不同可以有所不同。此外,由于PE文件中还包含有调试信息,而对于来自于相同源代码的PE文件,其各自所包含的调试信息中除了第一非必要信息之外的其他信息也必要相同,该第一非必要信息包括时间戳信息,根据编译器类型及编译时的控制策略的不同,调试信息可以位于关键段也可以位于非关键段,通常情况下,该调试信息可位于非关键段。当调试信息位于关键段时,可采用上述本专利技术的方法进行判断,即当各PE文件所包含的段的数目相同且所包含的关键段的内容相同时,所述各PE文件是基于相同的源代码,而当调试信息位于非关键段时,则还要对各PE文件所包含的调试信息是否相同进行判定。故此,本专利技术的PE文件源代码一致性的判定方法,在判断各PE文件所具有的关键段的内容是否相同之前,还可以包括步骤:-->检测当前枚举段是否包含调试信息;若是,判断调试信息中除了第一非必要信息之外的其他信息是否相同,若不相同,则判定所述各PE文件内容是基于不同的源代码,若相同,则判断所述当前枚举段是否为关键段,所述第一非必要信息包括时间戳信息;若否,则判断所述当前枚举本文档来自技高网...

【技术保护点】
一种PE文件源代码一致性的判定方法,包括步骤: 判断各PE文件所包含的段的数目是否相同; 若是,枚举所述各PE文件所包含的段,并判断所述各PE文件所具有的关键段的内容是否相同,若相同,则判定所述各PE文件内容是基于相同的源代码, 若不相同,则判定所述各PE文件内容是基于不同的源代码; 若否,则判定所述各PE文件基于不同的源代码。

【技术特征摘要】
1、一种PE文件源代码一致性的判定方法,包括步骤:判断各PE文件所包含的段的数目是否相同;若是,枚举所述各PE文件所包含的段,并判断所述各PE文件所具有的关键段的内容是否相同,若相同,则判定所述各PE文件内容是基于相同的源代码,若不相同,则判定所述各PE文件内容是基于不同的源代码;若否,则判定所述各PE文件基于不同的源代码。2、根据权利要求1所述的PE文件源代码一致性的判定方法,其特征在于,在判断所述各PE文件所具有的关键段的内容是否相同之前,还包括步骤:检测当前枚举段是否包含调试信息;若是,判断调试信息中除了第一非必要信息之外的信息是否相同,若不相同,则判定所述各PE文件内容是基于不同的源代码,若相同,则判断所述当前枚举段是否为关键段,所述第一非必要信息包括时间戳信息;若否,则判断所述当前枚举段是否为关键段。3、根据权利要求1所述的PE文件源代码一致性的判定方法,其特征在于,还包括步骤:当所述各PE文件具有自定义段时,判断所述各PE文件的自定义段的数量和内容是否相同;若不相同,则判定所述各PE文件内容是基于不同的源代码;若相同,且所述各PE文件所包含的段的数目相同以及所包含的关键段的内容相同,则判定所述各PE文件是基于相同的源代码。4、根据权利要求1所述的PE文件源代码一致性的判定方法,其特征在于,还包括步骤:在判断所述各PE文件所具有的关键段的内容是否相同之前,检测当前枚举段是否包含调试信息;若是,判断调试信息中除了第一非必要信息之外的信息是否相同,若不相同,则判定所述各PE文件内容是基于不同的源代码,若相同,则判断所述当前枚举段是否为关键段,所述第一非必要信息包括时间戳信息;若否,则判断所述当前枚举段是否为关键段;以及,当所述各PE文件具有自定义段时,判断所述各PE文件的自定义段的数量和内容是否相同;若不相同,则判定所述各PE文件内容是基于不同的源代码;若相同,且所述各PE文件所包含的段的数目相同以及所包含的关键段的内容相同,则判定所述各PE文件是基于相同的源代码。5、根据权利要求1至4任意一项所述的PE文件源代码一致性的判定方法,其特征在于,所述判断关键段的内容是否相同的方法具体包括:当所述关键段为资源段时,比较所述资源段中除了第二非必要信息之外的信息是否相同,若相同,则判定所述各关键段的内容相同,若不相同,则判定所述各关键段的内容不相同,所述非必要信息包括版本信息;当所述关键段为非资源段时,比较该资源段中除了第三非必要信息之外的信息是否相同,若相同,则判定所述各关键段的内容相同,若不相同,则判定所述各关键段的内容不相同,所述第三非必要信息包括时间戳信息。6、一种PE文件源代码一致性的判定装置,包括:段数目判别模块,用于判断各PE文件所包含的段的数目是否相同,若不相同,则比较结果处理模块判定所述各PE文件是基于不同的源代码;段枚举模块,用于当所述段数目判别模块判断结果为相同时,对所述各PE文件所包含的段进行枚举;关键段判别模块,用于判断所述段枚举模块所枚举的当前枚举段...

【专利技术属性】
技术研发人员:王钊张康宗
申请(专利权)人:珠海金山软件股份有限公司
类型:发明
国别省市:44[中国|广东]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1