基于深度学习的恶意代码同源判定方法技术

技术编号：19425920 阅读：32 留言：0更新日期：2018-11-14 10:44

本发明专利技术提供了一种基于深度学习的恶意代码同源判定方法，包括：利用IDA工具，对于待判定的恶意代码进行反汇编，通过正则表达式匹配得到其中核心二进制内容，同时去除无用信息；接收二进制内容作为输入，利用恶意代码可视化算法，将二进制内容映射为恶意代码图像；利用恶意代码图像与标签值组成的样本集，对深度学习模型卷积神经网络进行训练，得到成熟的判定模型。接收待判定的恶意代码作为输入，完成同源判定。本发明专利技术通过恶意代码可视化算法，将同源判定任务转化为图像分类任务，结合深度学习判定模型，实现了一个可用的恶意代码同源判定方法。实现比现有系统更高判定准确率的同源判定技术。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的恶意代码同源判定方法
本专利技术涉及互联网信息安全
，具体地，涉及的是一种基于深度学习的恶意代码同源判定方法，通过恶意代码可视化算法，将同源判定任务转化为图像分类任务，结合深度学习判定模型，实现了一个可用的恶意代码同源判定方法。
技术介绍
互联网时代到来，信息技术迅猛发展，它在为人们提供种种便利的同时，也带来了潜在的信息安全问题，尤其是网络安全问题，它威胁着用户信息财产的安全，而恶意代码的泛滥就是其中之一。恶意代码指的是所有携带恶意攻击的软件的实现代码，它是一种违背了目标系统安全策略的程序代码，其目的包括造成系统信息的泄露与资源滥用、破坏目标系统的完整性与可用性。针对爆发式增长的恶意代码，安全研究人员对恶意代码分析技术做出深入研究。结果发现，很多新型的恶意代码都是来自于已有的恶意代码的变种。代码编写者利用变形、加壳、多态、代码扰乱等技术对原有代码做处理，以躲避例如特征码匹配等传统恶意代码检测技术，这些代码往往具有高度相似的结构、雷同的函数调用顺序与代码编写习惯等。对未知恶意代码进行同源性判定能够找出与其具有相似特征的、已记录在库的同源恶意代码，从而做出快速响应与处理。恶意代码可视化思想用于恶意代码分析研究已有学者进行一定研究，该思想最早是由加利福尼亚大学的Nataraj和Karthikeyan在2011年提出的，利用图像中的纹理特征对恶意代码进行分析与检测。而近年来，伴随着深度学习技术的迅猛发展，卷积神经网络在图像识别领域展现出卓越性能，为恶意代码图像的分类判定提供新的模型选择。目前没有发现同本专利技术类似技术的说明或报道，也尚未收集到...

【技术保护点】
1.一种基于深度学习的恶意代码同源判定方法，其特征在于，包括以下步骤：步骤S1，恶意代码预处理：对于待判定的恶意代码进行反汇编，通过正则表达式匹配得到其中核心二进制内容，同时去除无用信息；步骤S2，恶意代码可视化：接收步骤S1中得到的核心二进制内容作为输入，利用恶意代码可视化算法，将核心二进制内容映射为恶意代码图像；步骤S3，基于深度学习的同源判定：利用步骤S2中得到的恶意代码图像与标签值组成的样本集，对深度学习模型卷积神经网络进行训练，得到成熟的判定模型；接收待判定的恶意代码作为输入，完成同源判定。

【技术特征摘要】
1.一种基于深度学习的恶意代码同源判定方法，其特征在于，包括以下步骤：步骤S1，恶意代码预处理：对于待判定的恶意代码进行反汇编，通过正则表达式匹配得到其中核心二进制内容，同时去除无用信息；步骤S2，恶意代码可视化：接收步骤S1中得到的核心二进制内容作为输入，利用恶意代码可视化算法，将核心二进制内容映射为恶意代码图像；步骤S3，基于深度学习的同源判定：利用步骤S2中得到的恶意代码图像与标签值组成的样本集，对深度学习模型卷积神经网络进行训练，得到成熟的判定模型；接收待判定的恶意代码作为输入，完成同源判定。2.根据权利要求1所述的基于深度学习的恶意代码同源判定方法，其特征在于，步骤S1中，利用IDA工具，对于待判定的恶意代码进行反汇编，得到汇编代码，并将汇编代码作为处理对象；对汇编代码标注代码段、数据段和资源段，并将代码段与数据段作为恶意代码核心内容，忽略汇编代码的资源段；利用正则表达式匹配方法提取恶意代码核心内容的二进制串，即得到核心二进制内容。3.根据权利要求2所述的基于深度学习的恶意代码同源判定方法，其特征在于，步骤S1中，所述无用信息，是指汇编代码中存在的用于提高访问效率的数据对齐伪指令。4.根据权利要求1所述的基于深...

【专利技术属性】
技术研发人员：褚乾峰，朱信宇，许镇泉，刘功申，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人