基于语义分割的恶意软件基因快速检测方法和装置制造方法及图纸

技术编号：20623132 阅读：19 留言：0更新日期：2019-03-20 14:41

本发明专利技术提供了一种基于语义分割的恶意软件基因快速检测方法及装置，由基因库训练后的语义分割模型可极大提高实时样本的匹配检测效率，被训练后的语义分割模型不需要携带基因库的特性甚至可嵌入离线实时安全产品中；自动抽象特征提取特性及后续成熟的优化技术可提高恶意变形的基因识别正确率。

A Rapid Detection Method and Device for Malware Genes Based on Semantic Segmentation

The present invention provides a rapid detection method and device for malicious software genes based on semantic segmentation. The semantic segmentation model trained by gene library can greatly improve the efficiency of matching detection of real-time samples. The trained semantic segmentation model does not need to carry the characteristics of gene library, and can even be embedded in off-line real-time security products; the automatic abstract feature extraction characteristics and the advantages of subsequent maturity. Chemical technology can improve the correct rate of gene recognition for malicious deformation.

全部详细技术资料下载

【技术实现步骤摘要】
基于语义分割的恶意软件基因快速检测方法和装置
本专利技术涉及信息安全
，具体而言，涉及一种基于语义分割的恶意软件基因快速检测方法和装置。
技术介绍
恶意软件基因提取及识别技术大概于2008年左右被提出，前期主要将使用的特定个人习惯的代码片段提取为基因用于识别恶意软件开发者或APT组织，后续逐渐扩大加入恶意软件家族基因用于识别其变种迭代和新家族判断。目前，常规的恶意软件基因匹配技术有两大问题：1.基因库的规模随恶意软件数量的增加而呈指数级增长，带来常规检索和匹配方式效率低下，甚至无法落地应用；2.庞大的基因库无法嵌入安全产品或离线部署；3.常规模糊匹配技术或人工经验形成的预处理技术，对恶意变形的基因识别正确率较差。
技术实现思路
针对上述现有技术中存在的问题，本专利技术提供了一种基于语义分割的恶意软件基因快速检测方法和装置。第一方面，本专利技术实施例提供了一种基于语义分割的恶意软件基因快速检测方法，所述方法包括：将待检测样本进行反汇编成待检测反汇编代码；将待检测反汇编代码转化成待检测图片；将所述待检测图片输入语义分割模型，输出解析图片；根据所述解析图片，得到检测结果。进一步的，所述语义分割模型训练方法包括：获取基础样本，并对所述基础样本进行反汇编成样本反汇编代码；将样本反汇编代码转化成样本图片，并且将所述样本图片整理成数据集；利用上所述数据集训练原有语义分割模型形成语义分割模型。进一步的，将样本反汇编代码转化成样本图片，并且将所述样本图片整理成数据集，包括：将所述数据集按7:2:1的比例分为训练集、验证集和交叉测试集。进一步的，利用上所述数据集训练原有语义...

【技术保护点】
1.一种基于语义分割的恶意软件基因快速检测方法，其特征在于，所述方法包括：将待检测样本进行反汇编成待检测反汇编代码；将待检测反汇编代码转化成待检测图片；将所述待检测图片输入语义分割模型，输出解析图片；根据所述解析图片，得到检测结果。

【技术特征摘要】
1.一种基于语义分割的恶意软件基因快速检测方法，其特征在于，所述方法包括：将待检测样本进行反汇编成待检测反汇编代码；将待检测反汇编代码转化成待检测图片；将所述待检测图片输入语义分割模型，输出解析图片；根据所述解析图片，得到检测结果。2.根据权利要求1所述的方法，其特征在于，所述语义分割模型训练方法包括：获取基础样本，并对所述基础样本进行反汇编成样本反汇编代码；将样本反汇编代码转化成样本图片，并且将所述样本图片整理成数据集；利用上所述数据集训练原有语义分割模型形成语义分割模型。3.根据权利要求2所述的方法，其特征在于，将样本反汇编代码转化成样本图片，并且将所述样本图片整理成数据集，包括：将所述数据集按7:2:1的比例分为训练集、验证集和交叉测试集。4.根据权利要求3所述的方法，其特征在于，利用上所述数据集训练原有语义分割模型形成语义分割模型，包括：利用训练集、验证集和交叉测试集来训练测试原有语义分割模型。5.根据权利要求1所述的方法，其特征在于，将所述待检测图片输入语义分割模型，输出解析图片之后，所述方法还包括：根据待检测...

【专利技术属性】
技术研发人员：涂小毅，范渊，
申请(专利权)人：杭州安恒信息技术股份有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人