当前位置: 首页 > 专利查询>广州大学专利>正文

基于支持向量机的DApp攻击检测模型建立方法及装置制造方法及图纸

技术编号:39006173 阅读:17 留言:0更新日期:2023-10-07 10:37
本公开提供了一种基于支持向量机的DApp攻击检测模型建立方法及装置,其中,方法包括:获取函数调用序列数据集,对功能及结构相似的函数调用序列进行归一化,去除无用信息或噪声,获得数据预处理后的函数调用序列数据集;使用N

【技术实现步骤摘要】
基于支持向量机的DApp攻击检测模型建立方法及装置


[0001]本文件涉及区块链安全
,尤其涉及一种基于支持向量机的DApp攻击检测模型建立方法及装置。

技术介绍

[0002]在区块链安全领域,DApp(Decentralized Application)是一种构建在去中心化网络上,结合了智能合约和用户界面的应用程序,以太网应用场景的多样化导致DApp逐渐暴露出更多安全隐患,其中,智能合约漏洞指由于程序内部的错误逻辑或安全性考虑不周导致攻击者利用合约的漏洞进行攻击,区块链应用层的漏洞主要来源于DApp本身。
[0003]智能合约漏洞检测的传统方案基于静态分析技术,生成用于机器学习智能合约攻击检测的数据集较少,应用层漏洞检测的传统方案静态分析受代码混淆影响大,动态分析法忽略了函数之间的语义关系。
[0004]目前,常见的结合机器学习神经网络实现DApp攻击检测的方案中存在以下缺陷:生成数据集的交易只是模拟交易;在一个完整的状态空间中需探索所有可能的执行路径导致执行时间较长;对具有漏洞的DApp进行红色报警标记会导致利用标记攻击,检测所用的函数调用序列种类太少。
[0005]综合以上该
发展状况分析,现有的技术中机器学习相关方案,缺少根据实际部署情况,从大量的完整函数调用序列数据中检测DApp攻击的方法。

技术实现思路

[0006]本专利技术的目的在于提供一种基于支持向量机的DApp攻击检测模型建立方法及装置,旨在解决现有技术中的上述问题。
[0007]根据本公开实施例的第一方面,提供一种基于支持向量机的DApp攻击检测模型建立方法,包括:
[0008]获取函数调用序列数据集,简化函数调用序列的种类,对功能及结构相似的函数调用序列进行归一化,去除无用信息或噪声,获得数据预处理后的函数调用序列数据集;
[0009]使用N

gram模型对数据预处理后的函数调用序列数据集中的函数调用序列进行切片操作,得到切片后函数调用序列数据集,使用TF

IDF算法对切片后函数调用序列数据集中的函数调用序列向量化,得到向量化函数调用序列数据集;
[0010]攻击检测模型,,使用训练集和测试集,对多分类SVM的DApp攻击检测模型进行训练和测试,得到最终的多分类SVM的DApp攻击检测模型。
[0011]根据本公开实施例的第二方面,提供一种基于支持向量机的DApp攻击检测模型建立装置,包括:
[0012]获取预处理模块,用于获取函数调用序列数据集,简化函数调用序列的种类,对功能及结构相似的函数调用序列进行归一化,去除无用信息或噪声,获得数据预处理后的函数调用序列数据集;
[0013]切片向量化模块,用于使用N

gram模型对数据预处理后的函数调用序列数据集中的函数调用序列进行切片操作,得到切片后函数调用序列数据集,使用TF

IDF算法对切片后函数调用序列数据集中的函数调用序列向量化,得到向量化函数调用序列数据集;
[0014]模型训练测试模块,用于构建多分类SVM的DApp攻击检测模型,以函数调用序列的种类为依据,将向量化函数调用序列数据集划分为训练集和测试集,使用训练集和测试集,对多分类SVM的DApp攻击检测模型进行训练和测试,得到最终的多分类SVM的DApp攻击检测模型。
[0015]本公开的实施例提供的技术方案可以包括以下有益效果:采用的函数调用序列数据集数据量庞大且具备上下文联系的时间序列,提高了DApp攻击检测的准确性;利用自然语言处理中的N

gram和TF

IDF模型对实时获取的函数调用序列向量化,更大程度保留原有的语义信息。
[0016]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0017]为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0018]图1是本专利技术实施例的基于支持向量机的DApp攻击检测模型建立方法的流程图;
[0019]图2是本专利技术实施例的检测DApp攻击方式过程的示意图;
[0020]图3是本专利技术实施例的基于支持向量机的DApp攻击检测模型建立装置的示意图。
具体实施方式
[0021]为了使本
的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件的保护范围。
[0022]技术用语说明
[0023]区块链:一种去中心化的分布式账本,本质上为一个数据可追溯的共享数据库,连接数据库的节点组成点对点网络并遵循某种共识机制,链上数据利用密码学算法加密签名,结构上是一条由保存着节点交易数据的区块搭建成的链表,默克尔树结构的使用确保区块数据不被篡改。
[0024]智能合约:一段由高级语言书写的部署在区块链上的不可篡改且公开透明的程序代码,合约发布后作为一个合约账户接受其他账户发起的调用交易,调用后自动制定编写好的程序,接收信息输入并完成对虚拟财产的转移和储存,同时不受第三方干预。
[0025]以太坊:一个开源的有智能合约功能的公共区块链平台,通过专用的加密货币以太币提供去中心化的以太坊虚拟机处理点对点合约。
[0026]DApp:基于区块链技术的应用程序,不依赖于一家中心化的服务器或者一个单独的实体,而是基于区块链网络自主运行,由智能合约驱动。可应用于去中心化交易所、数字货币钱包、游戏、社交媒体和医疗保健等多领域,去中心化方式为这些应用程序提供了更加安全、透明和可靠的服务。
[0027]N

gram:一种基于统计语言模型的算法,基本思想为将文本里的内容按照字节进行大小为N的滑动窗口操作,形成长度为N的字节片段序列,对形成的每一个字节片段garm进行频度统计,并且按照事先设定好的阈值进行过滤,形成完整的garm列表,即该文本的向量特征空间,列表中的每一种garm就是一个特征向量维度。
[0028]TF

IDF:一种统计方法,用于评估一个字词对于一个文件集或一个语料库中的其中一份文件的重要程度。
[0029]SVM:一类按监督学习方式对数据进行分类的广义线性分类器,核心思想为从输入空间提供一个更高维度的映射。
[0030]API函数:应用编程接口中可供编程人员调用的函数或方法,可被本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于支持向量机的DApp攻击检测模型建立方法,其特征在于,包括:获取函数调用序列数据集,简化函数调用序列的种类,对功能及结构相似的函数调用序列进行归一化,去除无用信息或噪声,获得数据预处理后的函数调用序列数据集;使用N

gram模型对数据预处理后的所述函数调用序列数据集中的函数调用序列进行切片操作,得到切片后函数调用序列数据集,使用TF

IDF算法对所述切片后函数调用序列数据集中的函数调用序列向量化,得到向量化函数调用序列数据集;构建多分类SVM的DApp攻击检测模型,以所述函数调用序列的种类为依据,将所述向量化函数调用序列数据集划分为训练集和测试集,使用所述训练集和所述测试集,对所述多分类SVM的DApp攻击检测模型进行训练和测试,得到最终的多分类SVM的DApp攻击检测模型。2.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:通过所述最终的多分类SVM的DApp攻击检测模型对DApp的攻击行为进行分类。3.根据权利要求1所述的方法,其特征在于,所述获取函数调用序列数据集,简化函数调用序列的种类具体包括:从MongoDB数据库上获取所述调用序列数据集,根据DApp攻击方式可将所述调用序列数据集划分为:正常序列A0、重入攻击序列A1、恶意授权攻击序列A2、漏洞利用攻击序列A3、数据篡改攻击序列A4以及信息泄露攻击序列A5。4.根据权利要求1所述的方法,其特征在于,所述使用N

gram模型对所述数据预处理后的函数调用序列数据集中的函数调用序列进行切片操作具体包括:设置所述N

gram中的N值,根据N值对所述数据预处理后的函数调用序列数据集中的函数调用序列进行切片操作。5.根据权利要求1所述的方法,其特征在于,所述使用TF

IDF算法对所述切片后函数调用序列数据集中的函数调用序列向量化操作具体包括:所述使用TF

IDF算法对所述切片后函数调用序列数据集中的函数调用序列向量化为826维的函数调用序列向量。6.根据权利要求1所述的方法,其特征在于,所述使用所述训练集和所述测试集,对所述多分类SVM的DApp攻击检测模型进行训练和测试具体包括:将测试集输入到已经训练好的多分类SVM的DApp攻击检测模型中,所述DApp攻击检测模型的输出为除训练使用之外的其它所有攻击方式的发生概率,概率之和为1;设置概率求和参数sum_prob和最大概念参数max_prob,分别表示所述测试集除正常序列以外输出的所有攻击方式的发生概率和、以及输出的所有...

【专利技术属性】
技术研发人员:王国军张雨恒李培强翟广鑫陈厚积刘雪蕾朱津瑶
申请(专利权)人:广州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1