当前位置: 首页 > 专利查询>四川大学专利>正文

基于深度神经网络的以太坊钓鱼诈骗账户检测方法与装置制造方法及图纸

技术编号:29940773 阅读:29 留言:0更新日期:2021-09-04 19:25
本发明专利技术公开了一种基于深度神经网络的以太坊钓鱼诈骗账户检测方法与装置,首先有目标性地采集了权威网站Etherscan上的钓鱼诈骗账户列表用以标注账户类别,然后基于这些钓鱼诈骗账户构建了以太坊钓鱼诈骗子网络,并从中整理得到数据集ETHScam;ETHScam针对以太坊账户以及账户所参与的所有交易记录提取了15个特征,包括账户状态特征、账户交易网络特征和账户交易序列特征三个类别;最终,提出一个以太坊钓鱼诈骗账户检测模型MFL。该模型使用FCN和LSTM来提取账户交易序列特征的数值特征向量和时序特征向量,并结合BP神经网络学习账户状态特征和账户交易网络特征得到账户的统计特征向量,实现了对账户的分类。实现了对账户的分类。实现了对账户的分类。

【技术实现步骤摘要】
基于深度神经网络的以太坊钓鱼诈骗账户检测方法与装置


[0001]本专利技术涉及网络安全
,具体为一种基于深度神经网络的以太坊钓鱼诈骗账户检测方法与装置。

技术介绍

[0002]区块链技术是以比特币、以太坊为代表的众多加密货币方案的底层核心技术,最初设计目的是解决电子支付中过度依赖可信第三方的问题。区块链组合使用P2P网络、分布式计算等成熟技术,并结合哈希函数、非对称密码、数字签名和零知识证明等密码学技术,成为一种全新的分布式基础架构和计算范式。区块链技术极具应用潜力,其应用范围已从最初的加密货币延伸至金融、物联网、智能制造等多个领域,引起了工业界、学术界和国家层面的广泛关注。世界经济论坛对区块链在金融场景下的应用进行了预测分析,认为区块链将在跨境支付、保险、贷款等多方面重塑金融市场基础设施。
[0003]随着理论研究的深入,区块链在不断持续展现出蓬勃生命力的同时,其自身的安全问题逐渐显露。针对加密货币应用的安全威胁以及针对区块链平台的各种犯罪行为呈现高发态势。在交易平台被盗事件频发、智能合约漏洞凸显、利用匿名交易实施犯罪等威胁之外,借助区块链加密货币实施的钓鱼诈骗犯罪行为尤其猖獗,引发公众对区块链安全性的质疑和对其发展前景的担忧,严重影响加密货币的价值存储功能。因此,目前迫切需要一种新的方法来更加高效而精确地识别出实施钓鱼诈骗犯罪行为的账户,从而打击区块链经济犯罪行为、保护用户的资产。
[0004]以太坊作为下一代加密货币与去中心化应用平台,是区块链技术一次重大革新与发展。它支持通过创建智能合约发布分布式应用程序,具有成为去中心化世界虚拟机的潜质。支撑以太坊运行的以太币目前是市值排名第二的加密货币,价值超过3000亿美元。在价值居高的同时,以太坊上的网络钓鱼诈骗活动也日益猖獗。报告指出,仅在2018年,研究机构就发现以太坊上有超过2000个钓鱼诈骗账户,这些钓鱼诈骗账户从近4万人手中骗取了价值超过3600万美元的加密货币。目前,已经有一些研究者提出了对以太坊钓鱼诈骗账户的检测方法,但是还存在准确率不高的问题。因此,本专利技术针对这样的问题,提出了一种基于深度神经网络的简单高效的以太坊钓鱼诈骗账户检测方法。

技术实现思路

[0005]针对上述问题,本专利技术的目的在于提供一种基于深度神经网络的以太坊钓鱼诈骗账户检测方法与装置,深度学习能自主学习到数据中的有效特征,检测结果能够明显优于传统的机器学习模型,且能够对交易进行特征分析提取进而提取钓鱼账户本身的生命周期特点,从而更为有效地鉴别钓鱼诈骗账户,检测的准确率更高。
[0006]本专利技术技术方案如下:一种基于深度神经网络的以太坊钓鱼诈骗账户检测方法,包括以下步骤:步骤1:通过网络爬虫和以太坊节点,获取账户的地址、标记和交易的相关字段,构
建以太坊钓鱼诈骗二阶子网络;从中分析并提取出以太坊钓鱼诈骗的账户交易序列特征、账户状态特征和账户交易网络特征,构建以太坊钓鱼诈骗账户数据集ETHScam;步骤2:构建一个基于FCN

LSTM网络和BP神经网络的深度学习模型,模型命名为MFL,根据输入的以太坊钓鱼诈骗账户数据集ETHScam进行特征提取:将账户交易序列特征投入FCN(fully convolutional network,全卷积神经网络)和LSTM(long short term memory network,长短期记忆神经网络)并置的网络中提取出交易的数值特征向量和时序特征向量,将账户状态特征和账户交易网络特征投入BP神经网络学习得到统计特征向量;步骤3:将统计特征向量、数值特征向量和时序特征向量进行拼接,然后将其输入到全连接神经网络构建的分类器中进行分类,得到账户是否为钓鱼账户的分类结果。
[0007]进一步的,所述以太坊钓鱼诈骗二阶子网络具体包括:通过编写爬虫程序从网站Etherscan上获取标注数据;使用Bigquery服务快速查找得到需要的以太坊区块、账户和交易的统计数据;在本地服务器运行一个以太坊节点,实时与以太坊主网络同步,通过查询本地全节点同步的以太坊数据,以Etherscan标记的钓鱼诈骗账户为起点,向外枚举扩展邻点构建以太坊钓鱼诈骗二阶子网络。
[0008]更进一步的,步骤1中,所述构建以太坊钓鱼诈骗账户数据集ETHScam具体包括:步骤1.1:提取账户交易序列特征:选择已经被标记的账户作为钓鱼诈骗账户,随机选择出未被标记的账户作为正常账户;对于被选择的钓鱼诈骗账户和正常账户,先从子网络数据中取出其参与的所有交易记录,然后提取出每个交易中的交易时间戳、交易以太币数目、交易手续费与转账方向共计4个字段;对于交易手续费GasPrice,计算其与块内平均交易手续费AvgGasPrice的比值GasPriceRatio,计算公式为:其中,通过Bigquery的SQL查询功能获取块内平均交易手续费AvgGasPrice数据;步骤1.2:提取账户状态特征:基于Bigquery和上一步骤获取到的交易记录,计算得到账户目前的状态信息,具体为通过Bigquery查询到指定账户目前的余额;计算参与的交易数据得到账户接收和转出的以太币数目以及转出以太币数目与接收以太币数目的比值;步骤1.3:提取账户交易网络特征:将账户参与的所有交易按照交易方向划分为转入交易和转出交易两类,统计两类交易的数目得到转入账户数目、转出账户数目以及转入转出账户数目比值;再计算两类交易的平均转账以太币数目得到平均转入以太币数目、平均转出以太币数目以及平均转入转出以太币数目比值。
[0009]更进一步的,所述账户交易序列特征包括交易时间戳、交易以太币数目、交易方向和交易手续费比值;所述账户状态特征包括账户余额、账户涉及交易数量、接收以太币数目、转出以太币数目和以太币转出接收比值;所述账户交易网络特征包括转入账户数目、转出账户数目、转入转出账户数目比值、平均转入以太币数目、平均转出以太币数目和平均转入转出以太币数目比值。
[0010]更进一步的,所述深度学习模型包括:输入层:所述输入层用于输入预处理之后得到的账户交易时间序列、账户状态特征和账户
交易网络特征;所述输入层分三部分,第一部分将经过预处理后的账户交易时间序列TS作为输入;交易时间序列预处理为对原始账户交易时间序列TS0使用滑动窗口采样法采样并进行归一化得到TS;该部分输出将会投入到特征提取层中用于提取账户交易时序序列的时序特征向量和数值特征向量;输入层的第二部分和第三部分将账户状态特征和账户交易网络特征的统计特征向量直接并置到时序特征向量和数值特征向量之后,作为分类器的输入;特征提取:所述特征提取包括两大模块,分别为基于全卷积神经网络FCN的第一特征提取模块和基于LSTM的第二特征提取模块;第一特征提取模块将经过预处理后的账户交易时间序列作为输入,投入到全卷积神经网络中处理后,经过一个全局池化层得到时序变量的内部隐含特征M,M是32维的数值特征向量;第二特征提取模块用于提取时序特征,其包括8个细胞,输入层Dropout率设置为0.2,隐藏层Dropout率设置为0.5;最终输本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度神经网络的以太坊钓鱼诈骗账户检测方法,其特征在于,包括以下步骤:步骤1:通过网络爬虫和以太坊节点,获取账户的地址、标记和交易的相关字段,构建以太坊钓鱼诈骗二阶子网络;从中分析并提取出以太坊钓鱼诈骗的账户交易序列特征、账户状态特征和账户交易网络特征,构建以太坊钓鱼诈骗账户数据集ETHScam;步骤2:构建一个基于FCN

LSTM网络和BP神经网络的深度学习模型,模型命名为MFL,根据输入的以太坊钓鱼诈骗账户数据集ETHScam进行特征提取:将账户交易序列特征投入FCN和LSTM并置的网络中提取出交易的数值特征向量和时序特征向量,将账户状态特征和账户交易网络特征投入BP神经网络学习得到统计特征向量;步骤3:将统计特征向量、数值特征向量和时序特征向量进行拼接,然后将其输入到全连接神经网络构建的分类器中进行分类,得到账户是否为钓鱼账户的分类结果。2.根据权利要求1所述的基于深度神经网络的以太坊钓鱼诈骗账户检测方法,其特征在于,所述以太坊钓鱼诈骗二阶子网络具体包括:通过编写爬虫程序从网站Etherscan上获取标注数据;使用Bigquery服务快速查找得到需要的以太坊区块、账户和交易的统计数据;在本地服务器运行一个以太坊节点,实时与以太坊主网络同步,通过查询本地全节点同步的以太坊数据,以Etherscan标记的钓鱼诈骗账户为起点,向外枚举扩展邻点构建以太坊钓鱼诈骗二阶子网络。3.根据权利要求1所述的基于深度神经网络的以太坊钓鱼诈骗账户检测方法,其特征在于,步骤1中,所述构建以太坊钓鱼诈骗账户数据集ETHScam具体包括:步骤1.1:提取账户交易序列特征:从太坊钓鱼诈骗二阶子网络中选择已经被标记的账户作为钓鱼诈骗账户,随机选择出未被标记的账户作为正常账户;对于被选择的钓鱼诈骗账户和正常账户,先从子网络数据中取出其参与的所有交易记录,然后提取出每个交易中的交易时间戳、交易以太币数目、交易手续费与转账方向共计4个字段;对于交易手续费GasPrice,计算其与块内平均交易手续费AvgGasPrice的比值GasPriceRatio,计算公式为:其中,通过Bigquery的SQL查询功能获取块内平均交易手续费AvgGasPrice数据;步骤1.2:提取账户状态特征:基于Bigquery和上一步骤获取到的交易记录,计算得到账户目前的状态信息,具体为通过Bigquery查询到指定账户目前的余额;计算参与的交易数据得到账户接收和转出的以太币数目以及转出以太币数目与接收以太币数目的比值;步骤1.3:提取账户交易网络特征:将账户参与的所有交易按照交易方向划分为转入交易和转出交易两类,统计两类交易的数目得到转入账户数目、转出账户数目以及转入转出账户数目比值;再计算两类交易的平均转账以太币数目得到平均转入以太币数目、平均转出以太币数目以及平均转入转出以太币数目比值。4.根据权利要求1所述的基于深度神经网络的以太坊钓鱼诈骗账户检测方法,其特征在于,所述账户交易序列特征包括交易时间戳、交易以太币数目、交易方向和交易手续费比值;所述账户状态特征包括账户余额、账户涉及交易数量、接收以太币数目、转出以太币数目和以太币转出接收比值;所述账户交易网络特征包括转入账户数目、转出账户数目、转入
转出账户数目比值、平均转入以太币数目、平均转出以太币数目和平均转入转出以太币数目比值。5.根据权利要求1所述的基于深度神经网络的以太坊钓鱼诈骗账户检测方法,其特征在于...

【专利技术属性】
技术研发人员:王海舟文廷科肖元星韩莉君王安琪
申请(专利权)人:四川大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1