当前位置: 首页 > 专利查询>复旦大学专利>正文

一种面向UTXO模型区块链的勒索地址识别方法技术

技术编号:37543673 阅读:11 留言:0更新日期:2023-05-12 16:13
本发明专利技术属于区块链领域,具体为一种面向UTXO模型区块链的勒索地址识别方法。本发明专利技术包括:针对勒索活动交易行为提取地址本身的交易特征;创新地定义四种交易关系,聚合相关地址特征以构建级联交易特征;利用正样本无标签学习方法消减数据不平衡影响,构建勒索地址识别模型;快速更新地址特征,实现勒索活动及时预警。本发明专利技术能够在UTXO模型区块链中高效准确地识别用于勒索活动的区块链地址,协助区块链监管和非法活动打击。本发明专利技术还对其他支付网络中的勒索地址识别方案提供参考,通过自定义修改本身交易特征的提取,即可设计出针对不同支付网络的勒索地址识别方案,以利于打击区块链中异常猖獗且危害极大的勒索活动,具有很好的应用前景。用前景。用前景。

【技术实现步骤摘要】
一种面向UTXO模型区块链的勒索地址识别方法


[0001]本专利技术属于区块链
,具体涉及面向UTXO模型区块链的勒索地址识别方法。

技术介绍

[0002]区块链提供了一种去中心化的匿名支付机制,使勒索软件运营商能够收集赎金而不必担心被追踪。因此,自区块链投入使用以来,勒索软件活动变得越来越猖獗。例如,全球勒索软件WannaCry在2017年通过加密文件入侵了150个国家的超过300,000台计算机,受害者需要向勒索软件文件中硬编码的三个区块链地址支付300至600美元。2021年6月9日,Meatpacker JBS USA在一次网络攻击扰乱了该公司在北美和澳大利亚的业务之后,通过区块链支付了相当于1100万美元的赎金。这表明区块链的出现在很大程度上促成了猖獗的勒索软件活动。由于区块链的匿名性,大量勒索软件地址未被披露和识别。因此,挖掘更多勒索软件地址以更好地衡量赎金支付及其整体经济影响是一个具有关键社会重要性的重要问题。
[0003]与银行的账户模型不同,UTXO模型区块链系统使用未使用的交易输出(UTXO)交易模型来保护用户隐私并防止双重支出。为了方便用户,UTXO可以通过交易进行组合和拆分,以任何面额进行支付。因此,UTXO模型区块链交易可以有多个输入和输出,其中每个输入或输出实际上是一个UTXO。与账户模型中的一对一交易格式相比,UTXO模型区块链可以有多个输入和输出的交易格式揭示了UTXO模型区块链地址之间更复杂的交易关系。对交易关系的深入分析有助于识别UTXO模型区块链中的勒索地址。/>
技术实现思路

[0004]本专利技术的目的是为了解决勒索活动犯罪分子利用区块链收取和转移赎金,以此来掩盖自己的真实身份以及资金去向的问题,提供一个面向UTXO模型区块链的高效准确的勒索地址识别方法。
[0005]本专利技术提供的面向UTXO模型区块链的勒索地址识别方法,具体步骤为:
[0006]步骤一、提取地址本身的交易特征
[0007]总结勒索活动的交易行为特征,首先提取目标地址的历史交易数据。根据历史交易数据从三个角度提取地址本身的18个交易特征,包括交易数量角度、交易金额角度和UTXO模型角度。具体如表1所示。
[0008]表1,地址本身的交易特征
[0009][0010][0011]步骤二、确定交易关系及提取地址的级联交易特征
[0012]提取与目标地址发生交易的相关地址构成相关地址集合,根据UTXO交易模型的格式定义如下四种交易关系:左邻居,右邻居,左兄弟,右兄弟;利用如下四种函数:最大值、最小值、平均值和标准差函数,聚合目标地址和相关地址的所有交易特征,拼接得到目标地址的级联交易特征。
[0013]上述步骤中,确定交易关系及提取地址的级联交易特征的具体流程如下:
[0014](1)遍历目标地址的历史交易数据,根据UTXO模型交易的多输入

多输出格式,定义与目标地址属于同一侧(交易输入或者交易输出)的相关地址为兄弟地址,定义与目标地址不属于同一侧的相关地址为邻居地址;
[0015](2)当目标地址位于交易输入一侧时,进一步定义它的兄弟地址为左兄弟地址,定义它的邻居地址为右邻居地址;当目标地址位于交易输出的一侧时,进一步定义它的兄弟地址为右兄弟地址,定义它的邻居地址为左邻居地址;参见图2所示;如在交易1中,目标地址位于交易输出,则交易输入中的地址为左邻居,交易输出中的其他地址为右兄弟。在交易2中,目标地址位于交易输入,则交易输入中的其他地址为左兄弟,交易输出中的地址为右
邻居。
[0016](3)利用如下四种函数:最大值、最小值、平均值和标准差函数,来聚合四组关系中相关地址的每个交易特征;针对每个交易特征,用上述四种函数计算每组关系中所有相关地址该特征的四个聚合结果,最终与地址本身的交易特征进行特征拼接,得到级联交易特征,参见如图3所示;
[0017]步骤三、基于PU

learning(正样本无标签学习)构建勒索地址识别模型
[0018]针对UTXO模型区块链地址总量巨大、已知的勒索地址仅占十万分之三的数据不平衡问题,每次迭代过程随机选取一部分非勒索地址样本,与全部勒索地址构成训练集,利用决策树机器学习算法,学习两部分地址级联交易特征的不同点,建立勒索地址识别模型,判断地址是否参与勒索活动;
[0019]步骤四:快速特征更新,及时预警勒索活动
[0020]针对UTXO模型区块链交易随时间不断增加会改变地址级联交易特征的情况,当一笔新交易产生时,更新地址相关的历史交易数据以及相关地址集合,通过原本的交易特征和级联交易特征推算出更新后的特征,无需重新计算,利用识别模型判断相关地址是否有参与勒索活动的迹象。
[0021]上述步骤中,快速特征更新,及时预警勒索活动的具体流程为:
[0022](1)在计算地址的级联交易特征过程中,记录此时每一个地址参与的交易数量、相关地址集合和本身交易特征。
[0023](2)当一笔新交易出现的时候,提取该交易中的所有地址,更新上次计算的每个地址本身交易特征中的最大值、最小值和求和值特征。复原其中的平均值特征,然后根据这笔新交易的交易信息计算新平均值特征。
[0024](3)更新相关地址集合中每个地址的级联交易特征,只更新该地址的对应交易关系部分的特征值,并用上一步中的方法更新特征值,无需重新计算。
[0025]本专利技术提供的面向UTXO模型区块链的勒索地址识别方法,根据目标地址在交易中的位置,将相关地址划分为四组(左邻居、右邻居、左兄弟、右兄弟);然后通过四个函数将相关地址的交易特征聚合成目标地址的级联交易特征,实现更加准确的交易行为特征提取。
[0026]本专利技术支持消减已知的勒索地址数量占比极小对识别模型的不良影响,借助PU

learning的思想,每次迭代过程随机选取一定量非勒索地址与全部已知勒索地址共同组成训练集,然后利用树模型不断迭代学习两部分数据的差异,建立勒索地址识别模型。
[0027]本专利技术提供交易特征快速更新方法,在计算当前时刻的交易特征和级联交易特征时,记录相关参数。当一笔新交易出现时,不需要从头计算地址的交易特征与级联交易特征,而是利用已计算的特征和记录的相关参数快速计算出相关特征。
[0028]本专利技术提供面向UTXO模型区块链的高精度的勒索地址识别方法,首先根据勒索地址的交易行为特征提取地址本身的交易特征,然后根据UTXO交易格式确定相关地址的交易关系,聚合地址的级联交易特征,然后利用PU

learning消减数据不平衡带来的问题,建立勒索地址识别模型。
[0029]与其他勒索地址识别方法不同的是,本专利技术不仅关注地址本身的交易行为特征,同样也关注与之参与同一笔交易的相关地址的交易行为特征。一次勒索活动通常由多个地址共同完成赎金的收取、转移和提现整个过程,仅从地址本身的交易特征难以准确判断该
地址是否为勒索地址本文档来自技高网...

【技术保护点】

【技术特征摘要】
1. 一种面向UTXO模型区块链的勒索地址识别方法,其特征在于,具体步骤如下:步骤一、提取地址本身的交易特征总结勒索活动的交易行为特征,首先提取目标地址的历史交易数据;根据历史交易数据从三个角度提取地址本身的18个交易特征,包括交易数量角度、交易金额角度和UTXO模型角度,具体如下表1所示:表1 ,地址本身的交易特征特征名称定义交易数量目标地址参与交易笔数发送次数目标地址作为发送方参与交易笔数接收次数目标地址作为接收方参与交易笔数发送金额目标地址作为发送方转移金额接收金额目标地址作为接收方转移金额平均发送金额发送金额与发送次数的比值平均接收金额接收金额与接收次数的比值最大发送金额目标地址单笔交易发送的最大金额最大接收金额目标地址单笔交易接收的最大金额最小发送金额目标地址单笔交易发送的最小金额最小接收金额目标地址单笔交易接收的最小金额最多发送方数量目标地址参与的交易中发送方个数最大值最少发送方数量目标地址参与的交易中发送方个数最小值最多接收方数量目标地址参与的交易中接收方个数最大值最少接收方数量目标地址参与的交易中接收方个数最小值锁定时间目标地址是否参与过锁定时间交易混币交易目标地址是否参与过混币交易活跃时段目标地址的活跃时间长度步骤二、确定交易关系及提取地址的级联交易特征提取与目标地址发生交易的相关地址构成相关地址集合,根据UTXO交易模型的格式定义如下四种交易关系:左邻居,右邻居,左兄弟,右兄弟;利用如下四种函数:最大值、最小值、平均值和标准差函数,聚合目标地址和相关地址的所有交易特征,拼接得到目标地址的级联交易特征;步骤三、基于PU

learning构建勒索地址识别模型针对UTXO模型区块链地址总量巨大、已知的勒索地址仅占十万分之三的数据不平衡问题,每次迭代过程随机选取一部分非勒索地址样本,与全部勒索地址构成训练集,利用决策树机器学习算法,学习两部分地址级联交易特征的不同点,建立勒索地址识别模型,用于判断地址...

【专利技术属性】
技术研发人员:王锴赵宇童麦可陈辰韩伟力柴洪峰
申请(专利权)人:复旦大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1