基于多元化数据融合的虚拟货币地址实体识别方法及系统技术方案

技术编号:39006197 阅读:17 留言:0更新日期:2023-10-07 10:37
本发明专利技术公开了基于多元化数据融合的虚拟货币地址实体识别方法及系统;涉及区块链应用技术领域;收集链下情报并整合形成统一结构的情报数据,用于引导虚拟货币实体特征工程的构建,将虚拟货币地址与链下实际控制实体进行关联,结合实体特征、虚拟货币交易的特定业务逻辑以及情报线索,对大量的目标实体进行深度过滤,得到可观数量的可疑实体,并采用深度搜索组合方式,得到所有符合情报线索的实体组合;基于链下多渠道情报数据与链上交易数据的关联分析,达到建立有效、快速、准确的识别出持有虚拟货币的实体的目的。虚拟货币的实体的目的。虚拟货币的实体的目的。

【技术实现步骤摘要】
基于多元化数据融合的虚拟货币地址实体识别方法及系统


[0001]本专利技术涉及区块链应用
,具体涉及基于多元化数据融合的虚拟货币地址实体识别方法及系统。

技术介绍

[0002]区块链是一种去中心化的分布式数据库,它是由一系列区块组成的链条。每个区块都包含一些数据、时间戳和前一个区块的哈希值,而哈希值是由区块内的数据和前一个区块的哈希值生成的。这种链式结构使得区块链非常安全,因为只要篡改一个区块,整个区块链就会失效。区块链技术最初被用于虚拟货币,但现在已经应用于各种领域,例如智能合约、数字身份验证、供应链管理、物联网等等。尽管区块链技术具有许多潜在的优点,但是它也面临着一些挑战。区块链的匿名性使得参与实体的真实身份可以被隐蔽,例如在虚拟货币等加密货币中,由于交易记录是公开的且参与实体可以使用伪名或匿名地址进行交易,因此这些货币可能被用于多种交易中,如金融投资活动中,虽然区块链技术是公开透明的,但是许多投资机构与个人并不会公开他们的虚拟货币的持币地址,主要出于隐私和安全方面的考虑,以避免黑客攻击或其他形式的攻击。因此区块链匿名性特征可能导致监管问题,金融投资机构无法有效跟踪和分析参与者的活动,从而难以分析并制定出有效的投资策略。
[0003]基于机器学习的方式进行虚拟货币地址去匿名化主要包括:(1)基于交易关系的聚类算法,该算法通过分析虚拟货币交易记录中的输入和输出地址,将它们之间的交易关系抽象为一个有向图,再利用图论算法对地址进行聚类;(2)基于交易行为的聚类算法,该算法通过分析虚拟货币交易记录中的交易时间、交易金额、交易频率等行为信息,将这些信息抽象为特征向量,再利用机器学习算法对地址进行聚类。虽然这两类方法能够基于链上数据识别出具有特定关系或者行为的虚拟货币地址,但是无法锁定到此虚拟货币地址的实际控制实体;基于多渠道的链下情报与链上交易数据分析技术,通过结合多元情报与链上交易数据的确能够识别出特定区块链地址的实际控制实体,但是针对虚拟货币地址实际控制实体还存在一定的问题,比如大部分专利与文献在通过链下情报关联分析技术进行虚拟货币控制实体识别过程中,都未考虑到虚拟货币地址聚类。因此此类方法在识别过程中有可能将一个实际控制实体控制的地址集合仅识别出当前实际控制实体控制的地址集合中的部分地址,或将当前地址集合识别成多个实际控制实体控制的多个子地址集合的问题。

技术实现思路

[0004]本专利技术所要解决的技术问题是:传统的基于机器学习的方式进行虚拟货币地址去匿名化,未考虑到虚拟货币地址聚类,难以精准锁定到此虚拟货币地址的实际控制实体;本专利技术目的在于提供基于多元化数据融合的虚拟货币地址实体识别方法及系统,有效将虚拟货币地址与链下实际控制实体进行关联,基于链下多渠道情报数据与链上交易数据的关联分析,进而达到建立有效、快速、准确的识别出持有虚拟货币的持有实体的目的。
[0005]本专利技术通过下述技术方案实现:
[0006]本方案提供基于多元化数据融合的虚拟货币地址实体识别方法,包括:
[0007]步骤一:搭建虚拟货币区块链全节点,获取区块链的明细交易数据并对明细交易数据进行预处理得到实体交易数据库;
[0008]步骤二:收集虚拟货币的情报数据,所述情报数据包括:情报时间、情报金额和情报国别;基于情报时间进行交易数据锁定:锁定情报时间,在实体交易数据库中抽取出情报时间对应时间段的虚拟货币实体交易数据,确定出目标实体集合;
[0009]步骤三:对目标实体集合以及其对应的交易哈希进行递进式的多层次特征构建得到目标实体特征;
[0010]步骤四:基于目标实体特征,结合情报金额对目标实体进行过滤得到可疑实体集合;
[0011]步骤五:基于情报国别和情报金额对可疑实体集合进行实体组合,并筛选实体组合得到与情报金额符合的实体组合。
[0012]本方案工作原理:传统的基于机器学习的方式进行虚拟货币地址去匿名化,未考虑到虚拟货币地址聚类,难以准确锁定到此虚拟货币地址的实际控制实体;本专利技术目的在于提供基于多元化数据融合的虚拟货币地址实体识别方法及系统,将虚拟货币地址与链下实际控制实体进行关联,结合实体特征、虚拟货币交易的特定业务逻辑以及情报线索,对大量的目标实体进行深度过滤,得到可观数量的可疑实体,并采用深度搜索组合方式,得到所有符合情报线索的实体组合;基于链下多渠道情报数据与链上交易数据的关联分析,达到建立有效、快速、准确的识别出持有虚拟货币的实体(控制机构与个人)的目的。
[0013]进一步优化方案为,所述预处理包括方法:
[0014]根据区块链的明细交易数据,基于虚拟货币地址聚类方法将所有虚拟货币地址进行实体识别构造出虚拟货币实体数据;
[0015]再将虚拟货币实体数据转化为虚拟货币实体交易数据,将所有虚拟货币实体交易数据存储在专用数据库中得到实体交易数据库。
[0016]进一步优化方案为,在构造虚拟货币实体数据时,在交易发送方和交易接收方共同出现的地址识别为同一实体,在同一交易发送方出现的多个地址识别为同一实体。
[0017]进一步优化方案为,情报数据的收集方法包括通过自动化爬虫收集情报收集,或通过人工检索整理方式收集;情报数据的来源包括:网络搜索引擎、金融分析师的报告或政府机构的公告。
[0018]进一步优化方案为,目标实体集合的确定方法包括:
[0019]以情报时间为时间线索,对时间线索范围内的所有虚拟货币实体交易数据进行抽取,并转化为虚拟货币实体与交易哈希的映射结构,从而得到目标实体集合。
[0020]进一步优化方案为,目标实体特征的构建方法包括:
[0021]基于虚拟货币交易数据,对目标实体集合以及其对应的交易哈希进行递进式的多层次特征构建;所述多层次特征包括:实体当前行为特征、实体未来行为特征和实体全局特征;
[0022]所述全局特征包括:子地址数、收入笔数和支出笔数;
[0023]所述实体当前行为特征包括:以时间线索作为限制,考虑时间线索对应时间范围
内的交易笔数、交易金额、净收入金额和参与交易地址数量;
[0024]所述实体未来行为特征包括:以时间线索后的时间段T作为限制,考虑时间段T范围内的收入笔数、支出笔数和最早一笔支出金额。
[0025]进一步优化方案为,可疑实体集合的获取方法包括:
[0026]S1,基于实体当前行为特征和情报金额过滤不符合的实体:过滤条件包括:a,根据时间线索内实体净收入的数额筛选符合小于情报金额的实体;b,时间线索内的实体总交易数量小于α笔,α值随情报主体性质而改变;
[0027]S2,基于实体全局特征,根据分类条件筛选出与情报主体相关的实体:所述分类条件包括:c,根据实体的总交易数设置不同量级进行分类;d,根据实体的交易金额设置不同量级进行分类,所述交易金额包括收入金额和支出金额;e,根据实体包括的地址数量设置不同量级进行分类;
[0028]S3,基于实体未来行为特征引入实体交易细节筛选出可疑实体,所述交易细节本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于多元化数据融合的虚拟货币地址实体识别方法,其特征在于,包括:步骤一:搭建虚拟货币区块链全节点,获取区块链的明细交易数据并对明细交易数据进行预处理得到实体交易数据库;步骤二:收集虚拟货币的情报数据,所述情报数据包括:情报时间、情报金额和情报国别;基于情报时间进行交易数据锁定:锁定情报时间,在实体交易数据库中抽取出情报时间对应时间段的虚拟货币实体交易数据,确定出目标实体集合;步骤三:对目标实体集合以及其对应的交易哈希进行递进式的多层次特征构建得到目标实体特征;步骤四:基于目标实体特征,结合情报金额对目标实体进行过滤得到可疑实体集合;步骤五:基于情报国别和情报金额对可疑实体集合进行实体组合,并筛选实体组合得到与情报金额符合的实体组合。2.根据权利要求1所述的基于多元化数据融合的虚拟货币地址实体识别方法,其特征在于,所述预处理包括方法:根据区块链的明细交易数据,基于虚拟货币地址聚类方法将所有虚拟货币地址进行实体识别构造出虚拟货币实体数据;再将虚拟货币实体数据转化为虚拟货币实体交易数据,将所有虚拟货币实体交易数据存储在专用数据库中得到实体交易数据库。3.根据权利要求2所述的基于多元化数据融合的虚拟货币地址实体识别方法,其特征在于,在构造虚拟货币实体数据时,在交易发送方和交易接收方共同出现的地址识别为同一实体,在同一交易发送方出现的多个地址识别为同一实体。4.根据权利要求1所述的基于多元化数据融合的虚拟货币地址实体识别方法,其特征在于,情报数据的收集方法包括通过自动化爬虫收集情报收集,或通过人工检索整理方式收集;情报数据的来源包括:网络搜索引擎、金融分析师的报告或政府机构的公告。5.根据权利要求1所述的基于多元化数据融合的虚拟货币地址实体识别方法,其特征在于,目标实体集合的确定方法包括:以情报时间为时间线索,对时间线索范围内的所有虚拟货币实体交易数据进行抽取,并转化为虚拟货币实体与交易哈希的映射结构,从而得到目标实体集合。6.根据权利要求5所述的基于多元化数据融合的虚拟货币地址实体识别方法,其特征在于,目标实体特征的构建方法包括:基于虚拟货币交易数据,对目标实体集合以及其对应的交易哈希进行递进式的多层次特征构建;所述多层次特征包括:实体当前行为特征、实体未来行为特征和实体全局特征;所述全局特征包括:子地址数、收入笔数和支出笔数;所述实体当前行为特征包括:以时间线索作为限制,考虑时间线索对应时间范围内的交易笔数、交易金额、净收入金额和参与交易地址数量;所述实体未来行为特征包括:以时间线索后的时间段T作为限制,考虑时间段T范围内的收入笔数、支出笔数和最早一笔支出金额。7.根据权利要6所述的基于多元化数据融合的虚拟货币地址实体识别方法,其特征在于,可疑实体集合的获取方法包括...

【专利技术属性】
技术研发人员:林绅文毛洪亮史博轩冯志淇贺敏马秀娟李基施力杨菁林任建坤
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1