【技术实现步骤摘要】
基于多元化数据融合的虚拟货币地址实体识别方法及系统
[0001]本专利技术涉及区块链应用
,具体涉及基于多元化数据融合的虚拟货币地址实体识别方法及系统。
技术介绍
[0002]区块链是一种去中心化的分布式数据库,它是由一系列区块组成的链条。每个区块都包含一些数据、时间戳和前一个区块的哈希值,而哈希值是由区块内的数据和前一个区块的哈希值生成的。这种链式结构使得区块链非常安全,因为只要篡改一个区块,整个区块链就会失效。区块链技术最初被用于虚拟货币,但现在已经应用于各种领域,例如智能合约、数字身份验证、供应链管理、物联网等等。尽管区块链技术具有许多潜在的优点,但是它也面临着一些挑战。区块链的匿名性使得参与实体的真实身份可以被隐蔽,例如在虚拟货币等加密货币中,由于交易记录是公开的且参与实体可以使用伪名或匿名地址进行交易,因此这些货币可能被用于多种交易中,如金融投资活动中,虽然区块链技术是公开透明的,但是许多投资机构与个人并不会公开他们的虚拟货币的持币地址,主要出于隐私和安全方面的考虑,以避免黑客攻击或其他形式的攻击。因此区块链匿名性特征可能导致监管问题,金融投资机构无法有效跟踪和分析参与者的活动,从而难以分析并制定出有效的投资策略。
[0003]基于机器学习的方式进行虚拟货币地址去匿名化主要包括:(1)基于交易关系的聚类算法,该算法通过分析虚拟货币交易记录中的输入和输出地址,将它们之间的交易关系抽象为一个有向图,再利用图论算法对地址进行聚类;(2)基于交易行为的聚类算法,该算法通过分析虚拟货币交易记录中的交易时 ...
【技术保护点】
【技术特征摘要】
1.基于多元化数据融合的虚拟货币地址实体识别方法,其特征在于,包括:步骤一:搭建虚拟货币区块链全节点,获取区块链的明细交易数据并对明细交易数据进行预处理得到实体交易数据库;步骤二:收集虚拟货币的情报数据,所述情报数据包括:情报时间、情报金额和情报国别;基于情报时间进行交易数据锁定:锁定情报时间,在实体交易数据库中抽取出情报时间对应时间段的虚拟货币实体交易数据,确定出目标实体集合;步骤三:对目标实体集合以及其对应的交易哈希进行递进式的多层次特征构建得到目标实体特征;步骤四:基于目标实体特征,结合情报金额对目标实体进行过滤得到可疑实体集合;步骤五:基于情报国别和情报金额对可疑实体集合进行实体组合,并筛选实体组合得到与情报金额符合的实体组合。2.根据权利要求1所述的基于多元化数据融合的虚拟货币地址实体识别方法,其特征在于,所述预处理包括方法:根据区块链的明细交易数据,基于虚拟货币地址聚类方法将所有虚拟货币地址进行实体识别构造出虚拟货币实体数据;再将虚拟货币实体数据转化为虚拟货币实体交易数据,将所有虚拟货币实体交易数据存储在专用数据库中得到实体交易数据库。3.根据权利要求2所述的基于多元化数据融合的虚拟货币地址实体识别方法,其特征在于,在构造虚拟货币实体数据时,在交易发送方和交易接收方共同出现的地址识别为同一实体,在同一交易发送方出现的多个地址识别为同一实体。4.根据权利要求1所述的基于多元化数据融合的虚拟货币地址实体识别方法,其特征在于,情报数据的收集方法包括通过自动化爬虫收集情报收集,或通过人工检索整理方式收集;情报数据的来源包括:网络搜索引擎、金融分析师的报告或政府机构的公告。5.根据权利要求1所述的基于多元化数据融合的虚拟货币地址实体识别方法,其特征在于,目标实体集合的确定方法包括:以情报时间为时间线索,对时间线索范围内的所有虚拟货币实体交易数据进行抽取,并转化为虚拟货币实体与交易哈希的映射结构,从而得到目标实体集合。6.根据权利要求5所述的基于多元化数据融合的虚拟货币地址实体识别方法,其特征在于,目标实体特征的构建方法包括:基于虚拟货币交易数据,对目标实体集合以及其对应的交易哈希进行递进式的多层次特征构建;所述多层次特征包括:实体当前行为特征、实体未来行为特征和实体全局特征;所述全局特征包括:子地址数、收入笔数和支出笔数;所述实体当前行为特征包括:以时间线索作为限制,考虑时间线索对应时间范围内的交易笔数、交易金额、净收入金额和参与交易地址数量;所述实体未来行为特征包括:以时间线索后的时间段T作为限制,考虑时间段T范围内的收入笔数、支出笔数和最早一笔支出金额。7.根据权利要6所述的基于多元化数据融合的虚拟货币地址实体识别方法,其特征在于,可疑实体集合的获取方法包括...
【专利技术属性】
技术研发人员:林绅文,毛洪亮,史博轩,冯志淇,贺敏,马秀娟,李基,施力,杨菁林,任建坤,
申请(专利权)人:国家计算机网络与信息安全管理中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。