基于交易对手匹配的虚拟货币交易所名称识别方法和装置制造方法及图纸

技术编号:33120551 阅读:23 留言:0更新日期:2022-04-17 00:18
本发明专利技术公开了基于交易对手匹配的虚拟货币交易所名称识别方法和装置,方法包括:构建虚拟货币地址集群数据集;构建得到虚拟货币地址标签数据集;进行标签地址扩充;进行标签类别识别模型训练,得到监督式多分类标签识别模型;对未知标签且交易次数超过阈值的地址集群进行类别预测,即得到疑似交易所地址集群;提取所述疑似交易所地址集群的入向交易对手地址集合;对疑似交易所地址集群标签名称进行识别。本发明专利技术根据已知的虚拟货币交易所钱包地址,采用入向交易对手钱包地址匹配的方式,对虚拟货币场景下的虚拟货币交易所实体进行识别,适用于在虚拟货币应用场景下相关机构监管过程中的相关取证,保证网络空间安全的需求。保证网络空间安全的需求。保证网络空间安全的需求。

【技术实现步骤摘要】
基于交易对手匹配的虚拟货币交易所名称识别方法和装置


[0001]本专利技术属于区块链应用安全
,具体涉及基于交易对手匹配的虚拟货币交易所名称识别方法和装置。

技术介绍

[0002]相对于传统的金融系统,虚拟货币独有的特征(地址匿名化、交易分散化等特征)使虚拟货币交易具有较强的反溯源能力,也使得虚拟货币交易地址的身份识别机制面临较多的挑战。面对区块链行业中不断扩大的虚拟货币市场,其监管难度仍然很大,对应虚拟货币的技术特点主要体现在以下几个方面:
[0003](1)地址匿名性。虚拟货币地址使用户参与虚拟货币交易使用的账号,不过此地址是由用户自行创建,与身份信息无关联,并且创建过程中不需要第三方参与。
[0004](2)交易复杂性。虚拟货币支付系统支持用户每次交易后生成不同的地址,因此用户的交易信息分散在不同的地址中,同时这些地址都涉及海量的虚拟货币交易,因此很难通过分析单个虚拟货币地址的交易行为数据来识别虚拟货币地址的身份。
[0005]综上所述,虚拟货币的地址匿名性与交易发散性成为监管非法应用虚拟货币进行非法活动的拦路虎。为了解决虚拟货币地址匿名性与复杂性的问题,现有大部分解决方案的原理是通过不同的开源渠道收集虚拟货币交易所钱包地址,然后基于标签进行虚拟货币身份识别,虽然此类方法能够基于已知虚拟货币标签大类(交易所、混币、服务商等类别)进行人工智能扩充,但无法识别出地址具体归属(如火币交易所、Helixmixer混币等钱包地址归属的具体名称),此类方法导致我们只能从已知具体归属钱包地址进行违法资金调证,由于开源渠道收集交易所标签地址有限,因此过于局限。

技术实现思路

[0006]为了解决现有通过开源渠道收集虚拟货币交易所钱包地址的信息存在局限性的问题,本专利技术提供了一种基于交易对手匹配的虚拟货币交易所名称识别方法。本专利技术根据已知的虚拟货币交易所钱包地址,采用入向交易对手钱包地址匹配的方式,对虚拟货币场景下的虚拟货币交易所实体进行识别,适用于在虚拟货币应用场景下相关机构监管过程中的相关取证,保证网络空间安全的需求。
[0007]本专利技术通过下述技术方案实现:
[0008]基于交易对手匹配的虚拟货币交易所名称识别方法,包括:
[0009]基于虚拟货币历史交易明细数据构建虚拟货币地址集群数据集;
[0010]获取现有虚拟货币交易相关网络中所有标签,并对其进行标签化处理,构建得到虚拟货币地址标签数据集;
[0011]采用所述虚拟货币地址标签数据集对所述虚拟货币地址集群数据集进行标签地址扩充;
[0012]根据虚拟货币历史交易明细数据提取交易行为特征数据,并基于提取的特征数据
进行标签类别识别模型训练,得到监督式多分类标签识别模型;
[0013]采用训练得到的所述监督式多分类标签识别模型对未知标签且交易次数超过阈值的地址集群进行类别预测,即得到疑似交易所地址集群;
[0014]提取所述疑似交易所地址集群的入向交易对手地址集合;
[0015]根据提取的所述疑似交易所地址集群的入向交易对手地址集合,对疑似交易所地址集群标签名称进行识别。
[0016]优选的,本专利技术的基于虚拟货币历史交易明细数据构建虚拟货币地址集群数据集步骤具体包括:
[0017]获取虚拟货币历史交易数据并对其进行解析处理,得到虚拟货币历史交易明细数据;
[0018]基于解析得到的虚拟货币交易明细数据,采用“多输入”地址聚类方法进行虚拟货币地址聚类,形成虚拟货币地址集群数据集;
[0019]其中,所述“多输入”地址聚类方法是将一个多输入交易中的所有输入地址聚类为一个地址集群数据集。
[0020]优选的,本专利技术的获取现有虚拟货币交易相关网络中所有标签,并对其进行标签化处理,构建得到虚拟货币地址标签数据集步骤具体包括:
[0021]通过爬取WalletExplorer网站中所有标签,获取各个标签地址的小标签;
[0022]对获取的小标签进行分类并标签化处理,得到虚拟货币地址标签数据集。
[0023]优选的,本专利技术的采用所述虚拟货币地址标签数据集对所述虚拟货币地址集群数据集进行标签地址扩充步骤具体包括:
[0024]采用“多输入”地址聚类方法对虚拟货币地址集群数据集进行虚拟货币标签地址扩充,得到交易所地址集群数据集;
[0025]对交易所地址集群数据集,按照小标签进行聚合,得到交易所平台地址集群数据集。
[0026]优选的,本专利技术的根据虚拟货币历史交易明细数据提取交易行为特征数据,并基于提取的特征数据进行标签类别识别模型训练,得到监督式多分类标签识别模型步骤具体包括:
[0027]从地址交易行为、地址所属集群交易行为、地址所属集群网络结构三个方面从虚拟货币交易明细数据中获取特征并进行整合;
[0028]将整合后的特征数据输入到预设监督式多分类算法进行标签类别识别模型的训练,得到监督式多分类标签识别模型,并对不同类别设定对应概率阈值。
[0029]优选的,本专利技术的根据提取的所述疑似交易所地址集群的入向交易对手地址集合,对疑似交易所地址集群标签名称进行识别步骤具体包括:
[0030]将疑似交易所地址集群的入向交易对手地址集合与每个已知的交易所平台地址集群进行求交集,得到地址交集长度;
[0031]基于地址交集长度,计算得到所述交集占比得分;
[0032]基于交集占比得分和占比得分阈值,即可识别出该疑似交易所地址集群的标签名称。
[0033]优选的,本专利技术的交集占比得分计算公式如下:
[0034]Score=Length(C)/Min(Length(A),Length(B))
[0035]其中,Length(C)表示交集长度,Length(A)表示疑似交易所地址集群的入向交易对手地址集合长度,Length(B)表示已知交易所平台地址集群长度,Min()表示取最小值。
[0036]第二方面,本专利技术提出了基于交易对手匹配的虚拟货币交易所名称识别装置,包括:解析处理单元、标签化单元、地址扩充单元、模型训练单元、类别预测单元、提取单元和识别单元;
[0037]所述解析处理单元基于虚拟货币历史交易明细数据构建虚拟货币地址集群数据集;
[0038]所述标签化单元用于获取现有虚拟货币交易相关网络中所有标签,并对其进行标签化处理,构建得到虚拟货币地址标签数据集;
[0039]所述地址扩充单元采用所述虚拟货币地址标签数据集对所述虚拟货币地址集群数据集进行标签地址扩充;
[0040]所述模型训练单元根据虚拟货币历史交易明细数据进行特征提取,并基于提取的特征进行标签类别识别模型训练,得到监督式多分类标签识别模型;
[0041]所述类别预测单元采用训练得到的监督式多分类标签识别模型对未知标签并且交易次数超过阈值的地址集群进行类别预测,即得到疑似交易所地址集群;
[0042]所述提取单元用于提取疑似交易所地址本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于交易对手匹配的虚拟货币交易所名称识别方法,其特征在于,包括:基于虚拟货币历史交易明细数据构建虚拟货币地址集群数据集;获取现有虚拟货币交易相关网络中所有标签,并对其进行标签化处理,构建得到虚拟货币地址标签数据集;采用所述虚拟货币地址标签数据集对所述虚拟货币地址集群数据集进行标签地址扩充;根据虚拟货币历史交易明细数据提取交易行为特征数据,并基于提取的特征数据进行标签类别识别模型训练,得到监督式多分类标签识别模型;采用训练得到的所述监督式多分类标签识别模型对未知标签且交易次数超过阈值的地址集群进行类别预测,即得到疑似交易所地址集群;提取所述疑似交易所地址集群的入向交易对手地址集合;根据提取的所述疑似交易所地址集群的入向交易对手地址集合,对疑似交易所地址集群标签名称进行识别。2.根据权利要求1所述的基于交易对手匹配的虚拟货币交易所名称识别方法,其特征在于,基于虚拟货币历史交易明细数据构建虚拟货币地址集群数据集步骤具体包括:获取虚拟货币历史交易数据并对其进行解析处理,得到虚拟货币历史交易明细数据;基于解析得到的虚拟货币交易明细数据,采用“多输入”地址聚类方法进行虚拟货币地址聚类,形成虚拟货币地址集群数据集;其中,所述“多输入”地址聚类方法是将一个多输入交易中的所有输入地址聚类为一个地址集群数据集。3.根据权利要求1所述的基于交易对手匹配的虚拟货币交易所名称识别方法,其特征在于,获取现有虚拟货币交易相关网络中所有标签,并对其进行标签化处理,构建得到虚拟货币地址标签数据集步骤具体包括:通过爬取WalletExplorer网站中所有标签,获取各个标签地址的小标签;对获取的小标签进行分类并标签化处理,得到虚拟货币地址标签数据集。4.根据权利要求1所述的基于交易对手匹配的虚拟货币交易所名称识别方法,其特征在于,采用所述虚拟货币地址标签数据集对所述虚拟货币地址集群数据集进行标签地址扩充步骤具体包括:采用“多输入”地址聚类方法对虚拟货币地址集群数据集进行虚拟货币标签地址扩充,得到交易所地址集群数据集;对交易所地址集群数据集,按照小标签进行聚合,得到交易所平台地址集群数据集。5.根据权利要求1所述的基于交易对手匹配的虚拟货币交易所名称识别方法,其特征在于,根据虚拟货币历史交易明细数据提取交易行为特征数据,并基于提取的特征数据进行标签类别识别模型训练,得到监督式多分类标签识别模型步骤具体包括:从地址交易行为、地址所属集群交易行为、地址所属集群网络结构三个方面从虚拟货币交易明细数据中获取特征并进行整合;将整合后的特...

【专利技术属性】
技术研发人员:杨霞郭文生冯志淇
申请(专利权)人:成都链安科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1