一种区块链数字货币虚拟地址的类别推测方法及系统技术方案

技术编号:29082301 阅读:23 留言:0更新日期:2021-06-30 09:43
本发明专利技术公开了一种区块链数字货币虚拟地址的类别推测方法及系统,包括:获取数字货币的已知类别地址和未知类别地址;对已知类别地址进行交易检索、特征提取、数据归一化、特征贡献计算与筛选、样本类别不均衡处理,得到样本数据集;将样本数据集分为训练数据集和测试数据集,经多次迭代后,选择最优模型作为数字货币地址类别推测的分类器;对未知类别地址进行交易检索、特征提取、数据归一化、特征贡献筛选,得到待分类数据集;基于分类器对输入的待分类数据集进行分类计算,得到其所属类别。本发明专利技术对已知类别的虚拟地址的特征进行学习从而推断未知类别虚拟地址所属类别,其能够解决区块链网络中的大部分虚拟地址都处于信息未知状态的问题。知状态的问题。知状态的问题。

【技术实现步骤摘要】
一种区块链数字货币虚拟地址的类别推测方法及系统


[0001]本专利技术涉及区块链数字货币
,具体涉及一种区块链数字货币虚拟地址的类别推测方法及系统。

技术介绍

[0002]随着区块链技术与数字货币的发展,越来越多的人被区块链技术的匿名性与去中心化等特性及数字货币的高收益所吸引,开始关注比特币、以太坊等区块链数字货币。而这些区块链数字货币的匿名性在提供给用户节点足够的安全保障的同时,也致使整个网络鱼龙混杂,非法交易活动时常发生。因此,在保证用户节点匿名性的情况下对区块链数字货币进行实体类型推测,从而框定每个用户节点所涵盖的虚拟地址所属类别,这对于监管区块链数字货币网络具有重要价值。
[0003]目前关于区块链数字货币网络实体类型推测的研究主要围绕实体用户地址聚类、实体合法性检测、实体用户地址分类等几个方面展开:
[0004]1.针对实体用户地址聚类,现有研究主要使用启发式聚类方法对交易地址进行聚类,将交易中的输入地址聚为一类,认定为一个实体。
[0005]2.针对实体合法性检测,现有研究主要是针对已被标记的参与非法活动的地址、实体进行分析;其中,涉及到的非法活动主要包括投资诈骗、违禁物品买卖、洗钱等。
[0006]3.针对实体用户地址分类,现有研究主要是通过获取一些论坛、博客、网站中提供的地址信息,制定分类标准,进行分类模型的训练。
[0007]上述方案虽然一定程度上可实现区块链数字货币网络实体类型的推测,但大多数都依赖于虚拟地址的链下信息,虽然上述方式能够很准确的推测虚拟地址的类别或真实信息,但并不是所有的虚拟地址都能关联到链下信息,区块链网络中的大部分虚拟地址都处于信息未知状态,而且这种方式需要检索大量的网络资源,十分耗时耗力,且还存在用于实体类型推测的数据特征维度较少、研究成本过高、整体解决方案的普适性不强等问题。

技术实现思路

[0008]针对现有技术中存在的上述问题,本专利技术提供一种成本低、普适性强的区块链数字货币虚拟地址的类别推测方法及系统。
[0009]本专利技术公开了一种区块链数字货币虚拟地址的类别推测方法,包括:
[0010]获取区块链数字货币的已知类别地址和未知类别地址;
[0011]对所述已知类别地址进行交易检索、特征提取、数据归一化、特征贡献计算与筛选以及样本类别不均衡处理,得到样本数据集;
[0012]将所述样本数据集分为用于模型训练的训练数据集和用于模型评估的测试数据集,经多次迭代后,选择最优模型作为数字货币地址类别推测的分类器;
[0013]对所述未知类别地址进行交易检索、特征提取、数据归一化、特征贡献筛选,得到待分类数据集;
[0014]基于所述分类器对输入的所述待分类数据集进行分类计算,得到其所属类别。
[0015]作为本专利技术的进一步改进,所述交易检索和特征提取,包括:
[0016]在区块链数字货币的账本数据中获得所述已知类别地址或未知类别地址所参与的所有交易信息;
[0017]对所述交易信息进行特征提取,得到基础数据集;其中,所述基础数据集包括交易总次数、每次交易的金额、作为输出地址的次数、参与铸币交易的次数、第一次接收比特币的时间、第一次花费比特币的时间、每笔交易的输出地址计数、每笔交易的输入地址计数;
[0018]基于特征工程中的方法对所述基础数据集中的特征数据进行组合,获取新的数据特征并生成特征数据集。
[0019]作为本专利技术的进一步改进,所述数据归一化,包括:
[0020]采用最大小值归一化方法对所述特征提取生成的特征数据集进行数据归一化操作,使处理后的数据被限定0和1之间。
[0021]作为本专利技术的进一步改进,所述特征贡献计算与筛选,包括:
[0022]针对所述已知类别地址,使用信息增益计算方法计算数据归一化后的数据集包含的各个特征属性的信息增益值,进行排序筛除特征贡献值低于阈值的特征,并记录筛除的特征属性名称,余下的特征属性组成新的特征数据集;
[0023]针对所述未知类别地址,从数据归一化后的数据集中直接删除已知类别地址中记录的已筛除特征属性,余下的特征属性组成新的特征数据集,作为所述待分类数据集。
[0024]作为本专利技术的进一步改进,所述样本类别不均衡处理,包括:
[0025]使用边界合成少数类过采样技术处理特征贡献计算与筛选后的数据集,得到所述样本数据集。
[0026]本专利技术还公开了一种区块链数字货币虚拟地址的类别推测系统,包括:
[0027]数据处理模块,用于:
[0028]获取区块链数字货币的已知类别地址和未知类别地址;
[0029]对所述已知类别地址进行交易检索、特征提取、数据归一化、特征贡献计算与筛选以及样本类别不均衡处理,得到样本数据集;
[0030]对所述未知类别地址进行交易检索、特征提取、数据归一化、特征贡献筛选,得到待分类数据集;
[0031]分类器生成模块,用于:
[0032]将所述样本数据集分为用于模型训练的训练数据集和用于模型评估的测试数据集,经多次迭代后,选择最优模型作为数字货币地址类别推测的分类器;
[0033]分类模块,用于:
[0034]基于所述分类器对输入的所述待分类数据集进行分类计算,得到其所属类别。
[0035]作为本专利技术的进一步改进,在所述数据处理模块中,所述交易检索和特征提取,包括:
[0036]在区块链数字货币的账本数据中获得所述已知类别地址或未知类别地址所参与的所有交易信息;
[0037]对所述交易信息进行特征提取,得到基础数据集;其中,所述基础数据集包括交易总次数、每次交易的金额、作为输出地址的次数、参与铸币交易的次数、第一次接收比特币
的时间、第一次花费比特币的时间、每笔交易的输出地址计数、每笔交易的输入地址计数;
[0038]基于特征工程中的方法对所述基础数据集中的特征数据进行组合,获取新的数据特征并生成特征数据集。
[0039]作为本专利技术的进一步改进,在所述数据处理模块中,所述数据归一化,包括:
[0040]采用最大小值归一化方法对所述特征提取生成的特征数据集进行数据归一化操作,使处理后的数据被限定0和1之间。
[0041]作为本专利技术的进一步改进,在所述数据处理模块中,所述特征贡献计算与筛选,包括:
[0042]针对所述已知类别地址,使用信息增益计算方法计算数据归一化后的数据集包含的各个特征属性的信息增益值,进行排序筛除特征贡献值低于阈值的特征,并记录筛除的特征属性名称,余下的特征属性组成新的特征数据集;
[0043]针对所述未知类别地址,从数据归一化后的数据集中直接删除已知类别地址中记录的已筛除特征属性,余下的特征属性组成新的特征数据集,作为所述待分类数据集。
[0044]作为本专利技术的进一步改进,在所述数据处理模块中,所述样本类别不均衡处理,包括:
[0045]使用边界合成少数类过采样技术处理特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种区块链数字货币虚拟地址的类别推测方法,其特征在于,包括:获取区块链数字货币的已知类别地址和未知类别地址;对所述已知类别地址进行交易检索、特征提取、数据归一化、特征贡献计算与筛选以及样本类别不均衡处理,得到样本数据集;将所述样本数据集分为用于模型训练的训练数据集和用于模型评估的测试数据集,经多次迭代后,选择最优模型作为数字货币地址类别推测的分类器;对所述未知类别地址进行交易检索、特征提取、数据归一化、特征贡献筛选,得到待分类数据集;基于所述分类器对输入的所述待分类数据集进行分类计算,得到其所属类别。2.如权利要求1所述的类别推测方法,其特征在于,所述交易检索和特征提取,包括:在区块链数字货币的账本数据中获得所述已知类别地址或未知类别地址所参与的所有交易信息;对所述交易信息进行特征提取,得到基础数据集;其中,所述基础数据集包括交易总次数、每次交易的金额、作为输出地址的次数、参与铸币交易的次数、第一次接收比特币的时间、第一次花费比特币的时间、每笔交易的输出地址计数、每笔交易的输入地址计数;基于特征工程中的方法对所述基础数据集中的特征数据进行组合,获取新的数据特征并生成特征数据集。3.如权利要求1或2所述的类别推测方法,其特征在于,所述数据归一化,包括:采用最大小值归一化方法对所述特征提取生成的特征数据集进行数据归一化操作,使处理后的数据被限定0和1之间。4.如权利要求1所述的类别推测方法,其特征在于,所述特征贡献计算与筛选,包括:针对所述已知类别地址,使用信息增益计算方法计算数据归一化后的数据集包含的各个特征属性的信息增益值,进行排序筛除特征贡献值低于阈值的特征,并记录筛除的特征属性名称,余下的特征属性组成新的特征数据集;针对所述未知类别地址,从数据归一化后的数据集中直接删除已知类别地址中记录的已筛除特征属性,余下的特征属性组成新的特征数据集,作为所述待分类数据集。5.如权利要求1所述的类别推测方法,其特征在于,所述样本类别不均衡处理,包括:使用边界合成少数类过采样技术处理特征贡献计算与筛选后的数据集,得到所述样本数据集。6.一种区块链数字货币虚拟地址的类别推测系统,其特征在于,包括:数据处理模块,用于:获取...

【专利技术属性】
技术研发人员:何泾沙何琳朱娜斐薛瑞昕常瑞天
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1