比特币交易所地址识别方法、系统、装置制造方法及图纸

技术编号:21432338 阅读:34 留言:0更新日期:2019-06-22 11:57
本发明专利技术属于信息技术及安全技术领域,具体涉及一种比特币交易所地址识别方法、系统、装置,旨在解决基于比特币的交易信息判断输入的地址信息是否为交易所地址的问题,本发明专利技术方法包括:获取包括比特币地址标识符、比特币流向数据的待识别交易数据作为输入信息;基于输入信息构建比特币交易网络;利用网络表示学习法获取比特币交易网络中节点的特征向量构成特征空间,进一步通过地址分类器识别输入信息中比特币地址标识符是否为真实的比特币交易所地址。本发明专利技术中的地址分类器基于交易数据样本和标签样本训练得到,为基于多个映射函数的分类器模型的组合。本发明专利技术依赖资源少,且能直接识别交易所地址,达到较好的识别率。

【技术实现步骤摘要】
比特币交易所地址识别方法、系统、装置
本专利技术属于信息技术及安全
,具体涉及一种比特币交易所地址识别方法、系统、装置。
技术介绍
2008年金融危机时期,各国为应对危机纷纷出台宽松货币政策,主权货币信用跌至冰点,导致基于国家信用的中心化货币体系不再那么可靠。比特币就此诞生,它具有匿名性和去中心化的特点,使用区块链技术构建公开帐单,确保交易安全,控制新货币的诞生,受到越来越多人的关注。但不法分子利用其匿名性进行非法交易活动并轻易逃脱法律的制裁,最臭名昭著的就是丝绸之路(SilkRoad)非法毒品贩卖和跨国洗钱,而监管机构很难对其进行监管和调查。针对这种情况,目前的主流方法是反匿名推测,主要包括以下两种方案:方案一:通过搜集比特币交易所等公开获得的数据,实现比特币的反匿名,一些比特币交易所会存储用户的比特币地址、身份信息等,还有一些支持比特币支付或接受比特币捐赠的服务机构,会公开他们的比特币地址。但涉及隐私保护问题,需政府和多方平台的支持,代价比较大,无法大规模应用。方案二:通过部署尽可能多的探测节点,监听并获取比特币网络交易信息及传播路径,实现交易者信息的识别。该方案在专利技术名称为“一种比特币交易身份表示方法”(申请号为201710965814)的专利申请中有具体描述。该方案涉及大量探针的部署,代价较大,无法普及使用,准确率也无法保证。鉴于上述情况,本专利技术的目的是将反匿名问题转为比特币交易所地址的真伪识别问题。比特币交易所,作为比特币和法定货币兑换的平台,提供了虚拟货币与真实世界链接的唯一通道,在比特币交易系统中具有重要的作用。识别比特币交易网络中的交易所地址对监管至关重要,可通过其进一步分析感兴趣的交易和地址,观察这些交易和地址加入、退出交易网络的时间,并进一步对其可能牵涉的犯罪行为进行判定。
技术实现思路
为了解决现有技术中的上述问题,即为了解决基于比特币的交易信息判断输入的地址信息是否为交易所地址的问题,本专利技术第一方面,提出了一种比特币交易所地址的识别方法,该方法包括:步骤S10,获取待识别交易数据作为输入信息;所述交易数据包括比特币地址标识符、比特币流向数据;步骤S20,将基于所述输入信息,构成比特币交易网络;步骤S30,利用网络表示学习法,获取所述比特币交易网络中的节点的特征向量构成的特征空间;步骤S40,根据特征空间,通过地址分类器识别所述输入信息中的比特币地址标识符是否为真实的比特币交易所地址信息;其中,所述地址分类器为基于多个映射函数的分类器模型的组合,所述的映射函数的分类器模型包括线性支持向量机模型、二项逻辑回归模型、决策树模型、随机森林模型中的一个或多个;多个映射函数模型的输出通过多数投票法选择,作为所述地址分类器的输出。在一些优选的实施方式中,所述的比特币交易网络中,以交易地址为节点、以同一交易中地址之间比特币的流动关系为边。在一些优选的实施方式中,步骤S30“利用网络表示学习法,获取所述比特币交易网络中节点的特征向量构成的特征空间”,其方法为:对所述比特币交易网络各节点,采用截断的随机游走策略生成一组游走序列;使用Skip-Gram模型对随机游走序列进行训练,通过最大化每个游走序列节点生成邻居节点的概率,得到每个节点的向量表示,进而得到所述比特币交易网络的特征矩阵,并以该矩阵作为所述比特币交易网络的特征空间。在一些优选的实施方式中,所述地址分类器其训练方法为:获取训练样本;所述训练样本包括交易数据样本和标签样本;所述交易数据样本为包含比特币地址标识符、比特币流向数据的集合,所述标签样本为判断交易数据样本中的比特币地址标识符是否为比特币交易所地址的标签;通过步骤S20、S30的方法对交易数据样本进行预处理,得到交易数据样本对应的特征空间样本;基于所述特征空间样本及对应的标签样本,对所述地址分类器进行训练。在一些优选的实施方式中,所述标签样本为一般节点时标签为-1、为交易所地址对应的节点时标签为1。在一些优选的实施方式中,所述交易数据样本包括交易的哈希值、交易时间戳数据、交易输入地址的哈希值、交易输出地址的哈希值。在一些优选的实施方式中,“对多个映射函数模型的输出通过多数投票法选择,作为所述地址分类器的输出”,其方法为:依据多个映射函数的模型的输出类别,选择得票最多的类别,若两个类别的得票数相同,则从中随机选出一个。本专利技术的第二方面,提出了一种比特币交易所地址识别系统,该系统包括获取模块、网络构建模块、特征提取模块、分类器预测模块;所述获取模块,配置为获取待识别交易数据作为输入信息;所述交易数据包括比特币地址标识符、比特币流向数据;所述网络构建模块,配置为基于所述输入信息,构建比特币交易网络;所述特征提取模型,配置为利用网络表示学习法,获取所述比特币交易网络中节点的特征向量构成的特征空间;所述分类器预测模块,配置为根据所述特征空间,通过地址分类器识别所述输入信息中的比特币地址标识符是否为真实的比特币交易所地址信息。本专利技术的第三方面,提出了一种存储装置,其中存储有多条程序,所述程序应用由处理器加载并执行以实现上述的比特币交易所地址识别方法。本专利技术的第四方面,提出了一种处理设置,包括处理器、存储装置;处理器,适用于执行各条程序;存储装置,适用于存储多条程序;所述程序适用于由处理器加载并执行以实现上述的比特币交易所地址识别方法。本专利技术的有益效果:本专利技术仅需依据比特币交易网络数据即可判断是否为交易所地址,比特币交易网络数据可以为通过比特币区块链网站公开获得带标注的比特币数据,或通过爬虫下载比特币钱包网站的数据,本专利技术的比特币交易所地址识别技术依赖资源少,且不需要搜集或者再进行人工数据标注,能够大范围使用;本专利技术使用网络表示学习方法提取特征,通过非监督的机器学习方法,能够自动学习网络的结构特征,得到网络中每个节点的向量表示。相比传统地利用节点的网络特征,如节点的入度/出度、子节点/兄弟节点/前辈节点的数量,无需人工提取特征,能够更好的掌握网络的结构特征;通过本专利技术依据比特币交易网络数据识别交易所地址,具有较好的识别效果。附图说明通过阅读参照以下附图所做的对非限制性实施例所做的详细描述,本申请的其他特征、目的和优点将会变得更明显。图1是本专利技术一种实施例的比特币交易地址识别方法的流程示意图;图2是本专利技术一种实施例中基于从交易数据构造交易网络的示例图;图3是本专利技术一种实施例的比特币交易地址识别系统的框架示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。本专利技术的比特币交易所地址识别方法,包括以下步骤:步骤S10,获取待识别交易数据作为输入信息;所述交易数据包括比特币地址标识符、本文档来自技高网
...

【技术保护点】
1.一种比特币交易所地址识别方法,其特征在于,该方法包括:步骤S10,获取待识别交易数据作为输入信息;所述交易数据包括比特币地址标识符、比特币流向数据;步骤S20,将基于所述输入信息,构成比特币交易网络;步骤S30,利用网络表示学习法,获取所述比特币交易网络中的节点的特征向量构成的特征空间;步骤S40,根据特征空间,通过地址分类器识别所述输入信息中的比特币地址标识符是否为真实的比特币交易所地址信息;其中,所述地址分类器为基于多个映射函数的分类器模型的组合,所述的映射函数的分类器模型包括线性支持向量机模型、二项逻辑回归模型、决策树模型、随机森林模型中的一个或多个;对多个映射函数模型的输出通过多数投票法选择,作为所述地址分类器的输出。

【技术特征摘要】
1.一种比特币交易所地址识别方法,其特征在于,该方法包括:步骤S10,获取待识别交易数据作为输入信息;所述交易数据包括比特币地址标识符、比特币流向数据;步骤S20,将基于所述输入信息,构成比特币交易网络;步骤S30,利用网络表示学习法,获取所述比特币交易网络中的节点的特征向量构成的特征空间;步骤S40,根据特征空间,通过地址分类器识别所述输入信息中的比特币地址标识符是否为真实的比特币交易所地址信息;其中,所述地址分类器为基于多个映射函数的分类器模型的组合,所述的映射函数的分类器模型包括线性支持向量机模型、二项逻辑回归模型、决策树模型、随机森林模型中的一个或多个;对多个映射函数模型的输出通过多数投票法选择,作为所述地址分类器的输出。2.根据权利要求1所述的比特币交易所地址识别方法,其特征在于,所述的比特币交易网络中,以交易地址为节点、以同一交易中地址之间比特币的流动关系为边。3.根据权利要求1所述的比特币交易地址识别方法,其特征在于,步骤S30“利用网络表示学习法,获取所述比特币交易网络中节点的特征向量构成的特征空间”,其方法为:对所述比特币交易网络各节点,采用截断的随机游走策略生成一组游走序列;使用Skip-Gram模型对随机游走序列进行训练,通过最大化每个游走序列节点生成邻居节点的概率,得到每个节点的向量表示,进而得到所述比特币交易网络的特征矩阵,并以该矩阵作为所述比特币交易网络的特征空间。4.根据权利要求1-3任一项所述的比特币交易所地址识别方法,其特征在于,所述地址分类器其训练方法为:获取训练样本;所述训练样本包括交易数据样本和标签样本;所述交易数据样本为包含比特币地址标识符、比特币流向数据集合,所述标签样本为判断所述交易数据样本中比特币地址标识符是否为比特币交易所地址的标签;通过权...

【专利技术属性】
技术研发人员:梁嘉琦李林静曾大军
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1