当前位置: 首页 > 专利查询>中山大学专利>正文

一种基于比特币交易时序序列相似性的用户聚类方法技术

技术编号:24035892 阅读:74 留言:0更新日期:2020-05-07 01:53
本发明专利技术公开一种基于比特币交易时序序列相似性的用户聚类方法,包括采集地址交易数及其交易额构造并拼接交易向量生成地址交易时序序列;采用滑窗填零方式将地址B和地址A的交易时序序列调整为等长;针对每种滑窗填零方式计算地址B与地址A的交易时序序列的余弦相似度;选取K个地址作为初始质心,将除质心外的其他地址加入与其余弦相似度最大的质心形成K个初始集合;计算初始集合中地址与其质心的余弦相似度和

A user clustering method based on the sequence similarity of bitcoin transactions

【技术实现步骤摘要】
一种基于比特币交易时序序列相似性的用户聚类方法
本专利技术涉及区块链领域,尤其涉及一种基于比特币交易时序序列相似性的用户聚类方法。
技术介绍
随着区块链技术的普及和发展,基于区块链衍生的产品越来越多。其中,数字货币是区块链领域非常重要的产物之一,同时,比特币作为数字货币的代表,也备受关注,吸引了商户,个人等不同类型的用户进行比特币交易。比特币由于其匿名化的特点深受欢迎,但是从宏观的角度,对于比特币交易的监管也十分重要,因为比特币交易网络中不仅有正常合理的交易用户,同时也藏匿着赌博,洗钱等不正常的用户的交易行为。因此,利用比特币交易网络的数据进行用户识别十分重要。随着机器学习技术的发展以及区块链技术的进一步普及,业务人员希望通过利用机器学习的技术,对已有的比特币交易数据进行挖掘建模,以更准确地刻画比特币交易网络中的用户画像,有利于对比特币交易的监管和把控。
技术实现思路
本专利技术为克服上述现有技术所述的至少一种缺陷(不足),提供一种基于比特币交易时序序列相似性的用户聚类方法。本专利技术旨在至少在一定程度上解决本文档来自技高网...

【技术保护点】
1.一种基于比特币交易时序序列相似性的用户聚类方法,其特征在于,包括:/nS10采集在预设时序段内以地址输入交易的交易数及其交易额、地址输出交易的交易数及其交易额,构造地址在预设时序段的交易向量,拼接地址在预设时序段的所有交易向量生成地址在预设时序段的交易时序序列;/nS20采用滑窗填零方式将地址B交易时序序列调整为地址A交易时序序列的等长;/nS30针对每种滑窗填零方式计算地址B与地址A的交易时序序列的余弦相似度VAR,并将其初始值记为VAR

【技术特征摘要】
1.一种基于比特币交易时序序列相似性的用户聚类方法,其特征在于,包括:
S10采集在预设时序段内以地址输入交易的交易数及其交易额、地址输出交易的交易数及其交易额,构造地址在预设时序段的交易向量,拼接地址在预设时序段的所有交易向量生成地址在预设时序段的交易时序序列;
S20采用滑窗填零方式将地址B交易时序序列调整为地址A交易时序序列的等长;
S30针对每种滑窗填零方式计算地址B与地址A的交易时序序列的余弦相似度VAR,并将其初始值记为VARold;
S40选取K个地址作为初始质心,遍历除了这K个质心之外的全部地址获取每个地址与质心的最大余弦相似度,并将每个地址加入与其具有余弦相似度的质心形成初始集合,由此得到K个初始集合;
S50分别计算每个集合中全部点与其质心的余弦相似度和i为K个集合的当前集合;
S60对于K个初始集合,选择与集合内的其他点余弦相似度和最大的点作为新质心,新质心更新初始质心,返回S40形成新集合,新集合更新初始集合,将赋值给VARold,重新计算设置相似度偏差阈值Y,循环上述步骤并迭代更新,直至得到K个最终集合。


2.如权利要求1所述的基于比特币交易时序序列相似性的用户聚类方法,其特征在于,所述余弦相似度计算公式如下:



其中Sim(A,Bu)表示地址A和地址Bu的欧式距离,CosSim(A,Bu)为以地址Bu的交易时序序列与地址A的交易时序序列的余弦距离,即为地址Bu和地址A的余弦相似度,Bu表示地址B的滑窗填充序列,u为滑窗填零方式种数,t为滑窗填充后的等长交易时序序列的长度,v代表在计算余弦相似度的时候需要遍历或被遍历地址的交易时序序列。

...

【专利技术属性】
技术研发人员:郑子彬蔡岳
申请(专利权)人:中山大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1