当前位置: 首页 > 专利查询>复旦大学专利>正文

在区块链中多活动标签用户的主要活动标签确定方法技术

技术编号:23625477 阅读:38 留言:0更新日期:2020-03-31 23:01
本发明专利技术属于区块链领域,具体为一种在区块链中对多活动标签用户的主要活动标签确定的方法。本发明专利技术方法包括四个主要步骤:1)筛选多活动标签用户交易构建内部交易集,基于过滤规则构建多活动标签用户单一活动的内部交易集;2)提取多活动标签用户的内部交易指标的特征值;3)基于熵权法计算各内部交易指标的权重;4)根据交易指标的权重和特征值共同确定多活动标签用户的主要活动标签。本方法的优点在于:通过熵权法基于多活动标签用户在多种活动中各项影响活动标签的指标的离散分布情况来确定不同指标的权重,并通过标准化操作确保各指标的特征值能够在同一维度下进行计算,量化用户的主要活动标签归属。

A method for determining the main active tags of users with multiple active tags in blockchain

【技术实现步骤摘要】
在区块链中多活动标签用户的主要活动标签确定方法
本专利技术属于区块链
,具体涉及在区块链中对多活动标签用户的主要活动标签确定方法。
技术介绍
区块链技术是比特币等新型数字货币的底层技术支撑,在以比特币为代表的平台中,全球有几千万的用户持有比特币进行交易,每天的平均交易量数额巨大,区块链技术要在分布式环境下保障可信交易,因此运用密码学技术对用户的具体信息进行隐藏,这使得基于这些匿名支付网络的数据分析成为一个有价值的研究课题。在数据分析过程中,对于网络画像和用户身份的确定是很重要的一项环节。在比特币平台场景下,我们针对用户的行为类型提出了五类社区的概念,作为某一社区的用户,该用户在社区内部的活动密集,而在社区外部的活动稀疏,即活动有着明显的边界。因此作为用户的主要活动标签,以该身份参与的交易量会比其他身份进行的交易量大。尤其对于多活动标签用户而言,在其主要活动所在社区内部的行为更加显著。为了量化多活动标签用户的行为习惯活动并掌握其活动偏好并确定其主要活动标签,需要提出一个定量模型来探索多活动标签用户的主要活动标签。目前未有人提出在区块链中对多活动标签用户主要活动标签确定的方法,多数只是对用户的身份基于机器学习方法进行预测,可能存在数据偏见等问题,并且区块链平台中的数据集格式差异较大,不能形成统一的方法,因此本专利技术对数据集中研究的条目进行了规范化处理。
技术实现思路
本专利技术的目的在于提出一种在区块链中对多活动标签用户主要活动标签的确定方法,以便于量化区块链中多活动标签用户的主要活动标签,即用户的行为模式和偏好。本专利技术提出的多活动标签用户的主要活动标签确定方法,在一定时间窗口内,对用户的交易数据根据其已有标签进行社区内、外部交易进行区分,并对内部交易进行特征提取;基于信息熵模型定量评估用户的活动,在比特币区块链平台中,特别考虑两个指标:交易金额和交易时间间隔,经熵权法计算各指标所占的比重,并结合指标的标准化特征值,确定多活动标签用户的不同标签的得分高低,分数最高者即为用户在一定时间内的主要活动标签。本专利技术中,首先定义用户的具体信息(用户对应的交易、交易金额、交易时间戳),并基于熵权法确定身份标签中多重指标的权重,结合指标的标准化数值,对多活动标签用户的主要身份进行确定。本专利技术提供的在区块链中多活动标签用户的主要活动标签确定方法,具体步骤如下。步骤一、过滤多活动标签用户的交易集,保留内部交易;用户是具有多重活动标签的,标签由用户所在的社区和参与活动其中扮演的角色共同确定,即标签反映了用户所在的社区和在社区中扮演的角色。本专利技术中定义了社区中的内部交易和外部交易,其中内部交易反映的是用户在社区内部的交易活动,外部交易指的是社区之间的交易活动。本专利技术中只考虑内部交易作为判断多活动标签用户主要活动标签的依据。区块链中的社区类型有多种,本专利技术仅列举最常见的五类进行说明,包括暗网社区、交易所社区、赌博社区、矿工社区、服务商社区,每个社区又有组织者和参与者之分,共十种标签。对于区块链中的其它社区,其对应的组织者和参与者标签也可以按照同样的方式进行处理。本专利技术中,对于一个多活动标签用户,根据下述两条规则来过滤多活动标签用户交易集合中的交易数据,得到该多活动标签用户对应在交易集中的社区标签的内部交易集。本专利技术具体提出了在根据多活动标签用户的标签选取内部交易时的规则,设多活动标签用户为U,其拥有的标签为a:规则1:用户U作为付款方(交易输入),且收款方(交易输出)的用户集合中必须存在以a为唯一标签的用户;规则2:用户U作为收款方,且在付款方用户包含标签a的情况下,用户U属于输出用户集合且该集合中其他用户必须全为以a为唯一标签的用户。步骤二、提取内部交易特征以步骤一中提到的用户U和标签a为例进行说明:按照每个活动标签,将用户内部交易集中相应的交易按照时间戳的大小进行排序。将时间戳最小的交易的相对时间记为零,并将随后其他交易的时间戳分别与前一交易的时间戳作差,将原本每条交易的时间戳转换为与相邻(前序)交易的交易时间间隔。将交易金额和交易时间间隔作为多活动标签用户的每个标签的特征。步骤三、基于熵权法计算交易金额序列和交易时间间隔序列指标的权重(1)将标签特征中的交易金额和交易时间间隔序列进行标准化处理,即序列的绝对值转化为[0,1]范围内的相对值;其中,金额序列按照正向指标来处理,时间间隔序列按负向指标处理;(2)计算交易金额指标序列和交易时间间隔指标序列中每项数据占该指标的比重;(4)计算交易金额指标序列和交易时间间隔指标序列的熵值;(5)计算交易金额指标序列和交易时间间隔指标序列的信息熵冗余度,其中,差异度越大代表该指标对评价参考依据越重;(6)计算交易金额指标和交易时间间隔各指标的权重,将得到用户所有身份标签下交易金额序列和交易时间间隔指标的权重。步骤四、对用户的主要活动标签进行判断在本步骤中,根据步骤三得到的多活动标签用户的交易金额和交易时间间隔两个指标的权重,与相应的标准化后的交易时间总和以及标准化后的平均时间间隔进行加权求和,构成多活动标签用户的不同标签的得分。对多活动标签用户的所有标签的得分进行排序,分数最高的标签即为用户的主要活动标签。本专利技术方法可以对多活动标签的用户进行唯一身份或主要身份的确定,由于用户的身份候选标签经由外部数据的收集已经确定,因此降低了实现难度。本专利技术提出的技术方案是易于实现的,通过约束条件和简化来降低对复杂算法的依赖。本专利技术提出的区块链下的多活动标签用户的主要活动标签确定方法,除了可以直接用在比特币平台上,其相应的计算方法也可为其它支付网络中的多活动标签用户主要活动标签确定方案提供参考,通过自定义修改标签的形式,即可设计出针对不同支付网络的多活动标签用户的主要活动标签确定方案。附图说明图1为本专利技术的流程图。其中,其中横向箭头表示整个方法的流程;纵向箭头中的虚线箭头表示某一步骤中所用的关键方法,实线箭头表示某一步骤中的输出数据。具体实施方式下面通过实施例对本专利技术作进一步详细说明。但本专利技术的作用范围不限于下述的实施例。在本专利技术实施例中,选取比特币网络中多活动标签用户进行主要活动标签的确定。由于不同领域下用户的标签有所不同,因此这里以比特币网络中最常见的基本标签为例,这些基本标签包括暗网活动社区(d)、交易所活动社区(e)、赌博活动社区(g)、矿工活动社区(m)、服务商活动社区(s),其中每个标签又为组织者(o)和参与者(p)。用户实际被标注的标签是两种标签的组合,如赌博活动参与者(gp)、暗网活动组织者(do)等。随机选取一个多活动标签用户,来展示其主要活动标签的确定过程中的每一步结果。1.输入数据的预处理主要活动标签待确定的目标用户U(gp,dp),其他相关用户为A(gp,dp,ep),B(gp),C(dp),D(dp,sp),E(gp,mp)本文档来自技高网...

【技术保护点】
1.一种在区块链中多活动标签用户的主要活动标签确定方法,其特征在于,具体步骤为:/n步骤一、过滤多活动标签用户的交易集,保留内部交易;/n用户是具有多重活动标签的,标签由用户所在的社区和参与活动其中扮演的角色共同确定,即标签反映用户所在的社区和在社区中扮演的角色;/n社区中活动分为内部交易和外部交易;内部交易反映的是用户在社区内部的交易活动,外部交易指的是社区之间的交易活动;只考虑内部交易作为判断多活动标签用户主要活动标签的依据;/n步骤二、提取内部交易特征/n按照每个活动标签,将用户内部交易集中相应的交易按照时间戳的大小进行排序;将时间戳最小的交易的相对时间记为零,并将随后其他交易的时间戳分别与前一交易的时间戳作差,将原本每条交易的时间戳转换为与相邻交易的交易时间间隔;/n将交易金额和交易时间间隔作为多活动标签用户的每个标签的特征;/n步骤三、基于熵权法计算交易金额序列和交易时间间隔序列指标的权重;具体流程为:/n(1)将标签特征中的交易金额和交易时间间隔序列进行标准化处理,即将序列的绝对值转化为[0,1]范围内的相对值;其中,金额序列按照正向指标来处理,时间间隔序列按负向指标处理;/n(2)计算交易金额指标序列和交易时间间隔指标序列中每项数据占该指标的比重;/n(4)计算交易金额指标序列和交易时间间隔指标序列的熵值;/n(5)计算交易金额指标序列和交易时间间隔指标序列的信息熵冗余度,其中,差异度越大代表该指标对评价参考依据越重;/n(6)计算交易金额指标和交易时间间隔各指标的权重,将得到用户所有身份标签下交易金额序列和交易时间间隔指标的权重;/n步骤四、对用户的主要活动标签进行判断/n根据步骤三得到的多活动标签用户的交易金额和交易时间间隔两个指标的权重,与相应的标准化后的交易时间总和以及标准化后的平均时间间隔进行加权求和,构成多活动标签用户的不同标签的得分;对多活动标签用户的所有标签的得分进行排序,分数最高的标签即为用户的主要活动标签。/n...

【技术特征摘要】
1.一种在区块链中多活动标签用户的主要活动标签确定方法,其特征在于,具体步骤为:
步骤一、过滤多活动标签用户的交易集,保留内部交易;
用户是具有多重活动标签的,标签由用户所在的社区和参与活动其中扮演的角色共同确定,即标签反映用户所在的社区和在社区中扮演的角色;
社区中活动分为内部交易和外部交易;内部交易反映的是用户在社区内部的交易活动,外部交易指的是社区之间的交易活动;只考虑内部交易作为判断多活动标签用户主要活动标签的依据;
步骤二、提取内部交易特征
按照每个活动标签,将用户内部交易集中相应的交易按照时间戳的大小进行排序;将时间戳最小的交易的相对时间记为零,并将随后其他交易的时间戳分别与前一交易的时间戳作差,将原本每条交易的时间戳转换为与相邻交易的交易时间间隔;
将交易金额和交易时间间隔作为多活动标签用户的每个标签的特征;
步骤三、基于熵权法计算交易金额序列和交易时间间隔序列指标的权重;具体流程为:
(1)将标签特征中的交易金额和交易时间间隔序列进行标准化处理,即将序列的绝对值转化为[0,1]范围内的相对值;其中,金额序列按照正向指标来处理,时间间隔序列按负向指标处理;
(2)计算交易金额指标序列和交易时间间隔指标序列中每项数据占该指标的比重;
(4)计算交易金额指标序列和交易时间间隔指标序列的熵值;
(5)计算交易金额指标序列和交易时间间隔指标序列的信息熵冗余度,其中,差...

【专利技术属性】
技术研发人员:韩伟力陈鼎洁吕朝阳陈世泽
申请(专利权)人:复旦大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1