一种基于区块链的物流系统异常数据识别方法技术方案

技术编号:35560917 阅读:15 留言:0更新日期:2022-11-12 15:43
本发明专利技术公开了一种基于区块链的物流系统异常数据识别方法,涉及区块链技术领域。对样本数据进行初始化,得到多个训练集以及每一训练集对应的初始化样本权重和错分代价;以初始化样本权重和错分代价为参数,进行预设数目次迭代,得到预设数目个弱分类器,将预设数目个弱分类器组合成该训练集的强分类器;将所有训练集的强分类器进行加权聚合,通过投票式判决得到交易数据是否异常的判决结果;将正常的数据打包得到第二区块接入至区块链。结合基于集成学习和代价敏感的不平衡数据分类算法,可以有效提高不平衡数据分类的准确性,当异常数据在整体数据中占比较小时,也可以通过已训练的强分类器进行准确判断,避免将异常的数据打包上链,造成损失。造成损失。造成损失。

【技术实现步骤摘要】
一种基于区块链的物流系统异常数据识别方法


[0001]本专利技术涉及区块链
,具体涉及一种基于区块链的物流系统异常数据识别方法。

技术介绍

[0002]近年来,电子商务发展迅速,物流业与各种互联网技术的结合越来越紧密。在物流相关技术飞速进步的同时,仍然有很多问题亟待解决,例如物流信息溯源问题。该问题不仅仅是简单地查询货物始发地、途径地以及目的地等运输信息,更重要的是要保证所查询到的信息的真实性。物流信息溯源可以有效追踪物流商品,在其经过风险地区和相关人员时可以及时了解并进行处理,在一定程度上降低了风险。
[0003]传统的物流系统采用集中化部署模式,存在生产商、经销商篡改物流信息的风险,无法保证信息的准确性。同时,区块链网络因为高度透明、去中心化、不可篡改以及匿名等性质获得了广泛关注。相较于传统物流系统,区块链实现了数据不可篡改以及物流商品追溯等功能,有效打破信息孤岛,避免恶意修改信息导致的问题。
[0004]现有技术中,应用区块链技术数据虽然保证了上链数据的不可篡改,但是无法保证参与方提交的数据的真实性和准确性。在有恶意参与方提交恶意数据或异常数据的情况下,不经过判断直接进行数据上链,很容易造成损失。

技术实现思路

[0005]本专利技术的目的就在于解决上述
技术介绍
的问题,而提出一种基于区块链的物流系统异常数据识别方法。
[0006]本专利技术的目的可以通过以下技术方案实现:
[0007]基于本专利技术实施例提供的一种基于区块链的物流系统异常数据识别方法,所述方法包括:
[0008]获取用户区块链节点提交至待审核区块的交易数据;
[0009]对样本数据进行初始化,得到多个训练集以及每一训练集对应的初始化样本权重和错分代价;所述样本数据包括所述交易数据和所述用户区块链节点的历史数据;
[0010]针对每一训练集,以所述初始化样本权重和所述错分代价为参数,进行预设数目次迭代,得到预设数目个弱分类器,将预设数目个弱分类器组合成该训练集的强分类器;
[0011]将所有训练集的强分类器进行加权聚合,通过投票式判决得到所述交易数据是否异常的判决结果;
[0012]将所述交易数据的判决结果在区块链上进行广播,并将正常的数据打包得到第二区块,将第二区块接入至区块链。
[0013]可选地,在获取用户区块链节点提交至待审核区块的交易数据之前,所述方法还包括:
[0014]获取目标用户通过用户区块链节点输入的账号和密码,与数据库User用户表中记
录的注册时填的信息进行比对,对所述目标用户进行身份验证;
[0015]若所述目标用户身份验证成功,且所述用户区块链节点上传了所述交易数据,则将所述交易数据保存至所述待审核区块。
[0016]可选地,对所述样本数据进行初始化,得到多个训练集以及每一训练集对应的初始化样本权重和错分代价,包括:
[0017]将所述样本数据划分为N个训练集;
[0018]针对每一训练集,该训练集表示为:
[0019]S={(x1,y1),(x2,y2),...,(x
K
,y
K
)|y∈(1,

1)}
[0020]其中,K为训练集S的样本总数,x
k
表示第k个样本的数据,y
k
表示第k个样本是否正常,y
k


1代表正常类样本;y
k
=1代表异常类样本;
[0021]计算该训练集第一次迭代的初始化样本权重D1:
[0022][0023]其中,w
1k
为第一次迭代时训练集S中每个样本的权重;
[0024]计算该训练集的错分代价C
k

[0025][0026]其中,n为训练集中多数类样本的数量,m为训练集中少数类样本的数量,K为训练集S的样本总数。
[0027]可选地,针对每一训练集,以所述初始化样本权重和所述错分代价为参数,进行预设数目次迭代,得到预设数目个弱分类器,将预设数目个弱分类器组合成该训练集的强分类器,包括以下步骤:
[0028]步骤一,针对每一训练集,提取部分数据,作为学习训练集;
[0029]步骤二,使用所述学习训练集当前对应的学习样本权重对所述学习训练集进行学习,得到弱分类器;所述学习样本权重在第一次迭代时为所述初始化样本权重;
[0030]步骤三,根据所述学习样本权重和错分代价更新下一次迭代的所述学习样本权重;
[0031]步骤四,使用更新后的所述学习样本权重,重复执行上述步骤一至步骤三,直到完成预设数目次迭代,得到预设数目个弱分类器;
[0032]步骤五,训练集S经过T次迭代后得到一组弱分类器f=(f1,f2,...,f
T
),将弱分类器集合f组合成一个强分类器F
i

[0033][0034]其中,i表示训练集S为N个训练集中的第i个,T表示训练集S的迭代次数,α
t
表示第t次迭代时的弱分类器f
t
的所述学习样本权重,sign函数输出值为1或

1。
[0035]可选地,每一训练集包括正常类样本和异常类样本,正常类样本多于异常类样本,正常类样本称为多数类样本,异常类样本称为少数类样本;假设每一训练集包含的m个多数类样本和n个少数类样本;
[0036]针对每一训练集,提取部分数据,作为学习训练集,具体包括:
[0037]针对每一训练集,按照初始化样本权重对该训练集包含的m个多数类样本按照从大到小进行排序,提取前n个多数类样本与n少数类样本,形成新的集合,作为学习训练集。
[0038]可选地,根据所述学习样本权重和错分代价更新下一次迭代的所述学习样本权重,包括:
[0039]假设本次迭代为第t次迭代,计算本次迭代时弱分类器f
t
的错误率ε
t

[0040][0041]其中,D
t
(x
k
)表示第k个样本的数据x
k
在第t次迭代时的所述学习样本权重;
[0042]计算第t次迭代训练的弱分类器f
t
的权重α
t

[0043][0044]计算样本权重调节因子β
k

[0045]β
k


0.5(y
k
f
t
(x
k
))C
k
+0.5
[0046]其中,y
k
为数值为1或

1的变量,f
t
(x
k
)为第k个样本的数据经过第t次迭代训练的弱分类器f
t
的输出数值,C
k
为错分代价;
[004本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于区块链的物流系统异常数据识别方法,其特征在于,所述方法包括:获取用户区块链节点提交至待审核区块的交易数据;对样本数据进行初始化,得到多个训练集以及每一训练集对应的初始化样本权重和错分代价;所述样本数据包括所述交易数据和所述用户区块链节点的历史数据;针对每一训练集,以所述初始化样本权重和所述错分代价为参数,进行预设数目次迭代,得到预设数目个弱分类器,将预设数目个弱分类器组合成该训练集的强分类器;将所有训练集的强分类器进行加权聚合,通过投票式判决得到所述交易数据是否异常的判决结果;将所述交易数据的判决结果在区块链上进行广播,并将正常的数据打包得到第二区块,将第二区块接入至区块链。2.基于权利要求1所述的一种基于区块链的物流系统异常数据识别方法,其特征在于,在获取用户区块链节点提交至待审核区块的交易数据之前,所述方法还包括:获取目标用户通过用户区块链节点输入的账号和密码,与数据库User用户表中记录的注册时填的信息进行比对,对所述目标用户进行身份验证;若所述目标用户身份验证成功,且所述用户区块链节点上传了所述交易数据,则将所述交易数据保存至所述待审核区块。3.基于权利要求1所述的一种基于区块链的物流系统异常数据识别方法,其特征在于,对所述样本数据进行初始化,得到多个训练集以及每一训练集对应的初始化样本权重和错分代价,包括:将所述样本数据划分为N个训练集;针对每一训练集,该训练集表示为:S={(x1,y1),(x2,y2),...,(x
K
,y
K
)|y∈(1,

1)}其中,K为训练集S的样本总数,x
k
表示第k个样本的数据,y
k
表示第k个样本是否正常,y
k


1代表正常类样本;y
k
=1代表异常类样本;计算该训练集第一次迭代的初始化样本权重D1:其中,w
1k
为第一次迭代时训练集S中每个样本的权重;计算该训练集的错分代价C
k
:其中,n为训练集中多数类样本的数量,m为训练集中少数类样本的数量,K为训练集S的样本总数。4.基于权利要求1所述的一种基于区块链的物流系统异常数据识别方法,其特征在于,针对每一训练集,以所述初始化样本权重和所述错分代价为参数,进行预设数目次迭代,得到预设数目个弱分类器,将预设数目个弱分类器组合成该训练集的强分类器,包括以下步骤:步骤一,针对每一训练集,提取部分数据,作为学习训练集;步骤二,使用所述学习训练集当前对应的学习样本权重对所述学习训练集进行学习,
得到弱分类器;所述学习样本权重在第一次迭代时为所述初始化样本权重;步骤三,根据所述学习样本权重和错分代价更新下一次迭代的所述学习样本权重;步骤四,使用更新后的所述学习样本权重,重复执行上述步骤一至步骤三,直到完成预设数目次迭代,得到预设数目个弱分类器;步骤五,训练集S经过T次迭代后得到一组弱分类器f=(f1,f2,...,f
T
),将弱分类器集合f组合成一个强分类器F
i
:其中,i表示训练集S为N个训练集中的第i个,T表示训练集S的迭代次数,α
t
表示第t次迭代时的弱分类器f
t
...

【专利技术属性】
技术研发人员:周媛媛李晓辉沈八中苏家楠吕思婷
申请(专利权)人:西安电子科技大学广州研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1