一种数据转移信息识别方法、装置、设备及存储介质制造方法及图纸

技术编号:35153201 阅读:18 留言:0更新日期:2022-10-05 10:32
本申请涉及数据处理技术领域,尤其涉及一种数据转移信息识别方法、装置、设备及存储介质。该方法包括:获取待识别的数据转移信息;将数据转移信息输入数据转移信息识别模型,得到数据转移信息识别模型输出的数据转移信息识别结果;数据转移信息识别结果用于表征数据转移信息为异常数据转移信息或非异常数据转移信息;其中,数据转移信息识别模型为基于分类误差和全局信息增益对初始决策树模型进行强化学习得到的;初始决策树模型为基于信息识别神经网络得到;信息识别神经网络为基于历史数据转移信息对多层神经网络进行训练得到。该方法模型训练和强化学习得到数据转移信息识别模型,模型结构上具备隐藏层的分布式表示能力,确保识别结果的准确性和可解释性。确保识别结果的准确性和可解释性。确保识别结果的准确性和可解释性。

【技术实现步骤摘要】
一种数据转移信息识别方法、装置、设备及存储介质


[0001]本申请涉及数据处理
,尤其涉及一种数据转移信息识别方法、装置、设备及存储介质。

技术介绍

[0002]贸易真实性验证是确保跨境交易安全的重要任务,通常作为相关跨境支付交易是否成功的关键要素。贸易真实性验证方法通常为,通过人工来构造规则以确定核验的贸易信息是否存在冲突,来判断贸易是否真实。但是基于规则冲突的贸易真实性验证方法,主要依赖配置的经验规则,规则覆盖的贸易材料很少,大量规则调整困难,局限性较大。
[0003]目前,也有一些使用规则学习方法进行贸易真实性验证。这种方法通常是对关联规则进行挖掘,以发现核验的贸易信息中数据项与项之间的关系,然后生成规则。此类方法适用于没有太大差异的数据项。然而,在实际应用中,常常需要挖掘不同类型数据项之间存在的规则,不能简单的将所有数据项当成同种规则。并且,关联规则挖掘是通用的规则生成算法,在频繁项挖掘阶段需要消耗大量时间挖掘无关项的频繁项,无法针对特定的规则进行优化,所以关联规则挖掘算法无论是效率还是产出结果的指标都偏低,无法准确高效地对贸易信息的真实性进行验证。

技术实现思路

[0004]本申请提供一种数据转移信息识别方法、装置、设备及存储介质,基于多层神经网络生成初始决策树模型,然后通过强化学习对初始决策树模型进行优化,可以通过持续的训练学习自动更新模型,保障识别准确率。
[0005]第一方面,本申请实施例公开了一种数据转移信息识别方法,该方法包括:
[0006]获取待识别的数据转移信息;
[0007]将数据转移信息输入数据转移信息识别模型,得到数据转移信息识别模型输出的数据转移信息识别结果;数据转移信息识别结果用于表征数据转移信息为异常数据转移信息或非异常数据转移信息;
[0008]其中,数据转移信息识别模型为基于分类误差和全局信息增益对初始决策树模型进行强化学习得到的;初始决策树模型包括至少两棵决策树,分类误差为每棵决策树对分类数据进行分类的分类误差,全局信息增益用于表征所有决策树的分类结果,对初始决策树模型输出结果不确定性的降低程度;初始决策树模型为基于信息识别神经网络得到;信息识别神经网络为基于历史数据转移信息对多层神经网络进行训练得到,历史数据转移信息标注有非异常标注结果。
[0009]进一步的,获取待识别的数据转移信息,包括:
[0010]获取待识别的对象转移信息;
[0011]在对象转移信息中确定至少一个数据转移对象属性信息;
[0012]基于预定义规则,确定每个数据转移对象属性信息所对应的属性值;
[0013]将至少一个数据转移对象属性信息和每个数据转移对象属性信息所对应的属性值,作为数据转移信息。
[0014]进一步的,信息识别神经网络的训练方法包括:
[0015]获取标注有非异常标注结果的历史数据转移信息;
[0016]将历史数据转移信息输入多层神经网络中,得到多层神经网络输出的信息识别结果;
[0017]根据非异常标注结果和信息识别结果,确定信息识别神经网络。
[0018]进一步的,初始决策树模型的确定方法包括:
[0019]确定信息识别神经网络中每相邻两层神经网络的映射关系;
[0020]基于决策树生成算法,根据每个映射关系,构建至少两棵决策树;
[0021]将至少两棵决策树,作为初始决策树模型。
[0022]进一步的,初始决策树模型的强化学习方法包括:
[0023]确定每棵决策树中分类数据的分类误差和初始决策树模型的全局信息增益;
[0024]基于分类误差和全局信息增益,对每棵决策树进行调整,得到调整决策树模型;
[0025]基于调整决策树模型,确定数据转移信息识别模型。
[0026]进一步的,基于分类误差和全局信息增益,对每棵决策树进行调整,得到调整决策树模型,包括:
[0027]基于分类误差和全局信息增益,确定初始决策树模型的损失数据;
[0028]根据损失数据对每棵决策树进行调整,得到调整决策树模型。
[0029]进一步的,调整决策树模型包括结果输出层决策树和至少一棵决策层决策树;基于调整决策树模型,确定数据转移信息识别模型,包括:
[0030]确定至少一棵决策层决策树与结果输出层决策树的映射关系;
[0031]根据映射关系,将至少一棵决策层决策树与结果输出层决策树进行合并,得到数据转移信息识别模型。
[0032]第二方面,本申请实施例公开了一种数据转移信息的识别装置,装置包括:
[0033]获取模块,用于获取待识别的数据转移信息;
[0034]识别结果确定模块,用于将数据转移信息输入数据转移信息识别模型,得到数据转移信息识别模型输出的数据转移信息识别结果;数据转移信息识别结果用于表征数据转移信息为异常数据转移信息或非异常数据转移信息;
[0035]其中,数据转移信息识别模型为基于分类误差和全局信息增益对初始决策树模型进行强化学习得到的;初始决策树模型包括至少两棵决策树,分类误差为每棵决策树对分类数据进行分类的分类误差,全局信息增益用于表征所有决策树的分类结果,对初始决策树模型输出结果不确定性的降低程度;初始决策树模型为基于信息识别神经网络得到;信息识别神经网络为基于历史数据转移信息对多层神经网络进行训练得到,历史数据转移信息标注有非异常标注结果。
[0036]在一些可选的实施例中,获取模块包括:
[0037]对象转移信息获取单元,用于获取待识别的对象转移信息;
[0038]数据转移对象属性信息确定单元,用于在对象转移信息中确定至少一个数据转移对象属性信息;
[0039]属性值确定单元,用于基于预定义规则,确定每个数据转移对象属性信息所对应的属性值;
[0040]数据转移信息确定单元,用于将至少一个数据转移对象属性信息和每个数据转移对象属性信息所对应的属性值,作为数据转移信息。
[0041]在一些可选的实施例中,该装置还包括信息识别神经网络训练模块,信息识别神经网络训练模块包括:
[0042]历史数据转移信息获取单元,用于获取标注有非异常标注结果的历史数据转移信息;
[0043]信息识别结果确定单元,用于将历史数据转移信息输入多层神经网络中,得到多层神经网络输出的信息识别结果;
[0044]信息识别神经网络确定单元,用于根据非异常标注结果和信息识别结果,确定信息识别神经网络。
[0045]在一些可选的实施例中,该装置还包括始决策树模型确定模块,初始决策树模型确定模块包括:
[0046]映射关系确定单元,用于确定信息识别神经网络中每相邻两层神经网络的映射关系;
[0047]决策树构建单元,用于基于决策树生成算法,根据每个映射关系,构建至少两棵决策树;
[0048]初始决策树模型确定单元,用于将至少两棵决策树,作为初始决策树模型。
[004本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据转移信息识别方法,其特征在于,所述方法包括:获取待识别的数据转移信息;将所述数据转移信息输入数据转移信息识别模型,得到所述数据转移信息识别模型输出的数据转移信息识别结果;所述数据转移信息识别结果用于表征所述数据转移信息为异常数据转移信息或非异常数据转移信息;其中,所述数据转移信息识别模型为基于分类误差和全局信息增益对初始决策树模型进行强化学习得到的;所述初始决策树模型包括至少两棵决策树,所述分类误差为每棵所述决策树对分类数据进行分类的分类误差,所述全局信息增益用于表征所有所述决策树的分类结果,对所述初始决策树模型输出结果不确定性的降低程度;所述初始决策树模型为基于信息识别神经网络得到;所述信息识别神经网络为基于历史数据转移信息对多层神经网络进行训练得到,所述历史数据转移信息标注有非异常标注结果。2.根据权利要求1所述的方法,其特征在于,所述获取待识别的数据转移信息,包括:获取待识别的对象转移信息;在所述对象转移信息中确定至少一个数据转移对象属性信息;基于预定义规则,确定每个所述数据转移对象属性信息所对应的属性值;将至少一个所述数据转移对象属性信息和每个所述数据转移对象属性信息所对应的属性值,作为所述数据转移信息。3.根据权利要求1所述的方法,其特征在于,所述信息识别神经网络的训练方法包括:获取标注有所述非异常标注结果的所述历史数据转移信息;将所述历史数据转移信息输入所述多层神经网络中,得到所述多层神经网络输出的信息识别结果;根据所述非异常标注结果和所述信息识别结果,确定所述信息识别神经网络。4.根据权利要求1所述的方法,其特征在于,所述初始决策树模型的确定方法包括:确定所述信息识别神经网络中每相邻两层神经网络的映射关系;基于决策树生成算法,根据每个所述映射关系,构建至少两棵决策树;将所述至少两棵决策树,作为所述初始决策树模型。5.根据权利要求1所述的方法,其特征在于,所述初始决策树模型的强化学习方法包括:确定每棵所述决策树中所述分类数据的分类误差和所述初始决策树模型的全局信息增益;基于所述分类误差和所述全局信息增益,对每棵所述决策树进行调整,得到调整决策树模型;基于所述调整决策树模型,确定所述数据转移信息识别...

【专利技术属性】
技术研发人员:王愚唐建扬王化楠
申请(专利权)人:连连杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1