信创环境下实现风险数据识别处理的方法、装置、处理器及其计算机可读存储介质制造方法及图纸

技术编号:37644528 阅读:11 留言:0更新日期:2023-05-25 10:11
本发明专利技术涉及一种信创环境下实现风险数据识别处理的方法,包括以下步骤:通过word2Vec模型将待识别的文本数据转换为机器能够识别的向量样本;对数据进行批量归一化;通过改进的深度神经网络算法进行深度特征提取;通过5层卷积神经网络进行卷积特征提取;通过Softmax分类函数对风险数据进行识别分类。采用了本发明专利技术的信创环境下实现风险数据识别处理的方法、装置、处理器及其计算机可读存储介质,提出的风险数据识别方法能够有效对数据进行特征提取与充分挖掘,进而提高分类器的分类精度。同时,本发明专利技术所提出的算法具有较强的泛化能力和鲁棒性。化能力和鲁棒性。化能力和鲁棒性。

【技术实现步骤摘要】
信创环境下实现风险数据识别处理的方法、装置、处理器及其计算机可读存储介质


[0001]本专利技术涉及人工智能领域,尤其涉及数据安全领域,具体是指一种信创环境下实现风险数据识别处理的方法、装置、处理器及其计算机可读存储介质。

技术介绍

[0002]信息技术的飞速发展,使得大数据应用也愈加广泛,数据带来的价值和活力也逐渐增多,但受数据量大、来源多以及访问复杂因素的影响,导致数据安全缺少精细化的管理,特别是在信创环境下更容易引发数据安全治理问题。因此,应对信创环境下大数据应用过程中数据安全问题进行深入剖析,并提出更科学的治理思路和方法,通过架构合理的安全数据安全治理技术,为大数据的有效应用提供支持。风险数据感知是指在对风险数据进行深度挖掘和评估的基础上,感知某个领域的风险数据。风险数据感知不仅在互联网、金融、移动通信等领域得到了广泛应用,在信息化系统中也引起了高度关注。信息化系统在运行过程中会产生一定的风险,这些风险一部分属于运行风险,一部分属于生产安全风险,与信息化系统的运行状态密切相关。由于信息化系统中风险数据感知能力有限,导致风险数据在预测和感知中存在较大局限性,为了提升风险数据的预测和感知能力,本专利技术对信创环境下的风险数据进行识别。
[0003]CN201910619081.6提出了一种基于数据分析的风险识别方法及相关设备,其中,该方法可以包括:获取目标对象在目标场景下的风险数据;所述风险数据包括至少一个用于风险预测的标签;根据所述风险数据以及所述目标场景的风险预测模型,确定所述目标对象的风险预测结果;当所述风险预测结果指示所述目标对象存在风险时,将所述目标对象的信息添加至标记列表;采集所述目标对象在预设时间范围内的行为数据,并按照预设的行为评定规则确定所述行为数据所属的类别;生成包括所述目标对象的信息以及所述行为数据所属的类别的文件。采用本申请,可以使得风险识别过程更具针对性,并提高风险识别的准确度。
[0004]CN115496616A提出了一种应用于支付系统的风险识别方法及装置,可用于金融领域或其他领域,其中该方法包括:从支付系统获取交易数据;按照预设的比例抽取风险交易的交易数据和非风险交易的交易数据,在已知风险交易和非风险交易的情况下分析交易数据中的不同交易指标的风险识别能力的强弱性,并筛选出风险识别能力强的N种交易指标;根据筛选出的N种交易指标生成训练样本;根据所述训练样本以及预设的机器学习模型训练出风险识别工具;将所述风险识别工具接入所述支付系统,以使所述支付系统根据所述风险识别工具对实时处理的交易进行风险识别。本专利技术能够在交易处理完成前完成风险识别,有助于减少风险交易。
[0005]CN202211117623.8提出了一种融合专家模型决策的数据风险识别方法及服务器,通过从异常用户行为记录中挖掘疑似风险行为事件的风险行为决策知识、行为事件分布特征以及行为事件区分标签,确定对应相同选定的疑似风险行为事件的多个疑似风险行为事
件,并确定同一选定的疑似风险行为事件的风险状态更新关系网,换言之,将风险行为决策知识与行为事件分布特征以及行为事件区分标签进行联动分析,同时依据以上三类知识属性确定选定的疑似风险行为事件的风险状态更新关系网,这样便于提高确定疑似风险行为事件是否存在风险隐患的精度以及选定的疑似风险行为事件的风险状态更新关系网的丰富程度,从而确保数据风险识别的准确性和可信度。
[0006]现有技术创新性好,能够实现风险数据的识别,但现有的算法模型对样本的特征提取能力不足,导致分类算法的鲁棒性和泛化能力较差,同时,现有的风险数据识别方法识别精度有待进一步提高。

技术实现思路

[0007]本专利技术的目的是克服了上述现有技术的缺点,提供了一种满足鲁棒性好、泛化能力好、分类精度高的信创环境下实现风险数据识别处理的方法、装置、处理器及其计算机可读存储介质。
[0008]为了实现上述目的,本专利技术的信创环境下实现风险数据识别处理的方法、装置、处理器及其计算机可读存储介质如下:
[0009]该信创环境下实现风险数据识别处理的方法、装置、处理器及其计算机可读存储介质,其主要特点是,所述的方法包括以下步骤:
[0010](1)通过word2Vec模型将待识别的文本数据转换为机器能够识别的向量样本;
[0011](2)对数据进行批量归一化;
[0012](3)通过改进的深度神经网络算法进行深度特征提取;
[0013](4)通过5层卷积神经网络进行卷积特征提取;
[0014](5)通过Softmax分类函数对风险数据进行识别分类。
[0015]较佳地,所述的步骤(1)具体包括以下步骤:
[0016](1.1)建立word2Vec模型,
[0017](1.2)通过word2Vec模型获取嵌入词向量。
[0018]较佳地,所述的步骤(2)中对数据进行批量归一化,具体为:
[0019]根据以下公式对数据进行批量归一化:
[0020][0021][0022][0023][0024]其中,ε为常数,E[y
ξ
]和Var[y
ξ
]均为中间过程计算值,γ和β为激活参数,被用于激活缩放和移动标准化值,y
i
为输入的第i个数据,y为输入向量,E[y
ξ
]为y的平均值,n为输入向量的元素个数,y
ξ
为输入向量中的小批量数据,Var[]为方差,为规范后的第i个数据,z
i
为经过归一化处理的输出的第i个数据。
[0025]较佳地,所述的步骤(3)具体包括以下步骤:
[0026](3.1)对深度神经网络初始化;
[0027](3.2)对权值矩阵赋予权值调整量ΔW;
[0028](3.3)输入训练样本,随机选择样本计算神经网络隐藏层和神经网络输出层的各单元的输出;
[0029](3.4)计算神经网络对不同的样本有不同的误差E
p
、各样本的gini指数E
c
、网络总误差E
RUE

[0030](3.5)判断网络总误差E
RUE
是否减小,如果是,则计算权值调整量并对权值进行调整;否则,继续步骤(3.2);赋予新的权值调整量

ΔW;
[0031](3.6)检查是否所有的样本都训练完成,如果训练样本数量p小于样本计数器的值P,继续步骤(3.2);否则继续步骤(3.5);
[0032](3.7)判断网络总误差E
RUE
是否达到精度要求,如果网络总误差E
RUF
小于训练精度E
min
或循环次数为设置的最大值,则结束步骤;否则继续步骤(3.2)。
[0033]较佳地,所述的步骤(4)的卷积神经网络采用GELU函数作为激活函数,采用交叉熵损失函数作为损失函数,并进行L2正则化,添加正则化项。
[0034]较佳地,所述的步本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信创环境下实现风险数据识别处理的方法,其特征在于,所述的方法包括以下步骤:(1)通过word2Vec模型将待识别的文本数据转换为机器能够识别的向量样本;(2)对数据进行批量归一化;(3)通过改进的深度神经网络算法进行深度特征提取;(4)通过5层卷积神经网络进行卷积特征提取;(5)通过Softmax分类函数对风险数据进行识别分类。2.根据权利要求1所述的信创环境下实现风险数据识别处理的方法,其特征在于,所述的步骤(1)具体包括以下步骤:(1.1)建立word2Vec模型,(1.2)通过word2Vec模型获取嵌入词向量。3.根据权利要求1所述的信创环境下实现风险数据识别处理的方法,其特征在于,所述的步骤(2)中对数据进行批量归一化,具体为:根据以下公式对数据进行批量归一化:根据以下公式对数据进行批量归一化:根据以下公式对数据进行批量归一化:根据以下公式对数据进行批量归一化:其中,ε为常数,E[y
ξ
]和Var[y
ξ
]均为中间过程计算值,γ和β为激活参数,被用于激活缩放和移动标准化值,y
i
为输入的第i个数据,y为输入向量,E[y
ξ
]为y的平均值,n为输入向量的元素个数,y
ξ
为输入向量中的小批量数据,Var[]为方差,为规范后的第i个数据,z
i
为经过归一化处理的输出的第i个数据。4.根据权利要求1所述的信创环境下实现风险数据识别处理的方法,其特征在于,所述的步骤(3)具体包括以下步骤:(3.1)对深度神经网络初始化;(3.2)对权值矩阵赋予权值调整量ΔW;(3.3)输入训练样本,随机选择样本计算神经网络隐藏层和神经网络输出层的各单元的输出;(3.4)计算神经网络对不同的样本有不同的误差E
p
、各样本的gini指数E
c
、网络总误差E
RUE
;(3.5)判断网络总误差E
RUE
是否减小,如果是,则计算权值调整量并对权值进行调整;否则,继续步骤(3.2);赋予新的权值调整量

ΔW;(3.6)检查是否所有的样本都训练完成,如果训练样本数量p小...

【专利技术属性】
技术研发人员:魏明李卜
申请(专利权)人:普元信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1