信创环境下实现风险数据识别处理的方法、装置、处理器及其计算机可读存储介质制造方法及图纸

技术编号：37644528 阅读：11 留言：0更新日期：2023-05-25 10:11

本发明专利技术涉及一种信创环境下实现风险数据识别处理的方法，包括以下步骤：通过word2Vec模型将待识别的文本数据转换为机器能够识别的向量样本；对数据进行批量归一化；通过改进的深度神经网络算法进行深度特征提取；通过5层卷积神经网络进行卷积特征提取；通过Softmax分类函数对风险数据进行识别分类。采用了本发明专利技术的信创环境下实现风险数据识别处理的方法、装置、处理器及其计算机可读存储介质，提出的风险数据识别方法能够有效对数据进行特征提取与充分挖掘，进而提高分类器的分类精度。同时，本发明专利技术所提出的算法具有较强的泛化能力和鲁棒性。化能力和鲁棒性。化能力和鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
信创环境下实现风险数据识别处理的方法、装置、处理器及其计算机可读存储介质

[0001]本专利技术涉及人工智能领域，尤其涉及数据安全领域，具体是指一种信创环境下实现风险数据识别处理的方法、装置、处理器及其计算机可读存储介质。

技术介绍

[0002]信息技术的飞速发展，使得大数据应用也愈加广泛，数据带来的价值和活力也逐渐增多，但受数据量大、来源多以及访问复杂因素的影响，导致数据安全缺少精细化的管理，特别是在信创环境下更容易引发数据安全治理问题。因此，应对信创环境下大数据应用过程中数据安全问题进行深入剖析，并提出更科学的治理思路和方法，通过架构合理的安全数据安全治理技术，为大数据的有效应用提供支持。风险数据感知是指在对风险数据进行深度挖掘和评估的基础上，感知某个领域的风险数据。风险数据感知不仅在互联网、金融、移动通信等领域得到了广泛应用，在信息化系统中也引起了高度关注。信息化系统在运行过程中会产生一定的风险，这些风险一部分属于运行风险，一部分属于生产安全风险，与信息化系统的运行状态密切相关。由于信息化系统中风险数据感知能力有限，导致风险数据在预测和感知中存在较大局限性，为了提升风险数据的预测和感知能力，本专利技术对信创环境下的风险数据进行识别。
[0003]CN201910619081.6提出了一种基于数据分析的风险识别方法及相关设备，其中，该方法可以包括：获取目标对象在目标场景下的风险数据；所述风险数据包括至少一个用于风险预测的标签；根据所述风险数据以及所述目标场景的风险预测模型，确定所述目标对象的风险预测结果；...

【技术保护点】

【技术特征摘要】
1.一种信创环境下实现风险数据识别处理的方法，其特征在于，所述的方法包括以下步骤：(1)通过word2Vec模型将待识别的文本数据转换为机器能够识别的向量样本；(2)对数据进行批量归一化；(3)通过改进的深度神经网络算法进行深度特征提取；(4)通过5层卷积神经网络进行卷积特征提取；(5)通过Softmax分类函数对风险数据进行识别分类。2.根据权利要求1所述的信创环境下实现风险数据识别处理的方法，其特征在于，所述的步骤(1)具体包括以下步骤：(1.1)建立word2Vec模型，(1.2)通过word2Vec模型获取嵌入词向量。3.根据权利要求1所述的信创环境下实现风险数据识别处理的方法，其特征在于，所述的步骤(2)中对数据进行批量归一化，具体为：根据以下公式对数据进行批量归一化：根据以下公式对数据进行批量归一化：根据以下公式对数据进行批量归一化：根据以下公式对数据进行批量归一化：其中，ε为常数，E[y
ξ
]和Var[y
ξ
]均为中间过程计算值，γ和β为激活参数，被用于激活缩放和移动标准化值，y
i
为输入的第i个数据，y为输入向量，E[y
ξ
]为y的平均值，n为输入向量的元素个数，y
ξ
为输入向量中的小批量数据，Var[]为方差，为规范后的第i个数据，z
i
为经过归一化处理的输出的第i个数据。4.根据权利要求1所述的信创环境下实现风险数据识别处理的方法，其特征在于，所述的步骤(3)具体包括以下步骤：(3.1)对深度神经网络初始化；(3.2)对权值矩阵赋予权值调整量ΔW；(3.3)输入训练样本，随机选择样本计算神经网络隐藏层和神经网络输出层的各单元的输出；(3.4)计算神经网络对不同的样本有不同的误差E
p
、各样本的gini指数E
c
、网络总误差E
RUE
；(3.5)判断网络总误差E
RUE
是否减小，如果是，则计算权值调整量并对权值进行调整；否则，继续步骤(3.2)；赋予新的权值调整量
‑
ΔW；(3.6)检查是否所有的样本都训练完成，如果训练样本数量p小...

【专利技术属性】
技术研发人员：魏明，李卜，
申请(专利权)人：普元信息技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人