智能化工业数据处理的方法及系统技术方案

技术编号:38670542 阅读:10 留言:0更新日期:2023-09-02 22:48
一种智能化工业数据处理的方法及系统,其获取工业数据的五元组信息、外部环境特征和业务行为;采用基于深度学习的人工智能技术,挖掘工业数据的五元组信息、外部环境特征和业务行为的语义理解关联性特征分布信息,以此来综合进行工业数据的保密级别分类,从而提高工业数据的安全性。数据的安全性。数据的安全性。

【技术实现步骤摘要】
智能化工业数据处理的方法及系统


[0001]本申请涉及智能化处理
,并且更具体地,涉及一种智能化工业数据处理的方法及系统。

技术介绍

[0002]随着工业互联网的普及,生产经营数据已经涵盖了企业园区、私有数据中心、公有云和行业监管机构,但缺乏有效的监管机制。现有的5GUPF(User Plane Function,用户面功能)技术虽然可以基于五元组对数据进行分流,但分类方法较少且安全性不足,需要运营商配置或搭建虚拟专网进行管理,同时仅能实现简单的分流操作,其他操作仍需串接其他网元,会降低数据的安全性和可靠性。而现有的SDN服务链主要用于云和广域网中的分布式部署,不适用于企业出口防护。
[0003]因此,期望一种优化的智能化工业数据处理方案,以提高工业数据的安全性。

技术实现思路

[0004]为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种智能化工业数据处理的方法及系统,其获取工业数据的五元组信息、外部环境特征和业务行为;采用基于深度学习的人工智能技术,挖掘工业数据的五元组信息、外部环境特征和业务行为的语义理解关联性特征分布信息,以此来综合进行工业数据的保密级别分类,从而提高工业数据的安全性。
[0005]第一方面,提供了一种智能化工业数据处理的方法,其包括:
[0006]获取工业数据的五元组信息、外部环境特征和业务行为;
[0007]将所述工业数据的五元组信息通过包含嵌入层的上下文编码器以得到五元组语义理解特征向量;
[0008]将所述外部环境特征通过所述包含嵌入层的上下文编码器以得到外部环境特征语义理解特征向量;
[0009]将所述业务行为通过所述包含嵌入层的上下文编码器以得到业务行为语义理解特征向量;
[0010]融合所述五元组语义理解特征向量、所述外部环境特征语义理解特征向量和所述业务行为语义理解特征向量以得到分类特征向量;以及
[0011]将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示工业数据的级别标签。
[0012]在上述智能化工业数据处理的方法中,将所述工业数据的五元组信息通过包含嵌入层的上下文编码器以得到五元组语义理解特征向量,包括:对所述工业数据的五元组信息进行分词处理以将所述工业数据的五元组信息转化为由多个第一词组成的第一词序列;使用所述包含嵌入层的上下文编码器的嵌入层将所述第一词序列中各个第一词映射到词向量以获得第一词向量的序列;以及,使用所述包含嵌入层的上下文编码器对所述第一词
向量的序列进行基于全局的上下文语义编码以得到所述五元组语义理解特征向量。
[0013]在上述智能化工业数据处理的方法中,使用所述包含嵌入层的上下文编码器对所述第一词向量的序列进行基于全局的上下文语义编码以得到所述五元组语义理解特征向量,包括:将所述第一词向量的序列进行一维排列以得到全局词特征向量;计算所述全局词特征向量与所述第一词向量的序列中各个第一词向量的转置向量之间的乘积以得到多个自注意力关联矩阵;分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;以及,分别以所述多个概率值中各个概率值作为权重对所述第一词向量的序列中各个第一词向量进行加权以得到所述五元组语义理解特征向量。
[0014]在上述智能化工业数据处理的方法中,将所述外部环境特征通过所述包含嵌入层的上下文编码器以得到外部环境特征语义理解特征向量,包括:对所述外部环境特征进行分词处理以将所述外部环境特征转化为由多个第二词组成的第二词序列;使用所述包含嵌入层的上下文编码器的嵌入层将所述第二词序列中各个第二词映射到词向量以获得第二词向量的序列;以及,使用所述包含嵌入层的上下文编码器对所述第二词向量的序列进行基于全局的上下文语义编码以得到所述外部环境特征语义理解特征向量。
[0015]在上述智能化工业数据处理的方法中,将所述业务行为通过所述包含嵌入层的上下文编码器以得到业务行为语义理解特征向量,包括:对所述业务行为进行分词处理以将所述业务行为转化为由多个第三词组成的第三词序列;使用所述包含嵌入层的上下文编码器的嵌入层将所述第三词序列中各个第三词映射到词向量以获得第三词向量的序列;以及,使用所述包含嵌入层的上下文编码器对所述第三词向量的序列进行基于全局的上下文语义编码以得到所述业务行为语义理解特征向量。
[0016]在上述智能化工业数据处理的方法中,融合所述五元组语义理解特征向量、所述外部环境特征语义理解特征向量和所述业务行为语义理解特征向量以得到分类特征向量,包括:以如下融合公式融合所述五元组语义理解特征向量、所述外部环境特征语义理解特征向量和所述业务行为语义理解特征向量以得到分类特征向量;其中,所述融合公式为:
[0017]V
s
=λV
a
+βV
b
+αV
c
[0018]其中,V
s
表示所述分类特征向量,V
a
表示所述五元组语义理解特征向量,V
b
表示所述外部环境特征语义理解特征向量,V
c
表示所述业务行为语义理解特征向量,“+”表示所述五元组语义理解特征向量、所述外部环境特征语义理解特征向量和所述业务行为语义理解特征向量相对应位置处的元素相加,λ、β和α表示用于控制所述五元组语义理解特征向量、所述外部环境特征语义理解特征向量和所述业务行为语义理解特征向量之间的平衡的加权参数。
[0019]在上述智能化工业数据处理的方法中,还包括对所述包含嵌入层的上下文编码器和所述分类器进行训练;其中,对所述包含嵌入层的上下文编码器和所述分类器进行训练,包括:获取训练数据,所述训练数据包括工业数据的训练五元组信息、训练外部环境特征和训练业务行为,以及,所述工业数据的级别标签的真实值;将所述工业数据的训练五元组信息通过所述包含嵌入层的上下文编码器以得到训练五元组语义理解特征向量;将所述训练外部环境特征通过所述包含嵌入层的上下文编码器以得到训练外部环境特征语义理解特
征向量;将所述训练业务行为通过所述包含嵌入层的上下文编码器以得到训练业务行为语义理解特征向量;融合所述训练五元组语义理解特征向量、所述训练外部环境特征语义理解特征向量和所述训练业务行为语义理解特征向量以得到训练分类特征向量;对所述训练分类特征向量进行特征分布优化以得到优化训练分类特征向量;将所述优化训练分类特征向量通过所述分类器以得到分类损失函数值;以及,基于所述分类损失函数值并通过梯度下降的反向传播来对所述包含嵌入层的上下文编码器和所述分类器进行训练。
[0020]在上述智能化工业数据处理的方法中,对所述训练分类特征向量进行特征分布优化以得到优化训练分类特征向量,包括:以如下优化公式对所述训练分类特征向量进行耿贝尔正态周期性重参数化以得到所述优化训练分类特征向量本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能化工业数据处理的方法,其特征在于,包括:获取工业数据的五元组信息、外部环境特征和业务行为;将所述工业数据的五元组信息通过包含嵌入层的上下文编码器以得到五元组语义理解特征向量;将所述外部环境特征通过所述包含嵌入层的上下文编码器以得到外部环境特征语义理解特征向量;将所述业务行为通过所述包含嵌入层的上下文编码器以得到业务行为语义理解特征向量;融合所述五元组语义理解特征向量、所述外部环境特征语义理解特征向量和所述业务行为语义理解特征向量以得到分类特征向量;以及将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示工业数据的级别标签。2.根据权利要求1所述的智能化工业数据处理的方法,其特征在于,将所述工业数据的五元组信息通过包含嵌入层的上下文编码器以得到五元组语义理解特征向量,包括:对所述工业数据的五元组信息进行分词处理以将所述工业数据的五元组信息转化为由多个第一词组成的第一词序列;使用所述包含嵌入层的上下文编码器的嵌入层将所述第一词序列中各个第一词映射到词向量以获得第一词向量的序列;以及使用所述包含嵌入层的上下文编码器对所述第一词向量的序列进行基于全局的上下文语义编码以得到所述五元组语义理解特征向量。3.根据权利要求2所述的智能化工业数据处理的方法,其特征在于,使用所述包含嵌入层的上下文编码器对所述第一词向量的序列进行基于全局的上下文语义编码以得到所述五元组语义理解特征向量,包括:将所述第一词向量的序列进行一维排列以得到全局词特征向量;计算所述全局词特征向量与所述第一词向量的序列中各个第一词向量的转置向量之间的乘积以得到多个自注意力关联矩阵;分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;以及分别以所述多个概率值中各个概率值作为权重对所述第一词向量的序列中各个第一词向量进行加权以得到所述五元组语义理解特征向量。4.根据权利要求3所述的智能化工业数据处理的方法,其特征在于,将所述外部环境特征通过所述包含嵌入层的上下文编码器以得到外部环境特征语义理解特征向量,包括:对所述外部环境特征进行分词处理以将所述外部环境特征转化为由多个第二词组成的第二词序列;使用所述包含嵌入层的上下文编码器的嵌入层将所述第二词序列中各个第二词映射到词向量以获得第二词向量的序列;以及使用所述包含嵌入层的上下文编码器对所述第二词向量的序列进行基于全局的上下
文语义编码以得到所述外部环境特征语义理解特征向量。5.根据权利要求4所述的智能化工业数据处理的方法,其特征在于,将所述业务行为通过所述包含嵌入层的上下文编码器以得到业务行为语义理解特征向量,包括:对所述业务行为进行分词处理以将所述业务行为转化为由多个第三词组成的第三词序列;使用所述包含嵌入层的上下文编码器的嵌入层将所述第三词序列中各个第三词映射到词向量以获得第三词向量的序列;以及使用所述包含嵌入层的上下文编码器对所述第三词向量的序列进行基于全局的上下文语义编码以得到所述业务行为语义理解特征向量。6.根据权利要求5所述的智能化工业数据处理的方法,其特征在于,融合所述五元组语义理解特征向量、所述外部环境特征语义理解特征向量和所述业务行为语义理解特征向量以得到分类特征向量,包括:以如下融合公式融合所述五元组语义理解特征向量、所述外部环境特征语义理解特征向量和所述业务行为语义理解特征向量以得到分类特征向量;其中,所述融合公式为:V
s
=λV
a
+βV
b
+αV
c
其中,V
s
表示所述分类特征向量,V
a
表示所述五元组语义理解特征向量,V
...

【专利技术属性】
技术研发人员:刘红军李冠军张雅暄
申请(专利权)人:河南同力智慧科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1