【技术实现步骤摘要】
一种工业过程数据脱敏方法
[0001]本专利技术属于工业大数据安全与隐私保护
,具体说是一种工业过程数据脱敏方法。
技术介绍
[0002]工业大数据技术的广泛应用显著提高了生产效率和产品质量,加快实现了企业的智能管控、制造与转型升级。而如何在工业大数据安全与隐私保护的前提下进行分析,是制造企业亟待解决的关键问题。但现有脱敏方法通常面向商业和银行业且以对源数据的部分修改为主,所以为保证工业过程数据的隐私性和保密性,研究工业过程数据脱敏方法具有理论和实际意义。
[0003]基于统计的脱敏方法如数据掩盖,数据混淆等以对源数据的部分进行修改为主,且未考虑复杂工业过程的多模态与混合属性并存问题,导致其直接应用于实际工业过程数据脱敏的性能不佳。在数据脱敏中,混合属性局部近邻标准化可以解决多模态与混合属性并存问题。因此,基于标准化后数据建立生成对抗网络脱敏模型对提高工业过程数据脱敏的性能具有重要意义。
技术实现思路
[0004]针对现有技术的不足,本专利技术提供一种工业过程数据脱敏方法,利用混合属性局部近邻标 ...
【技术保护点】
【技术特征摘要】
1.一种工业过程数据脱敏方法,其特征在于:包括如下步骤:步骤1:利用混合属性局部近邻标准化方法对多模态工业过程混合属性数据进行标准化处理;步骤2:利用基于生成对抗网络的多模态工业过程混合属性数据脱敏方法获取工业过程静态脱敏数据和模型;步骤3:将待脱敏工业过程新数据利用混合属性局部近邻标准化处理后输入工业过程静态脱敏模型,实现工业过程数据动态脱敏。2.根据权利要求1所述的工业过程数据脱敏方法,其特征在于:所述混合属性局部近邻标准化方法包括以下过程:步骤1
‑
1:利用测地距离计算待脱敏多模态工业过程混合属性源数据X=[x1;x2;
…
;x
m
]中的数值型数据的距离矩阵其中,x
i
为X中第i个采样点,为X
n
中第i个采样点,m为X和X
n
中采样点的个数;步骤1
‑
2:对待脱敏多模态工业过程混合属性源数据X=[x1;x2;
…
;x
m
]中的分类型数据进行IDF编码,得到编码后分类型数据其中,为X
c
中第i个采样点,为中第i个采样点,m为X
c
和中采样点的个数;步骤1
‑
3:利用基于信息熵的加权距离计算编码后分类型数据的距离矩阵步骤1
‑
4:计算编码后混合属性数据的混合距离矩阵d
h
;步骤1
‑
5:对于X
h
中每一个采样点利用d
h
从X
h
中剩余采样点中选取k个的最小混合距离采样点组成局部近邻域利用的均值和标准差对进行局部近邻标准化,得到标准化后待脱敏多模态工业过程混合属性源数据其中为中第i个采样点。3.根据权利要求2所述的工业过程数据脱敏方法,其特征在于:所述利用测地距离计算X
n
的距离矩阵是通过以下公式得到:其中,为X
n
中采样点和的测地距离。4.根据权利要求2所述的工业过程数据脱敏方法,其特征在于:所述对X
c
进行IDF编码,是通过以下公式得到:
其中,为分类型数据X
c
中采样点的IDF编码后分类型采样点,为分类型数据X
c
中变量i中特征值的频率,M
c
为分类型数据X
c
中变量的个数。5.根据权利要求2所述的工业过程数据脱敏方法,其特征在于:所述利用基于信息熵的加权距离计算的距离矩阵是通过以下公式得到:是通过以下公式得到:是通过以下公式得到:是通过以下公式得到:是通过以下公式得到:其中,为中采样点和的基于信息熵的加权距离,IE
s
为中变量s的信息熵,r
s
为中变量s中分类值的数量,p(a
s,t
)为中变量s中分类值a
...
【专利技术属性】
技术研发人员:潘福成,史海波,李帅,周晓锋,
申请(专利权)人:中国科学院沈阳自动化研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。