可控式负荷和分布式电源接入网络隐私数据审查方法技术

技术编号:37229489 阅读:9 留言:0更新日期:2023-04-20 23:12
本发明专利技术公开了一种可控式负荷和分布式电源接入网络隐私数据审查方法,通过对隐私数据中相关词项出现的频率来确定敏感词,提高了敏感词划定的准确性,减少了人为确定敏感词所造成的遗漏与缺失。通过对敏感词与上下文词项间坐标向量的计算,确定隐私数据信息中心具体内容与敏感词的关联度,以此判定隐私数据信息中是否涉及敏感词与敏感信息。通过建立内容与敏感词的关联,避免了仅对敏感词进行审查中存在的问题,可以准确地识别隐私信息中经过处理的敏感词,从而更好地对隐私信息进行审查,避免审查漏洞。同时使用神经网络建立敏感词特征向量与敏感词坐标向量的关系,也提高了对于可控式负荷和分布式电源接入网络隐私数据审查的准确度和效率。准确度和效率。准确度和效率。

【技术实现步骤摘要】
可控式负荷和分布式电源接入网络隐私数据审查方法


[0001]本专利技术涉及隐私数据安全审查领域,尤其是一种应用于可控式负荷和分布式电源接入网络的隐私数据审查方法。

技术介绍

[0002]可控式负荷和分布式电源的接入是配电网发展的必然趋势。配电网自动化通过通信方式把控制命令发送给现场各类终端,与此同时,把现场设备的运行状况等数据通过通信手段传输到控制中心,从而实现能源对象的灵活调度。该过程依托于电力通信网络,大量控制命令通过电力通信网络实现对物理设备的监控,以此形成了由电力系统和信息系统组建的互依互存的“二元复合系统”,即电力信息物理融合系统。配电网中能量流和信息流的深度交融,其在为配电网带来更加灵活多样的控制手段的同时,也为配电网引入了信息安全风险。供电方对分布式能源对象的远程可控性及用户侧信息安全防护措施的缺失,使得可控式负荷和分布式电源有可能出现信息泄露或者被有害信息所攻击,进而导致系统被攻击者恶意控制,出现大规模的同投同退或频繁投退现象,从而威胁配电网的安全稳定运行。可控式负荷和分布式电源接入网络的信息安全问题与传统信息技术系统的信息安全有所不同,因为从系统特征来看,可控式负荷和分布式电源接入网络属于信息物理融合系统,对于其安全保障即包括传统的功能安全,也包括输出和引入信息的安全,而这两个层面的安全问题各有侧重却相互交融,也就是说,可控式负荷和分布式电源接入网络的信息安全在考虑传统信息领域安全性能的同时,还需要保证可控式负荷和分布式电源接入网络系统的功能性。而放松对系统内隐私数据进行审查,就会导致系统安全性下降,导致内部信息泄露或外部有害信息的进入,从而成为外部攻击者入侵控制系统的切入点。
[0003]目前对于可控式负荷和分布式电源接入网络的隐私数据审查的相关方法普遍存在漏检的问题,尤其是对于未在划定的敏感词范围内,以隐含或替代等手段出现在可控式负荷和分布式电源接入网络输出和输入端信息中的敏感词往往无法有效的进行审查,从而造成隐私数据的泄露或有害信息的输入。

技术实现思路

[0004]为了解决上述技术问题,本专利技术提供了一种可控式负荷和分布式电源接入网络隐私数据审查方法,其特殊之处在于,包含以下步骤:
[0005]S1选择可控式负荷和分布式电源接入网络运行过程中已被标记为隐私数据的信息作为训练数据;
[0006]S2删除隐私数据的信息中的停止词和无意义词,然后对隐私数据的信息进行词项分割,将得到的单个词项进行坐标化处理,同时统计出现次数最多的N个坐标,并将其对应的词项作为判定隐私数据的敏感词;
[0007]S3获取训练数据中敏感词前面两个词项和后面两个词项的坐标值,并计算其与敏感词坐标值的距离,并以获得的四个距离值作为特征值,建立敏感词特征向量,若敏感词前
面两个词项和后面两个词项中包含空白词项,则以敏感词坐标与零坐标的距离进行替代;
[0008]S4以敏感词特征向量作为输入值,以敏感词坐标向量为输出值作为输出值训练隐私数据审查神经网络;
[0009]S5利用训练完毕的隐私数据审查神经网络进行可控式负荷和分布式电源接入网络隐私数据审查;获取可控式负荷和分布式电源接入网络运行过程中产生的信息,删除信息中的停止词和无意义词,然后信息进行词项分割,将得到的单个词项进行坐标化处理;获取每一个词项与其前面两个词项和后面两个词项坐标值的距离,并以获得的四个距离值作为特征值,建立待查词项的特征向量,若待查词项中前面两个词项和后面两个词项中包含空白词项,则以待查词项坐标与零坐标的距离进行替代;以待查词项特征向量作为输入值,输入训练完毕的隐私数据审查神经网络,并获得的输出坐标向量,当输出坐标向量与敏感词坐标向量的距离小于设定值即判定为该信息为隐私信息。
[0010]进一步地,所述S3中计算敏感词前面两个词项和后面两个词项坐标值的距离,所采用的距离为闵可夫斯基距离,闵可夫斯基距离中的p值为7。
[0011]进一步地,所述S4中隐私数据审查神经网络为稀疏自编码网络,所述稀疏自编码网络包含输入层、隐藏层和输出层,所述输出层神经元个数与敏感词个数相同,所述隐藏层层数为3层,每一层自编码器的学习率为0.1,迭代次数为600次,自编码器的权重衰减参数是3
×
10
‑5,稀疏性参数取0.1,稀疏性惩罚项的权重为3,自编码器权值矩阵及偏置项随机产生。
[0012]本专利技术所提供的可控式负荷和分布式电源接入网络隐私数据审查方法,通过对隐私数据中相关词项出现的频率来确定敏感词,提高了敏感词划定的准确性,减少了人为确定敏感词所造成的遗漏与缺失。通过对敏感词与上下文词项间坐标向量的计算,确定隐私数据信息中心具体内容与敏感词的关联度,以此判定隐私数据信息中是否涉及敏感词与敏感信息。通过建立内容与敏感词的关联,避免了仅对敏感词进行审查中存在的问题,可以准确地识别隐私信息中经过处理的敏感词,从而更好地对隐私信息进行审查,避免审查漏洞。同时使用神经网络建立敏感词特征向量与敏感词坐标向量的关系,也提高了对于可控式负荷和分布式电源接入网络隐私数据审查的准确度和效率。
附图说明
[0013]构成本申请的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0014]图1为本专利技术可控式负荷和分布式电源接入网络隐私数据审查方法的流程图。
具体实施方式
[0015]为了加深对本专利技术的理解,下面将结合实施例和附图对本专利技术作进一步详述。
[0016]如图1所示,本实施例断路器状态诊断方法,包含以下步骤:
[0017]S1选择可控式负荷和分布式电源接入网络运行过程中已被标记为隐私数据的信息作为训练数据;
[0018]S2删除隐私数据的信息中的停止词和无意义词,然后对隐私数据的信息进行词项分割,将得到的单个词项进行坐标化处理,同时统计出现次数最多的N个坐标,并将其对应
的词项作为判定隐私数据的敏感词;
[0019]S3获取训练数据中敏感词前面两个词项和后面两个词项的坐标值,并计算其与敏感词坐标值的距离,并以获得的四个距离值作为特征值,建立敏感词特征向量,若敏感词前面两个词项和后面两个词项中包含空白词项,则以敏感词坐标与零坐标的距离进行替代;
[0020]S4以敏感词特征向量作为输入值,以敏感词坐标向量为输出值作为输出值训练隐私数据审查神经网络;
[0021]S5利用训练完毕的隐私数据审查神经网络进行可控式负荷和分布式电源接入网络隐私数据审查;获取可控式负荷和分布式电源接入网络运行过程中产生的信息,删除信息中的停止词和无意义词,然后信息进行词项分割,将得到的单个词项进行坐标化处理;获取每一个词项与其前面两个词项和后面两个词项坐标值的距离,并以获得的四个距离值作为特征值,建立待查词项的特征向量,若待查词项中前面两个词项和后面两个词项中包含空白词项,则以待查词项坐标与零坐标的距离进行替代;以待查词项特征向量作为输入值,输入训练完毕的隐私数据审本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种可控式负荷和分布式电源接入网络隐私数据审查方法,其特征在于,包含以下步骤:S1选择可控式负荷和分布式电源接入网络运行过程中已被标记为隐私数据的信息作为训练数据;S2删除隐私数据的信息中的停止词和无意义词,然后对隐私数据的信息进行词项分割,将得到的单个词项进行坐标化处理,同时统计出现次数最多的N个坐标,并将其对应的词项作为判定隐私数据的敏感词;S3获取训练数据中敏感词前面两个词项和后面两个词项的坐标值,并计算其与敏感词坐标值的距离,并以获得的四个距离值作为特征值,建立敏感词特征向量,若敏感词前面两个词项和后面两个词项中包含空白词项,则以敏感词坐标与零坐标的距离进行替代;S4以敏感词特征向量作为输入值,以敏感词坐标向量为输出值作为输出值训练隐私数据审查神经网络;S5利用训练完毕的隐私数据审查神经网络进行可控式负荷和分布式电源接入网络隐私数据审查;获取可控式负荷和分布式电源接入网络运行过程中产生的信息,删除信息中的停止词和无意义词,然后信息进行词项分割,将得到的单个词项进行坐标化处理;获取每一个词项与其前面两个词项和后面两个词项坐标值的距离,并以...

【专利技术属性】
技术研发人员:邱鹏李闻昊赵鑫吴凯王卓杨戈王雷郭一锋
申请(专利权)人:国网辽宁省电力有限公司盘锦供电公司国家电网有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1