脱敏数据确定方法、装置、可读介质及电子设备制造方法及图纸

技术编号:24011012 阅读:20 留言:0更新日期:2020-05-02 01:44
本发明专利技术公开了一种脱敏数据确定方法、装置、计算机可读存储介质及电子设备,方法包括:获取能源数据中每个字符分别对应的特征向量;根据所述字符对应的特征向量,获取所述字符对应在每个预设标签的分数;根据每个所述字符分别对应在每个预设标签的分数,获取所述能源数据中的敏感数据;根据所述敏感数据,获取所述能源数据对应的脱敏数据。通过本发明专利技术的技术方案,可较为准确的获取能源数据中的敏感数据,进而提高脱敏数据的安全性。

Desensitization data determination method, device, readable medium and electronic equipment

【技术实现步骤摘要】
脱敏数据确定方法、装置、可读介质及电子设备
本专利技术涉及能源
,尤其涉及脱敏数据确定方法、装置、可读存储介质及电子设备。
技术介绍
随着计算机的快速发展,采集、存储、共享的能源数据的数量越来越大,为了降低敏感数据泄漏的风险,保证数据安全,避免不必要的纠纷,数据脱敏是非常必要的。目前,主要通过规则和正则匹配的方式对能源数据进行敏感数据识别,然后用预设词替换识别出的敏感数据,从而得到脱敏数据。但是,当数据发生较大变化时,规则和正则匹配的方式可能无法较为准确的获取能源数据中的敏感数据,导致上述方法识别出的敏感数据的参考价值相对较低,从而降低脱敏数据的安全性。
技术实现思路
本专利技术提供了一种脱敏数据确定方法、装置、计算机可读存储介质及电子设备,可较为准确的获取能源数据中的敏感数据,进而提高脱敏数据的安全性。第一方面,本专利技术提供了一种脱敏数据确定方法,包括:获取能源数据中每个字符分别对应的特征向量;根据所述字符对应的特征向量,获取所述字符对应在每个预设标签的分数;根据每个本文档来自技高网...

【技术保护点】
1.一种脱敏数据确定方法,其特征在于,包括:/n获取能源数据中每个字符对应的特征向量;/n根据所述字符对应的特征向量,获取所述字符对应在每个预设标签的分数;/n根据每个所述字符分别对应在每个预设标签的分数,获取所述能源数据中的敏感数据;/n根据所述敏感数据,获取所述能源数据对应的脱敏数据。/n

【技术特征摘要】
1.一种脱敏数据确定方法,其特征在于,包括:
获取能源数据中每个字符对应的特征向量;
根据所述字符对应的特征向量,获取所述字符对应在每个预设标签的分数;
根据每个所述字符分别对应在每个预设标签的分数,获取所述能源数据中的敏感数据;
根据所述敏感数据,获取所述能源数据对应的脱敏数据。


2.根据权利要求1所述的方法,其特征在于,所述获取能源数据中每个字符对应的特征向量,包括:
获取所述能源数据中每个字符对应的语义向量;
将每个所述字符分别对应的语义向量代入语言模型中,获取每个所述字符分别对应的特征向量,其中,所述语言模型包括至少一层编码器。


3.根据权利要求2所述的方法,其特征在于,所述获取所述能源数据中每个字符对应的语义向量,包括:
获取所述能源数据中每个字符分别对应的词向量和位置信息向量;
针对每个所述字符,对所述字符对应的词向量和位置信息向量进行拼接,得到所述字符对应的语义向量。


4.根据权利要求3所述的方法,其特征在于,所述编码器包括基于多头自注意力机制的transformer神经网络或循环神经网络。


5.根据权利要求1所述的方法,其特征在于,所述根据所述字符对应的特征向量,获取所述字符对应在每个预设标签的分数,包括:
将每个所述字符分别对应的特征向量代入双向循环神经网络模型中,获取每个所述字符分别对应在...

【专利技术属性】
技术研发人员:王瑞杨
申请(专利权)人:新奥数能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1