System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种多维数据智能标识方法技术_技高网

一种多维数据智能标识方法技术

技术编号:41314960 阅读:4 留言:0更新日期:2024-05-13 14:56
本发明专利技术提供了一种多维数据智能标识方法,包括:对扫描到的非结构化数据和结构化数据分别执行对应标识流程,完成非结构化数据安全标识和结构化数据安全标识;在数据发生变化时,若数据内容发生变化时,表示扫描到新数据,重新根据数据对应的标识流程生成数据安全标识;若数据内容未发生变化,仅变化其他属性,则更新对应数据安全标识属性。本发明专利技术能够实现针对不同数据的多维安全标识,融入了人工智能与内容检索规则相结合的分类分级判定方法,增加了系统的灵活性与智能抉择能力,适应更加丰富的业务场景;提供并行处理的方式,大量减少重复计算、串行计算的情况,有效提升标识效率,降低性能损耗。

【技术实现步骤摘要】

本专利技术涉及数据安全领域,特别涉及一种多维数据智能标识方法


技术介绍

1、数字时代,数据成为国家基础性战略资源和重要生产要素,《数据安全法》强调了数据安全是数字中国重要战略举措的根本保障,并提出国家将对数据实行分级分类保护。数据标识的本质是通过对数据的特征进行全方面的分析与提取,进而识别和定义数据,并为数据打上标识,方便数据资产管理,实施分级分类保护。数据标识多是离散的分布于数据的各种属性中,常见的数据标识方法单一、流程固定、效率低、性能开销较大,难以满足业务灵活多样且海量异构数据频繁更新的场景下,各领域、行业、机构主体高效完成数据标识,管控数据安全的核心诉求。


技术实现思路

1、针对现有技术中存在的问题,提供了一种多维数据智能标识方法,基于多线并行的方式,结合ai人工智能算法,实现结构化数据与非结构化数据的多维属性智能标识提取与更新。

2、本专利技术采用的技术方案如下:一种多维数据智能标识方法,包括:

3、对扫描到的非结构化数据和结构化数据分别执行对应标识流程,建立非结构化数据安全标识和结构化数据安全标识;

4、在数据发生变化时,若数据内容发生变化时,表示扫描到新数据,重新根据数据对应的标识流程生成数据安全标识;若数据内容未发生变化,仅变化其他属性,则更新对应数据安全标识属性。

5、进一步的,对于非结构化数据,安全标识流程如下:

6、步骤a1、扫描文件服务器,获取非结构化数据;

7、步骤a2、并行完成数据清洗、文件指纹计算、元数据提取;

8、步骤a3、对数据清洗后的数据内容进行模糊指纹计算和分类属性提取;

9、步骤a4、根据提取的分类属性进行分级判定,确定数据安全等级;

10、步骤a5、将文件指纹、元数据、模糊指纹、分类属性及安全等级进行组装,输出针对非结构化数据的安全标识。

11、进一步的,所述分类属性提取过程包括:

12、步骤a3.1、对数据清洗后的数据进行特征提取;

13、步骤a3.2、基于提取的数据特征,通过人工智能机器学习算法预先生成的ai模型,自动判别数据类型,完成分类判定;

14、步骤a3.3、通过自定义的分类规则匹配逻辑,对数据内容进行检索,完成分类判定;

15、步骤a3.4、基于ai模型的分类结果与规则匹配的分类结果,联合确定分类属性。

16、进一步的,所述步骤a4中,确定数据安全等级的方法包括:

17、步骤a4.1、根据数据分类属性与预先定义的安全等级映射关系,查询该数据的安全等级;

18、步骤a4.2、通过自定义的分级规则表,对数据内容进行检索,完成基于数据内容检索的分级判定;

19、步骤a4.3、综合分类属性对应安全等级和基于数据内容检索的分级判定结果,取最高值作为该数据的最终安全等级。

20、进一步的,对于结构化数据,安全标识流程如下:

21、步骤b1、扫描数据库,获取结构化数据;

22、步骤b2、并行完成数据抽样、数据列指纹计算、数据列模糊指纹计算以及元数据提取;

23、步骤b3、对数据抽样的数据进行分类属性提取;

24、步骤b4、根据分类属性进行分级判定,确定数据安全等级;

25、步骤b5、将数据列指纹、数据列模糊指纹、元数据、分类属性以及安全等级进行组装,输出针对结构化数据的安全标识。

26、进一步的,所述数据抽样包括:随机抽样结构化数据中500行作为分类属性提取过程所使用的数据,当且仅当数据表结构发生变化时,需要重新抽样。

27、进一步的,所述步骤b3的子步骤包括:

28、步骤b3.1、对数据抽样后的数据进行清洗,再提取数据特征;

29、步骤b3.2、基于提取的数据特征,通过人工智能机器学习算法预先生成的ai模型,自动判别数据类型,完成分类判定;

30、步骤b3.3、通过自定义的分类规则匹配逻辑,对数据内容进行检索,完成分类判定;

31、步骤b3.4、基于ai模型的分类结果与规则匹配的分类结果,联合确定分类属性。

32、进一步的,所述步骤b4中,确定数据安全等级的方法包括:

33、步骤b4.1、根据数据分类属性与预先定义的安全等级映射关系,查询该数据的安全等级;

34、步骤b4.2、通过自定义的分级规则表,对数据内容进行检索,完成基于数据内容检索的分级判定;

35、步骤b4.3、综合分类属性对应安全等级和基于数据内容检索的分级判定结果,取最高值作为该数据的最终安全等级。

36、进一步的,对于非结构化数据,标识更新过程如下:

37、步骤c1、扫描文件服务器,基于文件本体计算数据指纹;

38、步骤c2、与历史扫描结果做比对,判断该数据指纹是否已经存在历史记录中;

39、步骤c3、若该文件指纹已存在历史记录中,则判断分类规则和/或分级规则是否发生变化,若分类分级规则未发生变化,则不做更新,流程结束;若分类规则和/或分级规则发生变化,则重新计算分类分级属性,并记录数据扫描历史,用于后续查询变化记录;

40、步骤c4、若文件指纹并不存在历史记录中,则认为本次扫描的数据为一条新的数据,执行非结构化数据的标识流程,生成新的数据安全标识。

41、进一步的,对于结构化数据,标识更新过程如下:

42、步骤d1、扫描数据库,识别数据资产,基于数据字段的元数据信息计算数据指纹;

43、步骤d2、与历史扫描结果做比对,判断该数据指纹是否已经存在历史记录中;

44、步骤d3、若该数据指纹已存在历史记录中,则判断该数据字段存在的库表结构是否发生变化,若没发生变化,再判断分类规则和/或分级规则是否发生变化,若未发生变化,则不做更新,流程结束;若分类规则和/或分级规则发生变化,则直接提交原先抽样的样本数据再次进行分类分级判定,判定结束后,更新变化后的数据标识;

45、步骤d4、若该字段存在的库表结构已发生变化,则重新进行数据抽样,并将抽样后的数据样本直接按当前规则进行分类分级判定,判定结束后,更新变化后的数据标识;

46、步骤d5、若该文件指纹并不存在历史记录中,则认为本次扫描的数据为一条新的数据,执行结构化数据的标识流程,生成新的数据安全标识。

47、与现有技术相比,采用上述技术方案的有益效果为:

48、(1)针对非结构化数据和结构化数据,分别提供了不同的流程与方法,有针对性的实现针对不同数据的多维安全标识。

49、(2)流程中融入了人工智能与内容检索规则相结合的分类分级判定方法,增加了系统的灵活性与智能抉择能力,适应更加丰富的业务场景。

50、(3)提供并行处理的方式,进行包括数据指纹、模糊指纹、元数据、分类分级等在内的多维属性的提本文档来自技高网...

【技术保护点】

1.一种多维数据智能标识方法,其特征在于,包括:

2.根据权利要求1所述的多维数据智能标识方法,其特征在于,对于非结构化数据,标识流程如下:

3.根据权利要求2所述的多维数据智能标识方法,其特征在于,所述分类属性提取过程包括:

4.根据权利要求2或3所述的多维数据智能标识方法,其特征在于,所述步骤A4中,确定数据安全等级的方法包括:

5.根据权利要求1所述的多维数据智能标识方法,其特征在于,对于结构化数据,安全标识流程如下:

6.根据权利要求5所述的多维数据智能标识方法,其特征在于,所述数据抽样包括:随机抽样结构化数据中500行作为分类属性提取过程所使用的数据,当且仅当数据表结构发生变化时,需要重新抽样。

7.根据权利要求5或6所述的多维数据智能标识方法,其特征在于,所述步骤B3的子步骤包括:

8.根据权利要求7所述的多维数据智能标识方法,其特征在于,所述步骤B4中,确定数据安全等级的方法包括:

9.根据权利要求2所述的多维数据智能标识方法,其特征在于,对于非结构化数据,安全标识更新过程如下:

10.根据权利要求5所述的多维数据智能标识方法,其特征在于,对于结构化数据,标识更新过程如下:

...

【技术特征摘要】

1.一种多维数据智能标识方法,其特征在于,包括:

2.根据权利要求1所述的多维数据智能标识方法,其特征在于,对于非结构化数据,标识流程如下:

3.根据权利要求2所述的多维数据智能标识方法,其特征在于,所述分类属性提取过程包括:

4.根据权利要求2或3所述的多维数据智能标识方法,其特征在于,所述步骤a4中,确定数据安全等级的方法包括:

5.根据权利要求1所述的多维数据智能标识方法,其特征在于,对于结构化数据,安全标识流程如下:

6.根据权利要求5所述的多维数据智能标识方法,其特征在于,所述数据...

【专利技术属性】
技术研发人员:雷雳薛锋马晓旭白健徐允彪
申请(专利权)人:中国电子科技集团公司第三十研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1