System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于数据平台的隐私数据全生命周期保护方法及系统技术方案_技高网

一种基于数据平台的隐私数据全生命周期保护方法及系统技术方案

技术编号:41219873 阅读:3 留言:0更新日期:2024-05-09 23:40
本发明专利技术公开了一种基于数据平台的隐私数据全生命周期保护方法及系统,涉及数据加密技术领域,包括:收集隐私数据,对数据进行预处理,将所述隐私数据分类为已标注的数据和未标注的数据;对未标注的数据,使用聚类算法进行初始分类识别数据模式,对已标注的数据及通过聚类算法初步分类的数据进行敏感性评估分类;构建风险评估模型,实施用户身份验证和权限管理措施,选择加密技术和安全措施;使用决策支持系统优化数据的存储位置和方式,定义不同角色的用户能够访问的数据类型,实施基于角色的访问控制策略。本发明专利技术提供的基于数据平台的隐私数据全生命周期保护方法提高了数据保护的精确度和效率,增强了数据安全性,减少了存储成本。

【技术实现步骤摘要】

本专利技术涉及数据加密,具体为一种基于数据平台的隐私数据全生命周期保护方法及系统


技术介绍

1、随着数据技术的快速发展,尤其是在云计算和大数据时代,数据安全和隐私保护成了一个重要议题。传统的数据保护方法通常侧重于静态的安全措施,如固定的数据加密和访问控制策略,这些方法在面对复杂和动态的数据环境时常常显得不够灵活和高效。

2、在现有技术中,数据分类和敏感性评估通常需要大量人工介入,效率较低,且难以适应数据量的快速增长和多样化的数据类型。同时,访问控制和身份验证机制往往缺乏针对用户行为和风险变化的动态调整能力。此外,数据存储和备份策略在很多情况下没有充分考虑数据敏感性的差异,导致安全风险和存储成本的不必要增加。在数据共享和传输方面,现有的安全措施往往无法有效防范复杂的网络攻击和数据泄露风险。

3、因此亟需一种更高效、灵活且安全的隐私数据全生命周期保护方法和系统,保护隐私数据,应对不断变化的安全威胁,提高数据的安全性和存储效率,应对日益增长和多样化的数据安全需求时。这些不足需要通过更先进、灵活和智能的技术方案来克服,以实现更高效和安全的数据保护。


技术实现思路

1、鉴于上述存在的问题,提出了本专利技术。

2、因此,本专利技术解决的技术问题是:现有的数据管理方法存在数据保护不精确、安全性不足,以及存储效率低下的优化问题。

3、为解决上述技术问题,本专利技术提供如下技术方案:一种基于数据平台的隐私数据全生命周期保护方法,包括:

4、收集隐私数据,对数据进行预处理,将所述隐私数据分类为已标注的数据和未标注的数据;

5、对未标注的数据,使用聚类算法进行初始分类识别数据模式,对已标注的数据及通过聚类算法初步分类的数据进行敏感性评估分类;

6、构建风险评估模型,实施用户身份验证和权限管理措施,选择加密技术和安全措施;

7、使用决策支持系统优化数据的存储位置和方式,定义不同角色的用户能够访问的数据类型,实施基于角色的访问控制策略。

8、作为本专利技术所述的基于数据平台的隐私数据全生命周期保护方法的一种优选方案,其中:所述收集隐私数据包括用户操作日志、应用数据、系统监控数据;

9、所述预处理包括数据清洗、数据转换以及数据标准化;

10、所述将所述隐私数据分类包括使用nlp自然语言处理技术对文本数据进行特征提取,提取关键词、主题和情感倾向,对于非文本数据,应用时序分析和行为模式识别技术提取关键特征,使用决策树模型进行初步分类,通过所述决策树模型处理云环境中的隐私数据,根据文件类型、数据来源、元数据信息以及从特征提取中得到的特征进行分类,将数据分类为已标注的数据、未标注的数据和待分析的数据,对于待分析的数据,应用gnn图神经网络模型分析,结合决策树模型的初步分类结果和gnn图神经网络模型的分析结果,基于数据的内容和特征,考虑数据的上下文和关联性,形成二次分类结果,将所述待分析的数据分类为已标注的数据、未标注的数据以及需复核数据,对所述需复核数据进行人工审核,将人工审核的结果反馈到系统中。

11、作为本专利技术所述的基于数据平台的隐私数据全生命周期保护方法的一种优选方案,其中:所述对于未标注的数据,使用聚类算法进行初始分类和模式识别包括使用k-mean聚类算法,对未标注的数据进行初始分类,识别数据中的潜在模式和群组,在聚类过程中,关注数据的文本内容、用户行为模式和上下文信息,识别与已标注数据相似的特性,根据聚类结果,为未标注的数据创建初步的标注信息,对于聚类结果明确的数据,赋予相应的标注;对于聚类结果不明确或可能存在歧义的情况,使用半监督学习方法提高标注的准确性,若未标注的数据通过聚类和转化标注处理流程,与已标注数据进入监督学习算法的处理流程。

12、作为本专利技术所述的基于数据平台的隐私数据全生命周期保护方法的一种优选方案,其中:所述进行敏感性评估分类包括基于所述隐私数据,构建数据集d,对数据集d进行特征提取,使用自然语言处理技术提取文本数据的语义特征(φnlp(d)),利用时序分析方法提取用户行为的时间特征(φtime(d)),应用图神经网络提取数据间的关系和结构特征(φgnn(d));

13、通过信息过滤函数ψ(f),对特征向量f=φ(d),进行降维处理,去除冗余信息并突出关键特征,自编码器通过编码器-解码器结构学习数据的低维表示,同时保留原始数据的关键信息,得到特征集f′,应用基于深度学习的敏感性评估函数s(f′)对过滤后的特征向量f′=ψ(f)进行分析,输出敏感性评分y;

14、当y<低于第一敏感性阈值时,判断为敏感性等级低级,当第一敏感性阈值≤y≤第二敏感性阈值时,判断为敏感性等级中级,当y>第二敏感性阈值时,判断为敏感性等级高级。

15、作为本专利技术所述的基于数据平台的隐私数据全生命周期保护方法的一种优选方案,其中:所述风险评估模型表示为,

16、

17、其中,r表示风险评分,a(t)表示在时间t的用户行为数据,g(t,a(t))表示时间依赖的行为分析函数,bi表示第i次访问的异常行为特征,h(bi)表示异常行为特征分析函数,c表示用户访问的数据敏感性等级,α,β,γ表示权重系数,t表示评估时间窗口的长度,n表示在评估时间窗口内的异常访问次数,e表示自然对数的底数;

18、当r<0.3时,判断为低风险等级用户,当0.3≤r≤0.7时,判断为中风险等级用户,当r>0.7时,判断为高风险等级用户。

19、作为本专利技术所述的基于数据平台的隐私数据全生命周期保护方法的一种优选方案,其中:所述实施用户身份验证和权限管理措施包括若判断为低风险等级用户,实施基本的身份验证,并允许访问常规数据,对数据的使用进行智能监控,实时调整访问权限,若判断为中等风险等级用户,结合用户行为模式和数据类型,动态调整身份验证强度和访问权限,当用户试图访问非常规的数据时,限制访问并进行身份验证,若判断为高风险等级用户,立即实施身份验证,限制对敏感数据的访问,采用行为分析技术预测潜在的安全威胁,主动采取预防措施;

20、根据用户的风险等级和访问行为,动态优化数据的存储位置和访问策略,若数据被中等和高风险等级用户访问次数超过预设次数阈值,自动调整数据的存储位置,优化访问路径提高访问效率,进行数据备份和恢复计划,若高风险等级用户请求共享的数据,执行深度脱敏处理并执行同态加密技术,若中等风险等级用户请求共享数据,将根据数据的特征和用户的访问记录,进行脱敏和加密处理,若低风险等级用户请求共享的数据,允许数据共享,采用标准加密和保存访问日志记录。

21、作为本专利技术所述的基于数据平台的隐私数据全生命周期保护方法的一种优选方案,其中:所述实施基于角色的访问控制策略包括对低风险等级用户,允许对常规数据进行访问,将数据存储在易于访问但安全的位置,获得访问非敏感或公开数据的权限,基于用户的角色和职责,自动分配访问权限,并监控其访问行为以确保合规性,实本文档来自技高网...

【技术保护点】

1.一种基于数据平台的隐私数据全生命周期保护方法,其特征在于,包括:

2.如权利要求1所述的基于数据平台的隐私数据全生命周期保护方法,其特征在于:所述收集隐私数据包括用户操作日志、应用数据、系统监控数据;

3.如权利要求2所述的基于数据平台的隐私数据全生命周期保护方法,其特征在于:所述对于未标注的数据,使用聚类算法进行初始分类和模式识别包括使用K-mean聚类算法,对未标注的数据进行初始分类,识别数据中的潜在模式和群组,在聚类过程中,关注数据的文本内容、用户行为模式和上下文信息,识别与已标注数据相似的特性,根据聚类结果,为未标注的数据创建初步的标注信息,对于聚类结果明确的数据,赋予相应的标注;对于聚类结果不明确或可能存在歧义的情况,使用半监督学习方法提高标注的准确性,若未标注的数据通过聚类和转化标注处理流程,与已标注数据进入监督学习算法的处理流程。

4.如权利要求3所述的基于数据平台的隐私数据全生命周期保护方法,其特征在于:所述进行敏感性评估分类包括基于所述隐私数据,构建数据集D,对数据集D进行特征提取,使用自然语言处理技术提取文本数据的语义特征(φNLP(D)),利用时序分析方法提取用户行为的时间特征(φTime(D)),应用图神经网络提取数据间的关系和结构特征(φGNN(D));

5.如权利要求4所述的基于数据平台的隐私数据全生命周期保护方法,其特征在于:所述风险评估模型表示为,

6.如权利要求5所述的基于数据平台的隐私数据全生命周期保护方法,其特征在于:所述实施用户身份验证和权限管理措施包括若判断为低风险等级用户,实施基本的身份验证,并允许访问常规数据,对数据的使用进行智能监控,实时调整访问权限,若判断为中等风险等级用户,结合用户行为模式和数据类型,动态调整身份验证强度和访问权限,当用户试图访问非常规的数据时,限制访问并进行身份验证,若判断为高风险等级用户,立即实施身份验证,限制对敏感数据的访问,采用行为分析技术预测潜在的安全威胁,主动采取预防措施;

7.如权利要求6所述的基于数据平台的隐私数据全生命周期保护方法,其特征在于:所述实施基于角色的访问控制策略包括对低风险等级用户,允许对常规数据进行访问,将数据存储在易于访问但安全的位置,获得访问非敏感或公开数据的权限,基于用户的角色和职责,自动分配访问权限,并监控其访问行为以确保合规性,实施标准的备份策略;

8.一种采用如权利要求1~7任一所述的基于数据平台的隐私数据全生命周期保护方法的系统,其特征在于,包括:

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的基于数据平台的隐私数据全生命周期保护方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的基于数据平台的隐私数据全生命周期保护方法的步骤。

...

【技术特征摘要】

1.一种基于数据平台的隐私数据全生命周期保护方法,其特征在于,包括:

2.如权利要求1所述的基于数据平台的隐私数据全生命周期保护方法,其特征在于:所述收集隐私数据包括用户操作日志、应用数据、系统监控数据;

3.如权利要求2所述的基于数据平台的隐私数据全生命周期保护方法,其特征在于:所述对于未标注的数据,使用聚类算法进行初始分类和模式识别包括使用k-mean聚类算法,对未标注的数据进行初始分类,识别数据中的潜在模式和群组,在聚类过程中,关注数据的文本内容、用户行为模式和上下文信息,识别与已标注数据相似的特性,根据聚类结果,为未标注的数据创建初步的标注信息,对于聚类结果明确的数据,赋予相应的标注;对于聚类结果不明确或可能存在歧义的情况,使用半监督学习方法提高标注的准确性,若未标注的数据通过聚类和转化标注处理流程,与已标注数据进入监督学习算法的处理流程。

4.如权利要求3所述的基于数据平台的隐私数据全生命周期保护方法,其特征在于:所述进行敏感性评估分类包括基于所述隐私数据,构建数据集d,对数据集d进行特征提取,使用自然语言处理技术提取文本数据的语义特征(φnlp(d)),利用时序分析方法提取用户行为的时间特征(φtime(d)),应用图神经网络提取数据间的关系和结构特征(φgnn(d));

5.如权利要求4所述的基于数据平台的隐私数据全生命周期保护方法,其特征在于:所述风险评估模型表示为,

6.如权利要求5所述的基...

【专利技术属性】
技术研发人员:梁琦刘军罗梦灵周万青王似巍杨坤燚田旺
申请(专利权)人:云上贵州大数据产业发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1