基于分布式数据沙盒的个人信息合规的方法和装置制造方法及图纸

技术编号：29133573 阅读：17 留言：0更新日期：2021-07-02 22:29

本申请公开了一种基于分布式数据沙盒的个人信息合规的方法和装置。管理员通过人工智能对大数据进行一级分类，从大数据中获得归属于个人信息类的数据并建立个人信息类的数据特征。通过人工智能分析和分布式数据沙盒对个人信息类的数据进行个人信息类的详细数据特征分析，快速从大规模的多类型的大数据中获得详细个人信息类的数据特征。进一步地，通过分布式数据沙盒和管理员所掌握的详细个人信息的数据特征，可进一步完成大数据的个人信息的合规，包括个人信息的分布合规、个人信息的共享计算合规。本申请解决了大数据相关技术中个人信息合规所要求的分布、共享计算的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于分布式数据沙盒的个人信息合规的方法和装置
本申请涉及信息安全领域，具体而言，涉及一种基于分布式数据沙盒的个人信息合规的方法和装置。
技术介绍
在大数据中，数据具有规模大、多样性、响应速度要求高以及数据价值量高的特征。在当今大数据广泛应用、个人信息合规成为各方关注的重点的背景下，如何让个人信息在发挥数据价值的前提下保证合规是非常关键的。传统安全手段重在边界防护或者静态存储防护，没有对大数据特性下的个人信息合规，企业管理者要获得大数据的价值的同时，保障个人信息合规，并没有有效的手段。针对上述的问题，目前尚未提出有效的解决思路。
技术实现思路
本申请实施例提供了一种基于分布式数据沙盒的个人信息合规的方法和装置，以至少解决相关技术中不能对大数据中的个人信息合规的技术问题。根据本申请实施例的一个方面，提供了一种基于分布式数据沙盒的个人信息合规的方法，包括：1)通过人工智能技术对大数据进行一级分类，一级分类是从包含多种分类的大数据中，提取归属于个人信息类的数据（即在一堆各种各样的数据中，有的数据属于个人信息，有的数据属于企业商业信息等。一级分类即从概念上，做了一个分类，个人信息类，就是这里说的个人信息类的数据），并对个人信息类的数据建立个人信息类的数据特征。其中，个人信息类的数据特征，不包含个人信息的原始数据或属性，个人信息类的数据特征只有分布式数据沙盒用于个人信息的合规分析，除分布式数据沙盒以外的任意组件均无法通过个人信息类的数据特征推演出个人信息类的原始数据或属性；r>2)通过分布式数据沙盒，以个人信息类的数据为依据，对个人信息类的数据进行详细个人信息类的数据特征分析，将大数据中归属于个人信息类的数据，进行分布式的快速的数据特征分析，获得所有的详细个人信息数据特征（即详细个人信息类的数据特征）。其中，分布式数据沙盒所获得的所有的详细个人信息数据特征，是通过对详细个人信息原始数据的人工智能分析所提取的数据特征，不包含个人信息的原始数据或属性。详细个人信息数据特征，只有分布式数据沙盒可用于进一步的个人信息合规处理，除分布式数据沙盒外的任意组件均无法通过信息个人信息类的数据特征推演出个人信息类的原始数据或属性；3)根据个人信息类的数据特征与详细个人信息类的数据特征，获得大数据中个人信息的合规分布基线和个人信息的实际分布，个人信息的实际分布包括个人信息类的数据的详情、合规存储详情、违规存储详情；4)通过分布式数据沙盒，获得大数据中的个人信息共享计算合规。计算用户具有使用大数据中的个人信息进行计算的权限，计算过程在数据沙盒（即分布式数据沙盒）中完成，计算完成后，所获得的计算结果需要基于个人信息的合规分布基线对计算结果进行合规检查。检查结果未涉及个人信息的个体特征，允许计算用户从数据沙盒导出计算结果，反之，计算用户应将计算结果交付到分布式数据沙盒做进一步的人工智能处理，消除个人信息的个体特征后，从分布式数据沙盒中导出新的计算结果；5)多类型的大数据，包括结构化数据、半结构化数据和非结构化数据；大数据的形态可以是数据流、数据片段和各种文档；6)详细个人信息类的数据特征，包括以下属性的个人信息数据特征：标识个人基本属性的数据特征、标识个人家庭属性的数据特征、标识个人生物特性的数据特征、标识个人网络属性的数据特征、标识个人财产属性的数据特征以及标识个人社会关系属性的数据特征。可选地，个人信息类的数据特征和详细个人信息类的数据特征，是由人工智能分析获得的特征，特征是个人信息的表现，但不可见个人信息的原始数据或属性。可选地，分布式的快速的数据特征分析，获得所有的详细个人信息数据特征是通过动态启用数据沙盒方式自动完成。分布式数据沙盒自动探测大数据中个人信息类的数据总体量，依据总体量的量级启用多个分布式数据沙盒，同时对大数据中的详细个人信息数据特征进行获取。可选地，分布式数据沙盒，是从同一操作系统环境或不同操作系统环境中建立的虚拟的安全计算空间域，分为一级数据沙盒和二级分布式数据沙盒。其中不同的二级分布式数据沙盒的安全空间域之间是互相隔离（如物理隔离）的，二级分布式数据沙盒可与一级数据沙盒进行数据交换。二级分布式数据沙盒获得的结果统一提交至一级数据沙盒，一级数据沙盒经过数据汇聚后输出总结果。可选地，个人信息的合规分布基线是通过对大数据中整体的数据分布进行人工智能分析，自动建立个人信息的合规分布基线。个人信息的合规分布基线，用于进一步识别个人信息的违规存储分布，以及个人信息的共享计算合规。可选地，个人信息类的数据的详情包括个人信息类的总量（以字节计）、详细个人信息类的数据特征的总量（各属性以记录数计，同时以字节计）、个人信息类的数据与详细个人信息类的数据特征的关联映射关系。可选地，个人信息类的合规存储详情是依据包括合规存储的个人信息类的总量（以字节计）、合规存储的详细个人信息类的数据特征的总量（各属性以记录数计，同时以字节计）、个人信息类的数据与合规存储的详细个人信息类的数据特征的关联映射关系。可选地，个人信息类的违规存储详情包括违规存储的个人信息类的总量（以字节计）、违规存储的详细个人信息类的数据特征的总量（各属性以记录数计，同时以字节计）、个人信息类的数据与违规存储的详细个人信息类的数据特征的关联映射关系。根据本申请实施例的另一方面，还提供了一种基于分布式数据沙盒的个人信息合规装置，包括：人工智能分析模块，用于对大数据中的个人信息类的数据特征、详细个人信息的数据特征进行分析，与分布式数据沙盒模块协作，获得个人信息类的分布；分布式数据沙盒模块，用于根据大数据的个人信息类的数据特征、详细个人信息类的数据特征为个人信息共享计算合规动态的建立双层多个分布式数据沙盒，进行同步的数据处理；个人信息交互模块，用于展示个人信息类的分布状态以及个人信息共享计算的处理结果。根据本申请实施例的另一方面，还提供了一种基于分布式数据沙盒的个人信息合规系统，包括：人工智能分析子系统，用于对大数据、大数据中的个人信息类的数据特征、详细个人信息类的数据特征进行人工智能分析，与分布式数据沙盒模块协作，获得详细个人信息的分布；个人信息合规处理子系统，用于个人信息合规的快速的分布式处理；个人信息合规交互平台，用于展示个人信息类的分布状态以及个人信息共享计算的结果。采用本申请的技术方案，可实现如下效果：第一，在人工智能分析子系统中，管理员通过人工智能分析子系统对大数据和大数据中的个人信息类进行自动的分析和择取，获得个人信息类的数据特征、详细个人信息类的数据特征并对数据特征进行进一步的分析；第二，在个人信息合规处理子系统中，建立个人信息类的总体、违规等分布；第三，在个人信息合规处理子系统中，对计算用户发起的个人信息计算请求进行快速响应，并对计算结果的合规输出进行合规检查；第四，对在个人信息合规交互平台中，展示个人信息类的分布状态以及个人信息共享计算的处理结果。通过这些合规技术，一方面保证企业管理者控制个人信息的合规；另一方面用户在使用个本文档来自技高网...

【技术保护点】
1.一种基于分布式数据沙盒的个人信息合规的方法，其特征在于，包括：/n通过人工智能技术对大数据进行一级分类，以获得归属于个人信息类的数据，并从所述个人信息类的数据中提取归属于个人信息类的数据特征；/n通过人工智能分析和分布式数据沙盒对所述个人信息类的数据进行二级分类，以获得详细个人信息类的数据特征；/n通过所述分布式数据沙盒所掌握的所述个人信息类的数据特征和所述详细个人信息类的数据特征，完成所述大数据的个人信息的合规，所述个人信息的合规包括个人信息的分布合规和个人信息的共享计算合规。/n

【技术特征摘要】
1.一种基于分布式数据沙盒的个人信息合规的方法，其特征在于，包括：
通过人工智能技术对大数据进行一级分类，以获得归属于个人信息类的数据，并从所述个人信息类的数据中提取归属于个人信息类的数据特征；
通过人工智能分析和分布式数据沙盒对所述个人信息类的数据进行二级分类，以获得详细个人信息类的数据特征；
通过所述分布式数据沙盒所掌握的所述个人信息类的数据特征和所述详细个人信息类的数据特征，完成所述大数据的个人信息的合规，所述个人信息的合规包括个人信息的分布合规和个人信息的共享计算合规。

2.根据权利要求1所述的方法，其特征在于，
所述个人信息类的数据特征不包含个人信息的原始数据或属性、仅用于所述分布式数据沙盒进行所述大数据的个人信息的合规分析，除所述分布式数据沙盒以外的组件均无法通过所述个人信息类的数据特征推演出个人信息类的原始数据或属性；
所述分布式数据沙盒所获得的所有的所述详细个人信息类的数据特征不包含个人信息的原始数据或属性、仅用于所述分布式数据沙盒进行个人信息合规处理，除所述分布式数据沙盒以外的组件均无法通过所述详细个人信息类的数据特征推演出个人信息类的原始数据或属性。

3.根据权利要求1所述的方法，其特征在于，通过所述分布式数据沙盒所掌握的详细个人信息的数据特征，完成所述大数据的个人信息的合规包括：
根据所述个人信息类的数据特征和所述详细个人信息类的数据特征，获得所述大数据中个人信息的合规分布基线和个人信息的实际分布，个人信息的实际分布包括所述个人信息类的数据的详情、合规存储详情以及违规存储详情；
通过所述分布式数据沙盒，获得大数据中的个人信息共享计算合规，用户具有使用大数据中的个人信息进行计算的权限，计算过程在所述分布式数据沙盒中完成，计算完成后，利用基于个人信息的合规分布基线对计算结果进行合规检查，若检查结果表明结算结果未涉及个人信息的个体特征，则允许用户直接从所述分布式数据沙盒中导出计算结果，若检查结果表明结算结果涉及个人信息的个体特征，则由所述分布式数据沙盒做进一步地人工智能处理，以消除个人信息的个体特征后，从所述分布式数据沙盒中导出新的计算结果。

4.根据权利要求1所述的方法，其特征在于，
所述大数据包含多种分类的大数据，所述多种分类的大数据包括结构化数据、半结构化数据以及非结构化数据；所述大数据的形态包括数据流、数据片段以及各种格式的文档。

5.根据权利要求1所述的方法，其特征在于，通过人工智能分析和分布式数据沙盒对所述个人信息类的数据进行二级分类，以获得详细个人信息类的数据特征包括：
通过所述分布式数据沙盒自动探测大数据中所述个...

【专利技术属性】
技术研发人员：王文宇，
申请(专利权)人：北京数安行科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人