【技术实现步骤摘要】
【国外来华专利技术】用于私密和安全数据链接的上下文数据脱敏的系统和方法
[0001]相关申请交叉引用
[0002]本申请要求2020年1月29日提交的美国临时申请第16/776,293号的权益和优先权,上述专利申请的全部内容通过引用并入本文。
[0003]本公开涉及数据处理,并且,特别地,安全和私密地处理数据以产生对所述数据的洞察(insight)。
技术介绍
[0004]多种实体可以在多种计算设备上数字化地维护大量数据。例如,一个组织可以在一系列互连的服务器上维护多列数据。通常可能需要检查这些大量数据以确定对数据多种特征的多种洞察。然而,检索和处理大量数据可能是计算资源密集型的。
[0005]在许多情况下,客户端数据可以从客户端计算设备传输到外部计算设备以进行数据检查。但是,客户端数据会包含敏感/私密信息,例如包含个人身份信息(PII)的客户端数据。在这种情况下,向外部传输客户端数据可能会使此敏感数据易受到未经授权的访问。因此,在限制对客户端数据的外部访问的同时,可能需要识别客户端数据的特征。
附图说明
[0006]对于本领域技术人员来说,通过研究结合了附图的具体实施方式,本技术的多种特征和特性将变得更加清楚。本技术的实施例在附图中以示例而非限制的方式进行说明,其中相同的参考标记可表示相同的元素。
[0007]图1是可以实施当前实施例的网络结构示例。
[0008]图2是示出了数据脱敏(data masking)过程示例的框图。
[0009]图3是示出了数据编目/分类过程示 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于对数据进行安全分类和令牌化的计算机实现方法,所述方法包括:摄取对应于客户端的数据集;检查所述数据集以识别分类器,所述分类器表示所述数据集中包括的属性的特征;检索特定于客户端的加密信息和特定于客户端的配置信息,其中包括表示所述数据集中包含的信息类型的匿名标签列表;识别所述匿名标签列表中包含的标签,所述标签与基于所述已识别的分类器的所述属性中的信息类型相对应;处理所述数据集的所述属性以生成经修改的属性,所述经修改的属性被修改为标准化格式;以及生成所述经修改的属性的令牌化版本,包括:使用包含在所述特定于客户端的加密信息中的散列盐和加密密钥,对所述经修改的属性进行散列处理,以生成散列的经修改的属性;将所述标签与包括一系列特定于客户端的标记的标记存储进行比较,以识别与所述标签对应的第一标记;以及生成包括所述第一标记的经修改的属性的上下文令牌。2.根据权利要求1所述的计算机实施方法,其中所述数据集中包含数据的至少一部分包括个人身份信息(PII)。3.根据权利要求1所述的计算机实施方法,其中所述分类器包括域分类器,子域分类器,属性分类器,和实体分类器中的任何一种。4.根据权利要求1所述的计算机实施方法,其中所述特定于客户端的加密信息从安全服务器中检索,所述特定于客户端的加密信息使用散列消息认证码(HMAC)协议进行加密或通过TLS协议传输,并且其中所述散列盐包括计算机生成的SHA2 512/256令牌,以及AES256加密密钥。5.根据权利要求1所述的计算机实施方法,其中处理所述数据集的所述属性以生成所述经修改的属性还包括:检索与所述属性对应的一组验证规则和一组标准化规则,所述一组验证规则提供表示所述属性是否对应于所述标签,并且所述一组标准化规则提供将所述属性修改为所述标准化格式的规则;将所述属性与所述一组验证规则进行比较,以确定所述属性是否对应于所述标签;以及响应于确定所述属性对应于所述标签,根据所述一组标准化规则将所述属性修改为所述标准化格式。6.根据权利要求1所述的计算机实施方法,其中处理所述数据集的所述属性以生成所述经修改的属性还包括:使用一系列规则引擎处理所述属性,所述一系列规则引擎包括:名称引擎,所述名称引擎响应于确定所述属性表示名称,将所述属性与关联名称列表中包含的常见关联名称相关联;以及地址库引擎,所述地址库引擎响应于确定所述属性表示地址,将所述属性添加到与客户端相关联的地址库中。
7.根据权利要求1所述的计算机实施方法,还包括:使用Base64编码方案将所述散列的经修改的属性从64个字符的令牌压缩为44个字符的字符串。8.根据权利要求1所述的计算机实施方法,还包括:使用所述特定于客户端的加密信息中包含的特定于客户端的加密密钥,对所述散列的经修改的属性进行加密。9.根据权利要求1所述的计算机实施方法,还包括:响应于识别所述标签,根据所述标签和所述属性生成所述数据集的第一组洞察;响应于生成所述经修改的属性,根据所述经修改的属性为所述数据集生成第二组洞察;以及将所述第一组洞察和所述第二组洞察存储在网络可访问的服务器系统中。10.一种由计算节点执行以生成令牌化的客户端数据印象的方法,所述方法包括:从客户端节点获取对应于客户端的数据流,所述数据流包括一系列数据集;对于所述数据流中包含的每个数据集
‑‑
检查所述数据集以识别表示所述数据集中包含的属性特征的分类器;识别与所述数据集相对应的特定于客户端的标签列表中包含的标签;使用一系列规则引擎处理所述属性,所述一系列规则引擎被配置为根据所述一系列规则引擎修改所述属性;以及生成包含所述经修改的属性的令牌化版本的令牌;以及将为所述数据流生成的令牌发送到被配置为维护所述生成的令牌的网络可访问服务器系统。11.根据权利要求10所述的方法,还包括:从安全服务器中检索特定于客户端的加密信息,所述加密信息包括散列代码和特定于客户端的加密密钥;以及检索特定于客户端的配置信息,所述配置信息包括表示所述数据集中包含的信息类型的特定于客户端的标签的列表,其中每个标签被配置为匿名化与所述数据流相关的信息,使得使用所述标签识别与所述数据流相关的信息只能使用所述特定于客户端的配置信息来识别。12.根据权利要求11所述的方法,其中为所述经修改的属性生成所述令牌化版本包括:使用...
【专利技术属性】
技术研发人员:萨蒂恩德,
申请(专利权)人:科里布拉有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。