【技术实现步骤摘要】
【国外来华专利技术】在数据库表、文本文件和数据馈送中对文本和指纹识别进行加盐
本专利技术的领域是对数据集的数据和指纹识别进行加盐以确定数据是否被不当地复制或使用。加盐是将独特数据(盐)插入数据子集,使得在数据被泄漏的情况下,被包含在该数据子集中的数据可被标识回数据所有者的机制。指纹识别是从数据集产生短得多的集合的过程,尽管如此,它的指纹仍标识原始数据集。
技术介绍
数据泄漏可被定义为除所有者或授权用户以外的某个人对数据的偷用。估计每年全球数据泄漏的财务影响达数亿美元,并因此代表了数据服务行业中一个非常重要的问题。试图防止数据泄漏的解决方案已经存在一段时间了。这些解决方案防止数据泄漏到组织的防火墙之外,或在数据离开防火墙并在开放网络上“走钢丝”般移动时对其进行加密。还存在一旦图形、视频、音频、或文档(即文本或pdf)数据实际以明文暴露在防火墙外则声明该数据的所有权的解决方案;各组织使用这些众所周知的“数字水印”解决方案以保护其数据免遭滥用。(术语“水印”借用于印刷媒体,其中水印由印刷文档上的印记图像或图案组成以验证真实性,而数字水印是出于相同目的嵌入数字文件中的一种标记。)水印允许数据所有者追讨无授权使用的赔偿,因为他们可在法庭上将水印用作所有权和版权侵权的证据。与此同时,这种法律救济措施的存在阻碍了个人或团体希望获得并随后免费使用此受版权保护的材料。遗憾的是,无论在使用时以明文还是密文传输,文本和数据库文件的数据泄漏仍然是未解决的问题。消费者数据的所有者(“数据所有者”)经常将其数据给予、租赁、或贩售给被受信仅以合法方式、遵守合同要求或数据处理规定(诸如金融服务中的B条例或地 ...
【技术保护点】
1.一种用于对数据文件进行加盐和指纹识别的方法,其特征在于,所述数据文件包括多个记录,且每个这样的记录包括至少一个字段,所述方法包括以下步骤:a.从多个可用的排序技术中选择排序技术;b.根据经选择的排序技术对所述数据文件中的所述记录进行排序;c.从多个可用的加盐技术中选择加盐技术;d.在所述排序被执行之后将经选择的加盐技术应用于所述数据文件中的一个或多个记录,其中所述加盐技术至少部分地基于在所述排序步骤之后所述数据文件中的所述记录的顺序以创建经加盐的数据文件;e.在所述加盐步骤之后建立所述经加盐的数据文件的指纹,其中所述指纹包括在所述经加盐的数据文件中的所述多个记录中的至少一个所述记录的子集的至少一个字段;f.将经排序和经加盐的数据文件恢复到其原始排序顺序,就像其在用于产生经重新排序的经加盐的数据文件的所述排序步骤之前一样;g.将文件标识符与所述数据文件相关联,并在文件数据库中存储所述文件标识符以及与所述经选择的排序技术相关联的标识符、与所述经选择的加盐技术相关联的标识符、和所述指纹;以及h.将所述经重新排序的经加盐的数据文件递送给受信任的第三方(TTP)。
【技术特征摘要】
【国外来华专利技术】2016.02.18 US 62/297,0271.一种用于对数据文件进行加盐和指纹识别的方法,其特征在于,所述数据文件包括多个记录,且每个这样的记录包括至少一个字段,所述方法包括以下步骤:a.从多个可用的排序技术中选择排序技术;b.根据经选择的排序技术对所述数据文件中的所述记录进行排序;c.从多个可用的加盐技术中选择加盐技术;d.在所述排序被执行之后将经选择的加盐技术应用于所述数据文件中的一个或多个记录,其中所述加盐技术至少部分地基于在所述排序步骤之后所述数据文件中的所述记录的顺序以创建经加盐的数据文件;e.在所述加盐步骤之后建立所述经加盐的数据文件的指纹,其中所述指纹包括在所述经加盐的数据文件中的所述多个记录中的至少一个所述记录的子集的至少一个字段;f.将经排序和经加盐的数据文件恢复到其原始排序顺序,就像其在用于产生经重新排序的经加盐的数据文件的所述排序步骤之前一样;g.将文件标识符与所述数据文件相关联,并在文件数据库中存储所述文件标识符以及与所述经选择的排序技术相关联的标识符、与所述经选择的加盐技术相关联的标识符、和所述指纹;以及h.将所述经重新排序的经加盐的数据文件递送给受信任的第三方(TTP)。2.如权利要求1所述的方法,其特征在于,所述经选择的排序技术是多级排序技术。3.如权利要求1所述的方法,其特征在于,所述经选择的加盐技术是从所述多个可用的加盐技术中随机选择的。4.如权利要求1所述的方法,其特征在于,所述经选择的加盐技术符合编码准确性支持系统(CASS)。5.如权利要求1所述的方法,其特征在于,所述加盐技术不能被不良行为者检测到。6.如权利要求1所述的方法,其特征在于,所述加盐技术不会妨害所述数据文件的可用性。7.如权利要求1所述的方法,其特征在于,所述数据文件的每个记录包括多个字段,并且进一步其中所述数据文件的每个记录包括关于消费者的信息。8.一种从野生文件中的多个数据文件中的一个数据文件检测一个或多个记录的存在的方法,其中所述多个数据文件和所述野生文件各自包括多个记录,每个记录包括多个字段,所述方法包括以下步骤:a.将来自一组排序技术的多个排序技术应用于所述野生文件;b.针对所述多个排序技术中的一个排序技术向所述野生文件的每次应用,从一组加盐技术中检索多个加盐技术,并对于所述多个加盐技术中的每一个加盐技术,将对至少一个所述数据文件进行加盐的结果与所述野生文件进行比较以确定匹配是否发生;c.如果在对至少一个所述数据文件进行加盐的所述结果与所述野生文件进行比较之后匹配发生,则将所述野生文件中的至少一个记录的至少一个字段与多个指纹中的至少一个指纹进行比较;d.如果所述野生文件中的至少一个记录的至少一个字段与多个指纹中的至少一个指纹的比较导致匹配,则返回所述野生文件导出自所述数据文件的结果;以及e.如果所述多个排序技术中的一个排序技术向所述野生文件的每个应用和所述多个加盐技术中的一个加盐技术向所述野生文件的每个应用不会导致与所述指纹的匹配,则返回所述野生文件并非导出自所述数据文件的结果。9.如权利要求8所述的方法,其特征在于,所述多个排序技术中的至少一个排序技术是多级排序技术。10....
【专利技术属性】
技术研发人员:查尔斯·辛兹梅尔,梁芷苓·克里斯蒂娜,马特·勒巴伦,马丁·罗斯,雷·克劳斯,亚瑟·科尔曼,迈克尔·安德森,
申请(专利权)人:利弗莱姆有限公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。