Changing fingerprint identification is applied to text files, database tables or data feeds to determine the time frame in which the identified \wild file\ is generated, even when metadata is lost in its file creation. Each row in the data contains information about a single object. At least one column in the data contains the age of each object when creating a file. This age data can be used to determine the date of file creation, such as by using identification processing or by viewing data added or deleted from the file based on age. By identifying the time frames in which wild files are created, data owners can greatly reduce the computational burden of determining whether wild files contain stolen data, because it greatly reduces the file world that must be compared with wild files.
【技术实现步骤摘要】
【国外来华专利技术】针对数据库表、文本文件和数据馈送的变化指纹鉴定
本专利技术解决了使用基于内容的零水印技术的数据文件的数据隐私和取证分析的问题,以确定创建文件的日期。
技术介绍
数据的拥有者(每个都是“数据提供者”)通常将他们的数据给予、租借或出售给据信以合法方式处理该数据的个人或组织(“可信第三方”或“TTP”)。TTP有义务遵守合同要求或数据处理规则,诸如由地方、州或联邦政府制定的金融服务或隐私法律中的条例B。该数据通常作为一系列数据库表(.sql)、文本文件(.csv、.txt或其它格式)、或作为实时数据馈送(例如,XML或JSON)来被传送。尽管如此,数据提供者的数据可泄漏(所泄漏的文件被定义为“被泄漏的子集”)到那些或非法地故意或无意使用该数据的其他人(“坏角色”)的手中。这可能因为以下原因而发生,例如,TTP故意发布数据并且其本身就是坏角色;TTP的员工故意或意外地发布数据;或实际数据提供者本身的员工故意或无意地泄露数据。一旦数据提供者的数据泄漏,它可被许多坏角色按各种方式操纵:元素可被更改,它可以与来自其他数据提供者的数据合并,或者它可被分成子集或重新排列,以及其他类型的操作。这使得数据提供者难以在法庭上认清数据是自己的,标识对泄漏数据负责的一方,并追回损失的收入。如共同未决的国际专利申请号PCT/US2016/068418中所公开的,申请人已经开发了用于对数据集打上水印以标识泄漏的子集并标识哪个TTP或哪些TTP是坏角色(“罪责分配”)的硬件和软件中系统和方法。该系统和方法解决了两个问题:出站处理和入站处理。出站处理指将唯一数据与来自数据提供者的每个出站数据 ...
【技术保护点】
1.一种用于确定在野生文件中找到的数据的源的方法,所述野生文件包括多个记录,所述方法包括以下步骤:a.标识具有关于所述野生文件记录的年龄相关信息的字段;b.将识别过程应用于所述野生文件记录,其中来自所述野生文件记录的个人可标识信息(PII)与数据拥有者的主文件中的相应字段相匹配以将真实年龄附加至所述野生文件记录;c.将所述真实年龄数据与来自所述野生文件记录的所述年龄相关信息作比较以标识野生文件创建时段;d.在文件保留期内传送的所有源数据文件的主数据库中,只选择在所述野生文件创建时段期间发送的那些数据文件;e.仅将所选数据文件与所述野生文件中的所述记录作比较以确定所述野生文件是否与所选数据文件中的任一者相匹配;以及f.生成针对所述野生文件的表示其与所述相应数据文件的关联性的强度的罪责得分。
【技术特征摘要】
【国外来华专利技术】2016.02.08 US 62/292,8201.一种用于确定在野生文件中找到的数据的源的方法,所述野生文件包括多个记录,所述方法包括以下步骤:a.标识具有关于所述野生文件记录的年龄相关信息的字段;b.将识别过程应用于所述野生文件记录,其中来自所述野生文件记录的个人可标识信息(PII)与数据拥有者的主文件中的相应字段相匹配以将真实年龄附加至所述野生文件记录;c.将所述真实年龄数据与来自所述野生文件记录的所述年龄相关信息作比较以标识野生文件创建时段;d.在文件保留期内传送的所有源数据文件的主数据库中,只选择在所述野生文件创建时段期间发送的那些数据文件;e.仅将所选数据文件与所述野生文件中的所述记录作比较以确定所述野生文件是否与所选数据文件中的任一者相匹配;以及f.生成针对所述野生文件的表示其与所述相应数据文件的关联性的强度的罪责得分。2.如权利要求1所述的方法,其特征在于,所述年龄相关信息是出生日期。3.如权利要求1所述的方法,其特征在于,所述年龄相关信息是制造日期。4.如权利要求1所述的方法,其特征在于,所述年龄相关信息是年龄范围。5.如权利要求4所述的方法,其特征在于,所述真实年龄数据包括两年的年龄范围。6.如权利要求1所述的方法,其特征在于,应用识别过程的所述步骤包括:从原始的合法接受的文档中导出真实年龄数据的标识。7.如权利要求1所述的方法,其特征在于,仅选择与所述野生文件创建日期对应的那些数据文件的所述步骤包括:首先仅选择在给定年期间发送的那些数据文件并且随后从给定年期间发送的那些文件中选择在给定月期间发送的那些数据文件的步骤。8.如权利要求1所述的方法,其特征在于,仅选择与所述野生文件创建日期对应的那些数据文件的所述步骤包括:仅选择在给定年和给定月期间发送的那些数据文件的单个步骤。9.如权利要求4所述的方法,其特征在于,标识具有关于所述野生文件记录的年龄相关信息的所述步骤包括在所述野生文件中标识包含年龄范围的字段的步骤,并且其中将所述真实年龄数据与来自所述野生文件记录的所述年龄相关信息作比较以标识野生文件创建时段的所述步骤包括将多个月中发布的文件与所述野生文件的数据作比较以标识至少一个记录的年龄范围变化的月份的步骤。10.如权利要求9所述的方法,其特征在于,对于所述记录中的每一者而言,如果将识别过程应用于所述野生文件的所述数据中的所述记录的所述步骤不产生匹配,...
【专利技术属性】
技术研发人员:亚瑟·科尔曼,马丁·罗斯,梁芷苓·克里斯蒂娜,
申请(专利权)人:利弗莱姆有限公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。