结构化数据的指纹校验方法及装置制造方法及图纸

技术编号:21097086 阅读:29 留言:0更新日期:2019-05-15 22:27
本发明专利技术公开了一种结构化数据的指纹校验方法及装置,涉及信息技术领域,可以实现对结构化数据进行相似性分析。所述方法包括:首选提取待校验结构化数据中的指纹信息;然后检测所述指纹信息与预置二维数据表中的指纹信息之间是否符合预设指纹相似条件;若符合,则确定所述待校验结构化数据为内容相似数据。本发明专利技术适用于对结构化数据的指纹校验。

Fingerprint Verification Method and Device for Structured Data

The invention discloses a fingerprint verification method and device for structured data, which relates to the field of information technology and can realize similarity analysis of structured data. The method includes: first extracting fingerprint information from structured data to be checked; then detecting whether the fingerprint information matches the preset fingerprint similarity condition between the fingerprint information and the fingerprint information in the preset two-dimensional data table; and if so, determining that the structured data to be checked is content similarity data. The invention is suitable for fingerprint verification of structured data.

【技术实现步骤摘要】
结构化数据的指纹校验方法及装置
本专利技术涉及一种信息
,特别是涉及一种结构化数据的指纹校验方法及装置。
技术介绍
随着信息技术的不断发展,对于结构化数据的使用量越来越大。其中,所谓结构化数据即行数据,可以使用数据库二维表结构来逻辑表达实现的数据。例如,在企业ERP(EnterpriseResourcePlanning,企业资源计划)系统、财务系统、医疗HIS数据库、教育一卡通系统、政府行政审批系统、及其他核心数据库等场景中存储的通常为结构化数据,可以满足高速存储应用需求、数据备份需求、数据共享需求以及数据容灾需求等。目前,在对结构化数据处理的过程中,有时由于存在内容相似的结构化数据,因此有需要对结构化数据进行相似性分析的需求。
技术实现思路
有鉴于此,本专利技术提供了一种结构化数据的指纹校验方法及装置,主要目的在于可以实现对结构化数据进行相似性分析。依据本专利技术一个方面,提供了一种结构化数据的指纹校验方法,该方法包括:提取待校验结构化数据中的指纹信息;检测所述指纹信息与预置二维数据表中的指纹信息之间是否符合预设指纹相似条件;若符合,则确定所述待校验结构化数据为内容相似数据。依据本专利技术另一个方面,提供了一种结构化数据的指纹校验装置,该装置包括:提取单元,用于提取待校验结构化数据中的指纹信息;检测单元,用于检测所述提取单元提取的指纹信息与预置二维数据表中的指纹信息之间是否符合预设指纹相似条件;确定单元,用于若所述检测单元检测出所述指纹信息与预置二维数据表中的指纹信息之间符合预设指纹相似条件,则确定所述待校验结构化数据为内容相似数据。借由上述技术方案,本专利技术实施例提供的技术方案至少具有下列优点:本专利技术提供的一种结构化数据的指纹校验方法及装置,首先提取待校验结构化数据中的指纹信息;然后检测所述指纹信息与预置二维数据表中的指纹信息之间是否符合预设指纹相似条件;若符合,则确定所述待校验结构化数据为内容相似数据。本专利技术通过对待校验结构化数据进行指纹信息提取并检测其与预置二维数据表中的指纹信息之间是否符合预设指纹相似条件,提供了对结构化数据进行指纹校验的方式,可以实现对结构化数据进行相似性分析。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术实施例提供的一种结构化数据的指纹校验方法流程示意图;图2示出了本专利技术实施例提供的另一种结构化数据的指纹校验方法流程示意图;图3示出了本专利技术实施例提供的一种结构化数据的指纹校验装置结构示意图;图4示出了本专利技术实施例提供的另一种结构化数据的指纹校验装置结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。本专利技术实施例提供了一种结构化数据的指纹校验方法,如图1所示,所述方法包括:101、提取待校验结构化数据中的指纹信息。其中,所述指纹信息可以唯一标识结构化数据的特征,每一个结构化数据文件都会有唯一的指纹信息。所谓指纹,实际上就是将数据内容映射成一个数字,每一段不同内容所映射的数字都不会相同,就好比人的指纹一样。指纹在保护数据完整性,身份识别等诸多方面有着举足轻重的作用。102、检测指纹信息与预置二维数据表中的指纹信息之间是否符合预设指纹相似条件。其中,所述预设指纹相似条件可以根据实际需求进行配置。所述预置二维数据表保存有用于鉴别数据内容相似性的指纹信息。例如,可以将待校验结构化数据转换为二维数据表A,并将表A中每个单元格数据对应的哈希值作为提取的指纹信息。根据每个单元格数据在二维数据表中的所在位置,将每个单元格数据对应的哈希值与预置二维数据表B中每个单元格数据对应的哈希值分别进行匹配;预设指纹相似条件可以配置为表A中存在与表B中任意3行的任意4列的哈希值匹配的单元格数据。此时当表A与表B之间的匹配结果如下表所示,其中,下表为表B中的部分列表,“匹配”字样的标识说明该单元格数据的哈希值与表A中相对应单元格数据的哈希值匹配,可以确定表A中存在与表B中任意3行的任意4列的哈希值匹配的单元格数据,进而可以确定指纹信息与预置二维数据表中的指纹信息之间符合预设指纹相似条件。匹配匹配匹配匹配匹配匹配匹配匹配匹配匹配匹配匹配103、若指纹信息与预置二维数据表中的指纹信息之间符合预设指纹相似条件,则确定待校验结构化数据为内容相似数据。本专利技术实施例提供的一种结构化数据的指纹校验方法,首先提取待校验结构化数据中的指纹信息;然后检测所述指纹信息与预置二维数据表中的指纹信息之间是否符合预设指纹相似条件;若符合,则确定所述待校验结构化数据为内容相似数据。本专利技术通过对待校验结构化数据进行指纹信息提取并检测其与预置二维数据表中的指纹信息之间是否符合预设指纹相似条件,提供了对结构化数据进行指纹校验的方式,可以实现对结构化数据进行相似性分析。本专利技术实施例提供了另一种结构化数据的指纹校验方法,如图2所示,所述方法包括:201、将待校验结构化数据转换为二维数据表。202、计算二维数据表中每个单元格数据对应的哈希值,作为提取的指纹信息。其中,所述指纹信息的概念解释可以参考步骤101中相应描述,在此不再赘述。203、检测指纹信息与预置二维数据表中的指纹信息之间是否符合预设指纹相似条件。其中,所述预设指纹相似条件可以根据实际需求进行配置。所述预置二维数据表保存有用于鉴别数据内容相似性的指纹信息。对于本专利技术实施例,所述步骤203具体可以包括:根据所述每个单元格数据在所述二维数据表中的所在位置,将所述每个单元格数据对应的哈希值与预置二维数据表中每个单元格数据对应的哈希值分别进行匹配;当所述二维数据表中存在与所述预置二维数据表中任意预设行数的任意预设列数的所述哈希值匹配的单元格数据时,确定所述指纹信息与所述预置二维数据表中的指纹信息之间符合所述预设指纹相似条件。其中,所述预设行数和预设列数可以根据实际需求进行配置,例如,预设行数可以为4行,预设列数可以为6列等。对于本专利技术实施例,所述步骤203具体还可以包括:检测所述二维数据表中是否存在与预置二维数据表中的一个单元格数据相同哈希值的单元格数据;若存在相同哈希值的单元格数据,则获取所述单元格数据在所述二维数据表中所在行的每个单元格数据的哈希值;根据所述预置二维数据表中相同哈希值的单元格数据的所在位置,按照所述每个单元格数据相应的排列顺序,将所述每个单元格数据对应的哈希值与所述预置二维数据表中相对应行位置的每个单元格数据对应的哈希值分别进行匹配;根据所述行对应的匹配结果,确定所述指纹信息与所述预置二维数据表中的指纹信息之间是否符合所述预设指纹相似条件。具体地,所述根据所述行对应的匹配结本文档来自技高网...

【技术保护点】
1.一种结构化数据的指纹校验方法,其特征在于,包括:提取待校验结构化数据中的指纹信息,包括:将所述待校验结构化数据转换为二维数据表,计算所述二维数据表中每个单元格数据对应的哈希值,作为提取的指纹信息;检测所述指纹信息与预置二维数据表中的指纹信息之间是否符合预设指纹相似条件,具体包括:根据所述每个单元格数据在所述二维数据表中的所在位置,将所述每个单元格数据对应的哈希值与预置二维数据表中每个单元格数据对应的哈希值分别进行匹配;当所述二维数据表中存在与所述预置二维数据表中任意预设行数的任意预设列数的所述哈希值匹配的单元格数据时,确定所述指纹信息与所述预置二维数据表中的指纹信息之间符合所述预设指纹相似条件;若符合,则确定所述待校验结构化数据为内容相似数据。

【技术特征摘要】
1.一种结构化数据的指纹校验方法,其特征在于,包括:提取待校验结构化数据中的指纹信息,包括:将所述待校验结构化数据转换为二维数据表,计算所述二维数据表中每个单元格数据对应的哈希值,作为提取的指纹信息;检测所述指纹信息与预置二维数据表中的指纹信息之间是否符合预设指纹相似条件,具体包括:根据所述每个单元格数据在所述二维数据表中的所在位置,将所述每个单元格数据对应的哈希值与预置二维数据表中每个单元格数据对应的哈希值分别进行匹配;当所述二维数据表中存在与所述预置二维数据表中任意预设行数的任意预设列数的所述哈希值匹配的单元格数据时,确定所述指纹信息与所述预置二维数据表中的指纹信息之间符合所述预设指纹相似条件;若符合,则确定所述待校验结构化数据为内容相似数据。2.根据权利要求1所述的结构化数据的指纹校验方法,其特征在于,所述检测所述指纹信息与预置二维数据表中的指纹信息之间是否符合预设指纹相似条件包括:检测所述二维数据表中是否存在与预置二维数据表中的一个单元格数据相同哈希值的单元格数据;若存在所述相同哈希值的单元格数据,则获取所述单元格数据在所述二维数据表中所在行的每个单元格数据的哈希值;根据所述预置二维数据表中相同哈希值的单元格数据的所在位置,按照所述每个单元格数据相应的排列顺序,将所述每个单元格数据的哈希值与所述预置二维数据表中相对应行位置的每个单元格数据的哈希值分别进行匹配;根据所述行对应的匹配结果,确定所述指纹信息与所述预置二维数据表中的指纹信息之间是否符合所述预设指纹相似条件。3.根据权利要求2所述的结构化数据的指纹校验方法,其特征在于,所述根据所述行对应的匹配结果,确定所述检测所述指纹信息与所述预置二维数据表中的指纹信息之间是否符合所述预设指纹相似条件包括:当所述哈希值匹配的列个数大于或等于预设列个数阈值时,记录所述二维数据表中的所述行对应的标识信息;检测记录的标识信息的个数是否大于或等于预置行数阈值;若所述个数大于或等于所述预置行数阈值,则确定所述指纹信息与所述预置二维数据表中的指纹信息之间符合所述预设指纹相似条件。4.根据权利要求2所述的结构化数据的指纹校验方法,其特征在于,所述检测所述二维数据表中是否存在与预置二维数据表中的一个单元格数据相同哈希值的单元格数据之后,所述方法还包括:若存在所述相同哈希值的单元格数据,则获取所述单元格数据在所述二维数据表中所在列的每个单元格数据的哈希值;根据所述预置二维数据表中相同哈希值的单元格数据的所在位置,按照所述每个单元格数据相应的排列顺序,将所述每个单元格数据的哈希值与所述预置二维数据表中相对应列位置的每个单元格数据的哈希值分别进行匹配;根据所述列对应的匹配结果,确定所述指纹信息与所述预置二维数据表中的指纹信息之间是否符合所述预设指纹相似条件。5.根据权利要求4所述的结构化数据的指纹校验方法,其特征在于,所述根据所述列对应的匹配结果,确定所述检测所述指纹信息与所述预置二维数据表中的指纹信息之间是否符合所述预设指纹相似条件包括:当所述哈希值匹配的行个数大于或等于预设行个数阈值时,记录所述二维数据表中的所述列对应的标识信息;检测记录的标识信息的个数是否大于或等于预置列数阈值;若所述个数大于或等于所述预置列数阈值,则确定所述指纹信息与所述预置二维数据表中的指纹信息之间符合所述预设指纹相似条件。6.一种结构化数据的指纹校验装置,其特征在于,包括:提取单元,用于提取待校验结构化数据中的...

【专利技术属性】
技术研发人员:朱细智
申请(专利权)人:北京奇虎科技有限公司北京奇安信科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1