The invention discloses a fingerprint verification method and device for structured data, which relates to the field of information technology and can realize similarity analysis of structured data. The method includes: first extracting fingerprint information from structured data to be checked; then detecting whether the fingerprint information matches the preset fingerprint similarity condition between the fingerprint information and the fingerprint information in the preset two-dimensional data table; and if so, determining that the structured data to be checked is content similarity data. The invention is suitable for fingerprint verification of structured data.
【技术实现步骤摘要】
结构化数据的指纹校验方法及装置
本专利技术涉及一种信息
,特别是涉及一种结构化数据的指纹校验方法及装置。
技术介绍
随着信息技术的不断发展,对于结构化数据的使用量越来越大。其中,所谓结构化数据即行数据,可以使用数据库二维表结构来逻辑表达实现的数据。例如,在企业ERP(EnterpriseResourcePlanning,企业资源计划)系统、财务系统、医疗HIS数据库、教育一卡通系统、政府行政审批系统、及其他核心数据库等场景中存储的通常为结构化数据,可以满足高速存储应用需求、数据备份需求、数据共享需求以及数据容灾需求等。目前,在对结构化数据处理的过程中,有时由于存在内容相似的结构化数据,因此有需要对结构化数据进行相似性分析的需求。
技术实现思路
有鉴于此,本专利技术提供了一种结构化数据的指纹校验方法及装置,主要目的在于可以实现对结构化数据进行相似性分析。依据本专利技术一个方面,提供了一种结构化数据的指纹校验方法,该方法包括:提取待校验结构化数据中的指纹信息;检测所述指纹信息与预置二维数据表中的指纹信息之间是否符合预设指纹相似条件;若符合,则确定所述待校验结构化数据为内容相似数据。依据本专利技术另一个方面,提供了一种结构化数据的指纹校验装置,该装置包括:提取单元,用于提取待校验结构化数据中的指纹信息;检测单元,用于检测所述提取单元提取的指纹信息与预置二维数据表中的指纹信息之间是否符合预设指纹相似条件;确定单元,用于若所述检测单元检测出所述指纹信息与预置二维数据表中的指纹信息之间符合预设指纹相似条件,则确定所述待校验结构化数据为内容相似数据。借由上述技术方案, ...
【技术保护点】
1.一种结构化数据的指纹校验方法,其特征在于,包括:提取待校验结构化数据中的指纹信息,包括:将所述待校验结构化数据转换为二维数据表,计算所述二维数据表中每个单元格数据对应的哈希值,作为提取的指纹信息;检测所述指纹信息与预置二维数据表中的指纹信息之间是否符合预设指纹相似条件,具体包括:根据所述每个单元格数据在所述二维数据表中的所在位置,将所述每个单元格数据对应的哈希值与预置二维数据表中每个单元格数据对应的哈希值分别进行匹配;当所述二维数据表中存在与所述预置二维数据表中任意预设行数的任意预设列数的所述哈希值匹配的单元格数据时,确定所述指纹信息与所述预置二维数据表中的指纹信息之间符合所述预设指纹相似条件;若符合,则确定所述待校验结构化数据为内容相似数据。
【技术特征摘要】
1.一种结构化数据的指纹校验方法,其特征在于,包括:提取待校验结构化数据中的指纹信息,包括:将所述待校验结构化数据转换为二维数据表,计算所述二维数据表中每个单元格数据对应的哈希值,作为提取的指纹信息;检测所述指纹信息与预置二维数据表中的指纹信息之间是否符合预设指纹相似条件,具体包括:根据所述每个单元格数据在所述二维数据表中的所在位置,将所述每个单元格数据对应的哈希值与预置二维数据表中每个单元格数据对应的哈希值分别进行匹配;当所述二维数据表中存在与所述预置二维数据表中任意预设行数的任意预设列数的所述哈希值匹配的单元格数据时,确定所述指纹信息与所述预置二维数据表中的指纹信息之间符合所述预设指纹相似条件;若符合,则确定所述待校验结构化数据为内容相似数据。2.根据权利要求1所述的结构化数据的指纹校验方法,其特征在于,所述检测所述指纹信息与预置二维数据表中的指纹信息之间是否符合预设指纹相似条件包括:检测所述二维数据表中是否存在与预置二维数据表中的一个单元格数据相同哈希值的单元格数据;若存在所述相同哈希值的单元格数据,则获取所述单元格数据在所述二维数据表中所在行的每个单元格数据的哈希值;根据所述预置二维数据表中相同哈希值的单元格数据的所在位置,按照所述每个单元格数据相应的排列顺序,将所述每个单元格数据的哈希值与所述预置二维数据表中相对应行位置的每个单元格数据的哈希值分别进行匹配;根据所述行对应的匹配结果,确定所述指纹信息与所述预置二维数据表中的指纹信息之间是否符合所述预设指纹相似条件。3.根据权利要求2所述的结构化数据的指纹校验方法,其特征在于,所述根据所述行对应的匹配结果,确定所述检测所述指纹信息与所述预置二维数据表中的指纹信息之间是否符合所述预设指纹相似条件包括:当所述哈希值匹配的列个数大于或等于预设列个数阈值时,记录所述二维数据表中的所述行对应的标识信息;检测记录的标识信息的个数是否大于或等于预置行数阈值;若所述个数大于或等于所述预置行数阈值,则确定所述指纹信息与所述预置二维数据表中的指纹信息之间符合所述预设指纹相似条件。4.根据权利要求2所述的结构化数据的指纹校验方法,其特征在于,所述检测所述二维数据表中是否存在与预置二维数据表中的一个单元格数据相同哈希值的单元格数据之后,所述方法还包括:若存在所述相同哈希值的单元格数据,则获取所述单元格数据在所述二维数据表中所在列的每个单元格数据的哈希值;根据所述预置二维数据表中相同哈希值的单元格数据的所在位置,按照所述每个单元格数据相应的排列顺序,将所述每个单元格数据的哈希值与所述预置二维数据表中相对应列位置的每个单元格数据的哈希值分别进行匹配;根据所述列对应的匹配结果,确定所述指纹信息与所述预置二维数据表中的指纹信息之间是否符合所述预设指纹相似条件。5.根据权利要求4所述的结构化数据的指纹校验方法,其特征在于,所述根据所述列对应的匹配结果,确定所述检测所述指纹信息与所述预置二维数据表中的指纹信息之间是否符合所述预设指纹相似条件包括:当所述哈希值匹配的行个数大于或等于预设行个数阈值时,记录所述二维数据表中的所述列对应的标识信息;检测记录的标识信息的个数是否大于或等于预置列数阈值;若所述个数大于或等于所述预置列数阈值,则确定所述指纹信息与所述预置二维数据表中的指纹信息之间符合所述预设指纹相似条件。6.一种结构化数据的指纹校验装置,其特征在于,包括:提取单元,用于提取待校验结构化数据中的...
【专利技术属性】
技术研发人员:朱细智,
申请(专利权)人:北京奇虎科技有限公司,北京奇安信科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。