文档比对方法、装置及设备制造方法及图纸

技术编号:22418218 阅读:58 留言:0更新日期:2019-10-30 02:02
本发明专利技术提供一种文档比对方法、装置及设备。方法包括:接收第一文档、第二文档;根据第一文档、第二文档分别生成第一小页集合、第二小页集合;基于预设规则,根据第一小页的内容生成与第一小页对应的第一校验码,根据第二小页的内容生成与第二小页对应的第二校验码;获取第一小页与第二小页的对应关系,并比对具有对应关系的第一小页与第二小页的校验码是否相同,若是,则确定第一小页、第二小页内容相同,否则确定第一小页、第二小页的内容不同。本实施例提供的方法、装置及设备无需人工对各个小页是否进行了修改逐一进行比对,就能够确定文档间的差异,从而提高了比对文档差异的效率,同时,还能够提高比对文档差异的准确率。

【技术实现步骤摘要】
文档比对方法、装置及设备
本专利技术涉及文档比对技术,尤其涉及一种文档比对方法、装置及设备,属于图书出版领域。
技术介绍
目前,在图书正式出版前,需要对待出版的图书文档进行排版,并多次调整文档版式,以保证出版的图书满足质量要求。在调整文档版式的过程中,需要比对不同版次的文档之间的差异,从而确定是否根据需求对文档进行了修改,以及是否存在错误修改的问题。现有技术中,比对不同版次的文档差异性的处理过程是由人工完成的。但是,人工比对存在着误查、漏查等问题,这就导致现有技术中比对不同版次的文档之间的差异的方法存在着准确性低、效率低的问题。
技术实现思路
本专利技术提供一种文档比对方法、装置及设备,用于解决现有技术中比对不同版次的文档之间的差异的方法存在着准确性低、效率低的问题。本专利技术的第一个方面是提供一种文档比对方法,包括:接收第一文档、第二文档;根据所述第一文档、所述第二文档分别生成第一小页集合、第二小页集合;基于预设规则,根据第一小页的内容生成与所述第一小页对应的第一校验码,根据第二小页的内容生成与所述第二小页对应的第二校验码;获取所述第一小页与所述第二小页的对应关系,并比对具有对应关系的第一小页与第二小页的校验码是否相同,若是,则确定所述第一小页、所述第二小页内容相同,否则确定第一小页、第二小页的内容不同。本专利技术的另一个方面是提供一种文档比对装置,包括:接收模块,用于接收第一文档、第二文档;第一生成模块,用于根据所述第一文档、所述第二文档分别生成第一小页集合、第二小页集合;第二生成模块,用于基于预设规则,根据第一小页的内容生成与所述第一小页对应的第一校验码,根据第二小页的内容生成与所述第二小页对应的第二校验码;获取模块,用于获取所述第一小页与所述第二小页的对应关系;比对模块,用于比对具有对应关系的第一小页与第二小页的校验码是否相同,若是,则确定所述第一小页、所述第二小页内容相同,否则确定第一小页、第二小页的内容不同。本专利技术的又一个方面是提供一种文档比对设备,包括:存储器;处理器;以及计算机程序;其中,所述计算机程序存储在所述存储器中,并配置为由所述处理器执行以实现如上述第一方面所述的文档比对方法。本专利技术提供的文档比对方法、装置及设备的技术效果是:本专利技术提供的文档比对方法、装置及设备包括接收第一文档、第二文档;根据第一文档、第二文档分别生成第一小页集合、第二小页集合;基于预设规则,根据第一小页的内容生成与第一小页对应的第一校验码,根据第二小页的内容生成与第二小页对应的第二校验码;获取第一小页与第二小页的对应关系,并比对具有对应关系的第一小页与第二小页的校验码是否相同,若是,则确定第一小页、第二小页内容相同,否则确定第一小页、第二小页的内容不同。本专利技术提供的文档比对方法、装置及设备能够通过比对用户输入的第一文档、第二文档的小页校验码是否相同,确定第一文档、第二文档的小页之间是否相同,无需人工对各个小页是否进行了修改逐一进行比对,从而提高了比对文档差异的效率,同时,还能够提高比对文档差异的准确率。附图说明图1为本专利技术一示例性实施例示出的文档比对方法的流程图;图2为本专利技术另一示例性实施例示出的文档比对方法的流程图;图2A为本专利技术另一示例性实施例示出的文档内容差异的示意图;图3为本专利技术又一示例性实施例示出的文档比对方法的流程图;图3A为本专利技术一示例性实施例示出文档比对自动插页示意图;图4为本专利技术一示例性实施例示出的文档比对装置的结构图;图5为本专利技术另一示例性实施例示出的文档比对装置的结构图。具体实施方式图1为本专利技术一示例性实施例示出的文档比对方法的流程图。如图1所示,本实施例提供的文档比对方法包括:步骤101,接收第一文档、第二文档。其中,用户可以主动提交第一文档以及第二文档,第一文档和第二文档是指用户选择的两个文档,该文档可以相同也可以不同,用户可以先上传第一文档,也可以先上传第二文档,还可以同时上传第一文档和第二文档。例如,用户可以通过将文档拖拽到操作界面中的方式上传文档,也可以通过操作界面中的上传按钮,选择第一文档和/或第二文档的方式上传该文档。步骤102,根据第一文档、第二文档分别生成第一小页集合、第二小页集合。一般来说,文档中包括多个页面,因此,可以根据文档的各个页面生成小页集合。例如,若文档是DOC格式,则可以将其拆分为多个DOC页面,并将根据第一文档拆分出的多个页面作为第一小页集合,将根据第二文档拆分出的多个页面作为第二小页集合。具体的,还可以将接收的文档转换为PDF(PortableDocumentFormat,便携式文档格式)格式,并将PDF文档拆分为多个小页,再将根据第一文档得到的小页作为第一小页集合,将根据第二文档得到的小页作为第二小页集合。若接收的文档本身即为PDF格式,则不需要对其再进行格式转换。进一步的,还可以将PDF格式的文档分别生成页面预览图,并将每个页面预览图都转换为TIFF(TagImageFileFormat,标签图像文件格式)格式,即每个页面都对应一个TIFF图,再将根据第一文档得到的TIFF图作为第一小页集合,将根据第二文档得到的TIFF图作为第二小页集合。实际应用时,还可以为集合中的各个小页命名。可以预先设定命名规则,例如,用版次与页码组合的方式命名,如提交的文档是第五版,则可以将其小页分别命名为“五_1、五_2”等。另外,还可以采用页面与随机码组合的方式为各个小页命名,例如“页码_随机码”,其中,可以根据文件随机内容生成的包括数字和字母的随机码。为了便于查找不同文档的小页,还可以生成不同文档所对应的文件夹,并为该文件夹设定唯一的编码名称。例如,第五版次的文档所对应的文件夹为105,并将该版次文档所对应的小页存放在文件夹内。当然,也可以按照其他规则命名该文件夹,例如上传文档的次数等。其中,还可以接收用户输入的页面选择指令,并将用户选择的小页作为第一小页和第二小页。例如,用户仅希望比对文档的前五页,则可以选择第一文档以及第二文档的前五页,则将第一文档的前五页作为第一小页,第二文档的前五页作为第二小页,在这种应用场景下,后续执行的步骤中所提及的第一小页以及第二小页则为用户选择的页面。步骤103,基于预设规则,根据第一小页的内容生成与第一小页对应的第一校验码,根据第二小页的内容生成与第二小页对应的第二校验码。具体的,基于相同的预设规则,根据第一小页和第二小页的内容生成第一校验码以及第二校验码。由于采用的规则相同,若第一小页与第二小页的内容相同,则生成的校验码也相同。进一步的,预设规则可以是MD5(MessageDigestAlgorithmMD5,消息摘要算法第五版)算法。步骤104,获取第一小页与第二小页的对应关系。进一步的,当第一小页集合与第二小页集合中均包括多个小页时,需要获取第一小页与第二小页的对应关系。实际应用时,若小页名称中包括页码信息,可以通过获取页码信息的方式确定二者的对应关系。另外,由于在调整文档版式时,存在着增/删页的情况,此时还可以通过获取各个小页的校验码的方式确定其对应关系,例如,第一小页5与第二小页4的校验码相同,则认为二者对应。其中,还可以由用户手动确定页码对应关系。此时可以读取用户输入的对应指令,并根据用户输入的对应指令确定第一小页与第二小页的对本文档来自技高网...

【技术保护点】
1.一种文档比对方法,其特征在于,包括:接收第一文档、第二文档;根据所述第一文档、所述第二文档分别生成第一小页集合、第二小页集合;基于预设规则,根据第一小页的内容生成与所述第一小页对应的第一校验码,根据第二小页的内容生成与所述第二小页对应的第二校验码;获取所述第一小页与所述第二小页的对应关系,并比对具有对应关系的第一小页与第二小页的校验码是否相同,若是,则确定所述第一小页、所述第二小页内容相同,否则确定第一小页、第二小页的内容不同。

【技术特征摘要】
1.一种文档比对方法,其特征在于,包括:接收第一文档、第二文档;根据所述第一文档、所述第二文档分别生成第一小页集合、第二小页集合;基于预设规则,根据第一小页的内容生成与所述第一小页对应的第一校验码,根据第二小页的内容生成与所述第二小页对应的第二校验码;获取所述第一小页与所述第二小页的对应关系,并比对具有对应关系的第一小页与第二小页的校验码是否相同,若是,则确定所述第一小页、所述第二小页内容相同,否则确定第一小页、第二小页的内容不同。2.根据权利要求1所述的方法,其特征在于,所述第一小页集合中包括每个所述第一小页的页码信息,所述第二小页集合中包括每个所述第二小页的页码信息;相应的,所述获取所述第一小页与所述第二小页的对应关系,包括:获取所述第一小页的页码信息,获取所述第二小页的页码信息;根据所述第一小页的页码信息以及所述第二小页的页码信息确定所述第一小页与所述第二小页的对应关系。3.根据权利要求1所述的方法,其特征在于,所述获取所述第一小页与所述第二小页的对应关系之前,还包括:比对所述第一小页的第一校验码与所述第二小页的第二校验码,若所述第一校验码与所述第二校验码相同,则确定所述第一小页与所述第二小页对应。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:若未在所述第二小页集合中确定与所述第一小页对应的所述第二小页,则在所述第二小页集合中创建第二空白页,并确定所述第二空白页与所述第一小页对应;和/或,若在确定完所述第一小页所对应的第二小页后,所述第二小页集合中还包括未确定所述对应关系的第二小页,则在所述第一小页集合中创建第一空白页,并确定所述第一空白页与所述第二小页对应。5.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述第一文档、所述第二文档分别生成第一小页集合、第二小页集合之后,包括:根据所述第一小页集合生成第一缩略图集合,根据所述第二小页集合生成第二缩略图集合;相应的,若所述第一小页与所述第二小页的内容不同,则:在所述第一缩略图集合中确定与所述第一小页对应的第一缩略图,在所述第二缩略图集合中确定与所述第二小页对应的第二缩略图;确定所述第一缩略图与所述第二缩略图之间的差异内容。6.根据权利要求5所述的方法,其特征在于,所述确定所述第一缩略图与所述第二缩略图之间的差异内容之前,还包括:接收选择指令,所述选择指令中包括算法标识;相应的,所述确定所述第一缩略图与所述第二缩略图之间的差异内容还包括:根据所述算法标识确定目标算法,并根据所述目标算法确定所述第一缩略图与所述第二缩略图之间的差异内容。7.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述第一文档、所述第二文档分别生成第一小页集合、第二小页集合,包括:根据所述第一文档中的每个页面分别生成标签图像格式的第一小页,根据所述第一小页生成第一小页集合;根据所述第二文档中的每个页面分别生成标签图像格式的第二小页,根据所述第二小页生成第二小页集合。8.一种文档比对装置,其特征在于,包括:接收模块,用于接收第一文档...

【专利技术属性】
技术研发人员:丁兴邦王力显郎猛
申请(专利权)人:北大方正集团有限公司北京北大方正电子有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1