【技术实现步骤摘要】
文档比对方法、装置及设备
本专利技术涉及文档比对技术,尤其涉及一种文档比对方法、装置及设备,属于图书出版领域。
技术介绍
目前,在图书正式出版前,需要对待出版的图书文档进行排版,并多次调整文档版式,以保证出版的图书满足质量要求。在调整文档版式的过程中,需要比对不同版次的文档之间的差异,从而确定是否根据需求对文档进行了修改,以及是否存在错误修改的问题。现有技术中,比对不同版次的文档差异性的处理过程是由人工完成的。但是,人工比对存在着误查、漏查等问题,这就导致现有技术中比对不同版次的文档之间的差异的方法存在着准确性低、效率低的问题。
技术实现思路
本专利技术提供一种文档比对方法、装置及设备,用于解决现有技术中比对不同版次的文档之间的差异的方法存在着准确性低、效率低的问题。本专利技术的第一个方面是提供一种文档比对方法,包括:接收第一文档、第二文档;根据所述第一文档、所述第二文档分别生成第一小页集合、第二小页集合;基于预设规则,根据第一小页的内容生成与所述第一小页对应的第一校验码,根据第二小页的内容生成与所述第二小页对应的第二校验码;获取所述第一小页与所述第二小页的对应关系,并比对具有对应关系的第一小页与第二小页的校验码是否相同,若是,则确定所述第一小页、所述第二小页内容相同,否则确定第一小页、第二小页的内容不同。本专利技术的另一个方面是提供一种文档比对装置,包括:接收模块,用于接收第一文档、第二文档;第一生成模块,用于根据所述第一文档、所述第二文档分别生成第一小页集合、第二小页集合;第二生成模块,用于基于预设规则,根据第一小页的内容生成与所述第一小页对应的第一校验码 ...
【技术保护点】
1.一种文档比对方法,其特征在于,包括:接收第一文档、第二文档;根据所述第一文档、所述第二文档分别生成第一小页集合、第二小页集合;基于预设规则,根据第一小页的内容生成与所述第一小页对应的第一校验码,根据第二小页的内容生成与所述第二小页对应的第二校验码;获取所述第一小页与所述第二小页的对应关系,并比对具有对应关系的第一小页与第二小页的校验码是否相同,若是,则确定所述第一小页、所述第二小页内容相同,否则确定第一小页、第二小页的内容不同。
【技术特征摘要】
1.一种文档比对方法,其特征在于,包括:接收第一文档、第二文档;根据所述第一文档、所述第二文档分别生成第一小页集合、第二小页集合;基于预设规则,根据第一小页的内容生成与所述第一小页对应的第一校验码,根据第二小页的内容生成与所述第二小页对应的第二校验码;获取所述第一小页与所述第二小页的对应关系,并比对具有对应关系的第一小页与第二小页的校验码是否相同,若是,则确定所述第一小页、所述第二小页内容相同,否则确定第一小页、第二小页的内容不同。2.根据权利要求1所述的方法,其特征在于,所述第一小页集合中包括每个所述第一小页的页码信息,所述第二小页集合中包括每个所述第二小页的页码信息;相应的,所述获取所述第一小页与所述第二小页的对应关系,包括:获取所述第一小页的页码信息,获取所述第二小页的页码信息;根据所述第一小页的页码信息以及所述第二小页的页码信息确定所述第一小页与所述第二小页的对应关系。3.根据权利要求1所述的方法,其特征在于,所述获取所述第一小页与所述第二小页的对应关系之前,还包括:比对所述第一小页的第一校验码与所述第二小页的第二校验码,若所述第一校验码与所述第二校验码相同,则确定所述第一小页与所述第二小页对应。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:若未在所述第二小页集合中确定与所述第一小页对应的所述第二小页,则在所述第二小页集合中创建第二空白页,并确定所述第二空白页与所述第一小页对应;和/或,若在确定完所述第一小页所对应的第二小页后,所述第二小页集合中还包括未确定所述对应关系的第二小页,则在所述第一小页集合中创建第一空白页,并确定所述第一空白页与所述第二小页对应。5.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述第一文档、所述第二文档分别生成第一小页集合、第二小页集合之后,包括:根据所述第一小页集合生成第一缩略图集合,根据所述第二小页集合生成第二缩略图集合;相应的,若所述第一小页与所述第二小页的内容不同,则:在所述第一缩略图集合中确定与所述第一小页对应的第一缩略图,在所述第二缩略图集合中确定与所述第二小页对应的第二缩略图;确定所述第一缩略图与所述第二缩略图之间的差异内容。6.根据权利要求5所述的方法,其特征在于,所述确定所述第一缩略图与所述第二缩略图之间的差异内容之前,还包括:接收选择指令,所述选择指令中包括算法标识;相应的,所述确定所述第一缩略图与所述第二缩略图之间的差异内容还包括:根据所述算法标识确定目标算法,并根据所述目标算法确定所述第一缩略图与所述第二缩略图之间的差异内容。7.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述第一文档、所述第二文档分别生成第一小页集合、第二小页集合,包括:根据所述第一文档中的每个页面分别生成标签图像格式的第一小页,根据所述第一小页生成第一小页集合;根据所述第二文档中的每个页面分别生成标签图像格式的第二小页,根据所述第二小页生成第二小页集合。8.一种文档比对装置,其特征在于,包括:接收模块,用于接收第一文档...
【专利技术属性】
技术研发人员:丁兴邦,王力显,郎猛,
申请(专利权)人:北大方正集团有限公司,北京北大方正电子有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。