文档比对方法、装置、设备和介质制造方法及图纸

技术编号:37235602 阅读:10 留言:0更新日期:2023-04-20 23:17
本公开实施例提供一种文档比对方法、装置、设备和介质。文档比对方法包括:响应于确定两个待比对文档,判断两个待对比文档的文档格式是否相同;在两个待对比文档的文档格式不同的情况下,对两个待对比文档的渲染显示页面进行拷屏操作,得到对应的两组拷屏图像;对两组拷屏图像分别进行文本识别,得到对应的第一识别文本;比对两组拷屏图像对应的第一识别文本得到第一文本比对结果,并将第一文本比对结果作为两个待比对文档的文档比对结果。采用本公开实施例方案,避免了采用文档格式转换器进行格式转换时引入的转换错误问题,继而避免了因为转换错误造成的文档比对结果与实际结果不同的问题。同的问题。同的问题。

【技术实现步骤摘要】
文档比对方法、装置、设备和介质


[0001]本公开涉及软件测试领域,具体涉及一种文档比对方法、装置、设备和存储介质。

技术介绍

[0002]各种应用软件在使用过程中,均会因为需求的变化和增加而进行软件升级。为了能够实现针对升级后的软件进行适应性的软件测试,测试人员需要确定软件升级改动是否和需求端提供的需求文档是否匹配。前述工作可以通过文档比对实现。
[0003]当前,文档比对多是由人工执行或者文档比对软件执行。在采用对比软件进行比对的情况下,如果两个文档的格式不同,首先需要采用文档格式转换器对其中一个比对文档进行格式转换,得到与另外一个比对文档格式相同的转换文档,再采用转换文档与另一比对文档进行内容比对。但是,由于文档格式转换器转换比对文档可能造成比对文档的内容变换而造成不小的偏差,造成采用转换文档进行内容比对得到的比对结果与实际结果并不相同的问题。在此情况下,仍然需要人工执行内容比对。

技术实现思路

[0004]为了解决上述技术问题,本公开实施例提供一种文档比对方法、装置、设备和介质。
[0005]第一方面,本公开实施例提供一种文档比对方法,包括:
[0006]响应于确定两个待比对文档,判断所述两个待对比文档的文档格式是否相同;
[0007]在所述两个待对比文档的文档格式不同的情况下,对所述两个待对比文档的渲染显示页面进行拷屏操作,得到对应的两组拷屏图像;
[0008]对两组所述拷屏图像分别进行文本识别,得到对应的第一识别文本;
[0009]比对两组所述拷屏图像对应的第一识别文本得到第一文本比对结果,并将所述第一文本比对结果作为所述两个待比对文档的文档比对结果。
[0010]可选的,所述对两组所述拷屏图像分别进行文本识别,得到对应的第一识别文本,包括:
[0011]采用光学字符识别技术分别处理所述两组拷屏图像,得到两组所述拷屏图像中包括的识别字符,以及所述识别字符在所述拷屏图像中的识别位置;
[0012]按照所述识别位置对所述识别字符进行拼接,得到对应的所述第一识别文本。
[0013]可选的,在比对两组所述拷屏图像对应的第一识别文本得到第一文本比对结果之后,所述方法还包括:
[0014]获取所述第一文本比对结果中的差异文本;
[0015]根据所述差异文本在一组所述拷屏图像中的识别位置进行差异标记,形成差异标记图并输出所述差异标记图。
[0016]可选的,在所述两个待对比文档的文档格式不同并且所述两个待比对文档均不是图片格式文档的情况下,所述方法还包括:
[0017]按照一个待比对文档的文档格式对另一待比对文档进行格式转换,得到转换文档;
[0018]将所述转换文档和所述一个待比对文档进行文本内容比对,得到第二文本比对结果;
[0019]所述将第一文本比对结果作为所述两个待比对文档的文档比对结果包括:
[0020]对所述第一文本比对结果和所述第二文本比对结果进行综合,将综合后的文本比对结果作为所述两个待比对文档的文档比对结果。
[0021]可选的,在所述比对两组所述拷屏图像对应的第一识别文本得到第一文本比对结果之前,所述方法还包括:
[0022]对两组所述拷屏图像进行图像相似度计算,确定两组所述拷屏图像的图像相似度;
[0023]在所述图像相似度大于预设相似度的情况下,执行所述比对比对两组所述拷屏图像对应的第一识别文本得到第一文本比对结果的操作。
[0024]可选的,所述对两组所述拷屏图像进行图像相似度计算,确定两组所述拷屏图像的图像相似度,包括:
[0025]采用预先训练的图像识别模型处理所述两组拷屏图像,得到所述两组拷屏图像中的文本对象检测框;
[0026]计算所述两组拷屏图像中文本对象检测框的灰度梯度向量;
[0027]采用所述灰度梯度向量进行所述文本对象检测框的相似度匹配,并根据匹配后的文本对象检测框的灰度梯度向量的差值确定两组所述拷屏图像的图像相似度。
[0028]可选的,所述确定两个待比对文档,包括:
[0029]响应于接收到用户上传的一个待比对文档,向所述用户显示文档版本查询界面,所述文档版本查询界面用于向用户展示待查询的文档版本;
[0030]响应于所述用户在文档版本查询界面中针对目标文档的选定操作,将所述目标文档作为另一待比对文档。
[0031]第二方面,本公开实施例提供一种文档比对装置,包括:
[0032]格式比对单元,用于响应于接收到两个待比对文档,判断所述两个待对比文档的文档格式是否相同;
[0033]拷屏单元,用于在所述两个待对比文档的文档格式不同的情况下,对所述两个待对比文档的渲染显示页面进行拷屏操,得到对应的两组拷屏图像;
[0034]文本识别单元,用于对两组所述拷屏图像分别进行文本识别,得到对应的第一识别文本;
[0035]文档比对单元,用于比对两组所述拷屏图像对应的第一识别文本得到第一文本比对结果,并将所述第一文本比对结果作为所述两个待比对文档的文档比对结果。
[0036]第三方面,本公开实施例提供一种计算设备,包括处理器和存储器,所述存储器用于存储计算机程序;所述计算机程序在被所述处理器加载时,使所述处理器执行如前所述的文档比对方法。
[0037]第四方面,本公开实施例提供一种计算机可读存储介质,所述存储介质存储有计算机程序,当计算机程序被处理器执行时,使得处理器实现如前所述的文档比对方法。
[0038]本公开实施例提供的技术方案与现有技术相比具有如下优点:
[0039]采用本公开实施例提供的方案,在判定两个待比对文档的文档格式不同的情况下,通过对两个待比对文档的渲染显示页面进行拷屏操作,得到两组拷屏图像之后,在对拷屏图像进行文本识别,得到对应的第一识别文本。在得到两组拷屏图像对应的第一识别文本,并对两组拷屏图像对应的第一识别文本进行比对得到第一文本比对结果后,可以将第一文本比对结果作为两个待比对文档的文档比对结果。如此,无需采用文档格式转换器进行文档格式转换,就实现了两个待比对文档内容的比对并得到了文档比对结果,避免了采用文档格式转换器进行格式转换时引入的转换错误问题,继而避免了因为转换错误造成的文档比对结果与实际结果不同的问题。
附图说明
[0040]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
[0041]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图,其中:
[0042]图1是本公开实施例提供的文档比对方法流程图;
[0043]图2是本公开另外一个实施例提供的文档比对方法流程图;
[0044]图3是本公开一些实施例提供的文档比对方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文档比对方法,其特征在于,包括:响应于确定两个待比对文档,判断所述两个待对比文档的文档格式是否相同;在所述两个待对比文档的文档格式不同的情况下,对所述两个待对比文档的渲染显示页面进行拷屏操作,得到对应的两组拷屏图像;对两组所述拷屏图像分别进行文本识别,得到对应的第一识别文本;比对两组所述拷屏图像对应的第一识别文本得到第一文本比对结果,并基于所述第一文本比对结果确定所述两个待比对文档的文档比对结果。2.根据权利要求1所述的方法,其特征在于,所述对两组所述拷屏图像分别进行文本识别,得到对应的第一识别文本,包括:采用光学字符识别技术分别处理所述两组拷屏图像,得到两组所述拷屏图像中包括的识别字符,以及所述识别字符在所述拷屏图像中的识别位置;按照所述识别位置对所述识别字符进行拼接,得到对应的所述第一识别文本。3.根据权利要求2所述的方法,其特征在于,所述基于所述第一文本比对结果确定所述两个待比对文档的文档比对结果,包括:获取所述第一文本比对结果中的差异文本;根据所述差异文本在一组所述拷屏图像中的识别位置进行差异标记,形成差异标记图并将所述差异标记图作为所述文档比对结果输出。4.根据权利要求1

3任一项所述的方法,其特征在于,在所述两个待对比文档的文档格式不同并且所述两个待比对文档均不是图片格式文档的情况下,所述方法还包括:按照一个待比对文档的文档格式对另一待比对文档进行格式转换,得到转换文档;将所述转换文档和所述一个待比对文档进行文本内容比对,得到第二文本比对结果;所述将第一文本比对结果作为所述两个待比对文档的文档比对结果包括:对所述第一文本比对结果和所述第二文本比对结果进行综合,将综合后的文本比对结果作为所述两个待比对文档的文档比对结果。5.根据权利要求1

3任一项所述的方法,其特征在于,在所述比对两组所述拷屏图像对应的第一识别文本得到第一文本比对结果之前...

【专利技术属性】
技术研发人员:李良斌
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1