文档质量检测方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:35656471 阅读:21 留言:0更新日期:2022-11-19 16:53
本发明专利技术公开了一种文档质量检测方法、装置、计算机设备及存储介质,该文档质量检测方法,包括:获取待检测文档图像;对待检测文档图像进行文本块提取,获取至少两个目标文本块;对至少两个目标文本块进行拼接处理,获取目标检测文档图像;采用预先训练的文档检测模型对目标检测文档图像进行空间特征融合处理,获取空间融合特征;根据空间融合特征,获取待检测文档图像对应的文档质量评分。本技术方案结合目标文本块在空间位置这一维度,对待检测文档图像进行质量检测,使文档质量检测更加趋近于人工检测的效果,提高文档质量检测的准确性。提高文档质量检测的准确性。提高文档质量检测的准确性。

【技术实现步骤摘要】
文档质量检测方法、装置、计算机设备及存储介质


[0001]本专利技术涉及图像处理
,尤其涉及一种文档质量检测方法、装置、计算机设备及存储介质。

技术介绍

[0002]文档资料自动化识别对于提高信息的转储和分析效率至关重要。在一些业务场景中,例如在保险业务中,有大量的文档资料以图片的形式上传,因此,自动化识别文档资料中的信息能够极大的减轻人工录入和核对的负担。
[0003]然而,在对文档资料对应的文档图像进行识别过程中,常常因为上传文档图像的质量太差而不能准确的提取文档资料的信息,所以在对文档资料进行信息提取前,需要对质量差的文档图像进行拦截,及时的通知用户重新上传质量符合要求的文档图像,提高整体流程的流转效率。
[0004]传统的文档质量分析方法通常是直接对整张文档图像进行质量检测,容易使文档图像的背景区域对文档图像的质量评价造成干扰,影响文档质量检测的准确性。

技术实现思路

[0005]本专利技术实施例提供一种文档质量检测方法、装置、计算机设备及存储介质,以解决文档质量检测的准确性较差的问题。
[0006]一种文档质量检测方法,包括:
[0007]获取待检测文档图像;
[0008]对所述待检测文档图像进行文本块提取,获取至少两个目标文本块;
[0009]对至少两个所述目标文本块进行拼接处理,获取目标检测文档图像;
[0010]采用预先训练的文档检测模型对所述目标检测文档图像进行空间特征融合处理,获取空间融合特征;
[0011]根据所述空间融合特征,获取所述待检测文档图像对应的文档质量评分。
[0012]一种文档质量检测装置,包括:
[0013]图像获取模块,用于获取待检测文档图像;
[0014]文本块提取模块,用于对所述待检测文档图像进行文本块提取,获取至少两个目标文本块;
[0015]拼接处理模块,用于对至少两个所述目标文本块进行拼接处理,获取目标检测文档图像;
[0016]空间融合模块,用于采用预先训练的文档检测模型对所述目标检测文档图像进行空间特征融合处理,获取空间融合特征;
[0017]质量评分模块,用于根据所述空间融合特征,获取所述待检测文档图像对应的文档质量评分。
[0018]一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理
器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述文档质量检测方法。
[0019]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述文档质量检测方法。
[0020]上述文档质量检测方法、装置、计算机设备及存储介质,首先获取待检测文档图像,并对待检测文档图像进行文本块提取,获取至少两个目标文本块,以根据至少两个目标文本块进行文档质量检测,避免对整个待检测文档图像进行检测,从而避免待检测文档图像中的干扰因素对待检测文档图像的质量检测造成影响,然后对至少两个目标文本块进行拼接处理,获取目标检测文档图像,并采用预先训练的文档检测模型对目标检测文档图像进行空间特征融合处理,获取空间融合特征,最后根据空间融合特征,获取待检测文档图像对应的文档质量评分,结合目标文本块在空间位置这一维度,对待检测文档图像进行质量检测,使文档质量检测更加趋近于人工检测的效果,提高文档质量检测的准确性。
附图说明
[0021]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0022]图1是本专利技术一实施例中文档质量检测方法的一应用环境示意图;
[0023]图2是本专利技术一实施例中文档质量检测方法的一流程图;
[0024]图3是本专利技术一实施例中文档质量检测方法的另一流程图;
[0025]图4是本专利技术一实施例中文档质量检测方法的另一流程图;
[0026]图5是本专利技术一实施例中文档质量检测方法的另一流程图;
[0027]图6是本专利技术一实施例中文档质量检测方法的另一流程图;
[0028]图7是本专利技术一实施例中文档质量检测方法的另一流程图;
[0029]图8是本专利技术一实施例中文档质量检测方法的另一流程图;
[0030]图9是本专利技术一实施例中文档质量检测装置的一示意图;
[0031]图10是本专利技术一实施例中计算机设备的一示意图。
具体实施方式
[0032]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0033]本专利技术实施例提供的文档质量检测方法,该文档质量检测方法可应用如图1所示的应用环境中。具体地,该文档质量检测方法应用在文档质量检测系统中,该文档质量检测系统包括如图1所示的客户端和服务器,客户端与服务器通过网络进行通信,用于提高文档质量检测的准确性。其中,客户端又称为用户端,是指与服务器相对应,为客户提供本地服务的程序。客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来
实现。
[0034]在一实施例中,如图2所示,提供一种文档质量检测方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
[0035]S201:获取待检测文档图像。
[0036]S202:对待检测文档图像进行文本块提取,获取至少两个目标文本块。
[0037]S203:对至少两个目标文本块进行拼接处理,获取目标检测文档图像。
[0038]S204:采用预先训练的文档检测模型对目标检测文档图像进行空间特征融合处理,获取空间融合特征。
[0039]S205:根据空间融合特征,获取待检测文档图像对应的文档质量评分。
[0040]其中,待检测文档图像是指需要进行文档质量检测的文档图像。该文档图像可以为对纸质文档进行拍摄或扫描所形成的图像。该纸质文档可以是不同业务场景中的文档。示例性地,该业务场景可以是保险业务、银行业务或者其他需要识别大量纸质文档的业务场景。
[0041]作为一示例,在步骤S201中,服务器可获取用户触发的待检测文档图像,例如,可接收客户端发送的文档质量检测请求,根据文档质量检测请求获取待检测文档图像。其中,该文档质量检测请求是指指示服务器进行文档质量检测的请求。可选地,该文档质量检测请求可以包括该待检测文档图像或者该待检测文档图像对应的数据库地址,即服务器可以直接从文档质量检测请求获取该待检测文档图像,也可以根据该数据库地址,从数据库中获取该待检测文档本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文档质量检测方法,其特征在于,包括:获取待检测文档图像;对所述待检测文档图像进行文本块提取,获取至少两个目标文本块;对至少两个所述目标文本块进行拼接处理,获取目标检测文档图像;采用预先训练的文档检测模型对所述目标检测文档图像进行空间特征融合处理,获取空间融合特征;根据所述空间融合特征,获取所述待检测文档图像对应的文档质量评分。2.如权利要求1所述的文档质量检测方法,其特征在于,所述对所述待检测文档图像进行文本块提取,获取至少两个目标文本块,包括:对所述待检测文档图像进行文本框检测,获取至少两个文本框图像,并获取每一所述文本框图像对应的中心坐标和文本框大小;基于每一所述文本框图像对应的中心坐标和文本框大小,对每一所述文本框图像进行文本块提取,获取每一所述文本框图像对应的目标文本块。3.如权利要求2所述的文档质量检测方法,其特征在于,所述基于每一所述文本框图像对应的中心坐标和文本框大小,对每一所述文本框图像进行文本块提取,获取每一所述文本框图像对应的目标文本块,包括:基于每一所述文本框图像对应的中心坐标和文本框大小,确定每一所述文本框图像中的目标提取位置;基于每一所述文本框图像中的目标提取位置和预设块大小阈值,获取,获取每一所述文本框图像对应的目标文本块。4.如权利要求1所述的文档质量检测方法,其特征在于,所述对至少两个所述目标文本块进行拼接处理,获取目标检测文档图像,包括:对至少两个所述目标文本块进行预处理,获取至少两个文本处理块;获取每一所述文本处理块对应的中心坐标,并基于所述文本处理块对应的中心坐标,确定目标空间位置顺序;基于所述目标空间位置顺序,对至少两个所述文本处理块进行顺序调整和通道拼接,获取目标检测文档图像。5.如权利要求1所述的文档质量检测方法,其特征在于,所述采用预先训练的文档检测模型对所述目标检测文档图像进行空间特征融合处理,获取空间融合特征,包括:采用单通道分割模块对所述目标检测文档图像...

【专利技术属性】
技术研发人员:冷绵绵
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1