【技术实现步骤摘要】
一种对多文档图像分割的方法及介质
本专利技术涉及文档处理
,具体地,涉及一种对多文档图像分割的方法及介质。
技术介绍
随着近几年来人工智能尤其是深度学习技术的快速发展,从文档图像中定位和识别文字的应用在准确度方面得到了非常大的提高,从而极大地推动了文档图像文字处理应用的自动化,在很多商业领域(比如财务报销和银行对账)已经取得一定的成功,具有巨大的商业潜力。但是这些应用系统面临一个文档切分的主要技术问题。用户在将纸张的文档(比如出租车票据/购物帐单等)转换成数字图像时,通常会将多张文档不规则地放在一起进行扫描或者拍照。这样得到的数字文档图像中通常包含多张独立的文档,不能直接输入给现有的基于深度学习的图像文档文字检测/识别处理系统进行处理。因此一个实际的图像文档处理系统必须要完成一个切分的任务,也即将单张图像中包含的单个的文档切割分离(切分)处理,并且可选地将单个的文档的方向调整为正常的方向和对每个单个的文档进行分类,使得每个单个的文档能够被图像文档检测/识别处理系统进行处理。多文档图像切分是很多实际文档处理系统中很重要的一个环节。传统的文档切分方法,主要是采用人工进行切分,或者通过提取边缘对文档进行切分。人工切分的方法,成本高,系统处理容量有限,阻碍了实现文档处理系统的全自动化。提取边缘的文档切分方法的系统流程参见图1。这种方法可以通过机器实现,从而实现系统的全自动化。但是提取边缘的切分方法也有很多的不足,包括不够稳健(有些单个文档的边缘不清晰寻找不到正确/完整的边缘)、方法复杂(即使寻找到边缘后也还需要 ...
【技术保护点】
1.一种对多文档图像分割的方法,其特征在于,包括:/n图像分割步骤:对待处理文档图像进行分割,得到分割结果;/n分割结果审查步骤:对分割结果进行分割结果审查;/n所述分割结果审查包括机器审查,通过机器对分割结果进行审查,得到审查结果,并根据所述审查结果判定分割结果是否符合预设要求。/n
【技术特征摘要】
1.一种对多文档图像分割的方法,其特征在于,包括:
图像分割步骤:对待处理文档图像进行分割,得到分割结果;
分割结果审查步骤:对分割结果进行分割结果审查;
所述分割结果审查包括机器审查,通过机器对分割结果进行审查,得到审查结果,并根据所述审查结果判定分割结果是否符合预设要求。
2.根据权利要求1所述的对多文档图像分割的方法,其特征在于,所述机器审查包括如下任一种或任多种审查方式,包括:
置信度机器审查:根据深度学习模型输出的置信度信息进行机器审查;
多模型机器审查:利用多个预训练的深度学习模型进行机器审查;
文本检测机器审查:基于文本检测结果进行机器审查。
3.根据权利要求2所述的对多文档图像分割的方法,其特征在于,所述置信度机器审查包括:根据深度学习模型输出的置信度信息所包含的单个文档分割的置信度,计算出文档图像分割的综合置信度;将文档图像分割的综合置信度与预先设置的阈值进行比较,确定机器分割结果是否正确。
4.根据权利要求2所述的对多文档图像分割的方法,其特征在于,所述多模型机器审查包括:利用多个预训练的深度学习模型,分别对待处理文档图像进行分割,得到各自的文档分割输出结果;然后根据全部文档分割输出结果计算得到文档图像分割的综合置信度,将文档图像分割的综合置信度与预先设置的阈值进行比较,确定机器分割结果是否正确;
所述多个预训练的深度学习模型包括:具有不同深度的、不同网络结构的深度学习模型,其中,所述多个预训练的深度学习模型之间的训练数据集相同、均不同或者部分不同。
5.根据权利要求2所述的对多文档图像分割的方法,其特征在于,所述文本检测机器审查包括:
对所述待处理文档图像进行分割,得到一个或多个的单个文档,并得到各个文档的轮廓作为分割结果;
所述文本检测机器审查,还包括:
--基于机器对待处理文档图像中的文字进行检测,得到文字定位信息,根据所述文字定位信息判断对应的文字是否位于文档的轮廓中,若位于,则判定分割结果正确;否则,则判定分割结果错误;
--基于机器对待处理文档图像中的文字进行检测,得到文字信息,判断所述文字信息与文档轮廓相应位置处的文字是否一致;若一致,则判定分割结果正确;否则,则判定分割结果错误。
6.根据权利要求3所述的对多文档图像分割的方法,其特征在于,所述置...
【专利技术属性】
技术研发人员:周曲,周异,陈凯,何建华,
申请(专利权)人:上海深杳智能科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。