数据处理方法及装置、介质和计算设备制造方法及图纸

技术编号:21454670 阅读:26 留言:0更新日期:2019-06-26 05:00
本发明专利技术的实施方式提供了一种数据处理方法,包括:将图像输入神经网络,以提取用于对图像纠偏的目标特征,其中,图像包括多个指定对象,每个指定对象具有对应的方向和偏移量;基于目标特征,获得每个指定对象的初始方向和初始偏移量;对每个指定对象的初始方向和初始偏移量进行数据处理,以确定图像的目标方向和目标偏移量;以及基于目标方向和目标偏移量,对图像纠偏。通过基于神经网络提取的目标特征,对图像包含的每个指定对象的初始方向和在该方向上的初始偏移量进行数据处理,以确定图像的目标方向和目标偏移量,可以提高方向和偏移量的预测结果,提高文字识别的精度。此外,本发明专利技术的实施方式还提供了一种数据处理装置、介质和计算设备。

【技术实现步骤摘要】
数据处理方法及装置、介质和计算设备
本专利技术的实施方式涉及图像处理领域,更具体地,本专利技术的实施方式涉及数据处理方法及装置、介质和计算设备。
技术介绍
本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。在整个文字识别,如光学字符识别(OpticalCharacterRecognition,简称为OCR)领域,用户拍摄图像中的文字角度对最终OCR效果的影响非常大,其中,在文字水平的情况下,文字识别系统的识别准确率最高。因此,为了保证系统对图像中文字识别的精度,需要根据用户输入图像中的文字方向对图像进行纠偏处理,使得纠偏后的图像中的文字角度对最终OCR效果的影响尽可能小。目前,也已经出现了一些对用户输入图像中的文字方向进行图像纠偏的方法。
技术实现思路
然而,在实现本专利技术构思的过程中,专利技术人发现相关技术提供的图像纠偏方法,受制于算法的局限性,使得对图像中文字最终预测方向和偏移量的估算准确度较低,直接影响最终OCR效果,导致图像中的文字识别精度不高。为此,非常需要一种改进的数据处理方法,以克服相关技术的图像纠偏算法导致的上述技术问题,以提高对图像中文字最终预测方向和偏移量的估算准确度,使得纠偏后的图像中的文字角度对最终OCR效果的影响尽可能小,给用户提供更准确的文字识别结果。在本上下文中,本专利技术的实施方式期望提供一种准确地预估图像的纠偏角度和偏移量的数据处理方法及装置、介质和计算设备。在本专利技术实施方式的第一方面中,提供了一种数据处理方法,包括:将图像输入神经网络,以提取用于对上述图像纠偏的目标特征,其中,上述图像包括多个指定对象,每个指定对象具有对应的方向和偏移量;基于上述目标特征,获得上述每个指定对象的初始方向和初始偏移量;对上述每个指定对象的初始方向和初始偏移量进行数据处理,以确定上述图像的目标方向和目标偏移量;以及基于上述目标方向和目标偏移量,对上述图像纠偏。在本专利技术的一个实施例中,上述对上述每个指定对象的初始方向和初始偏移量进行数据处理,以确定上述图像的目标方向和目标偏移量包括:对上述每个指定对象的初始方向进行数据处理,以统计出上述每个指定对象的初始方向中占比最大的初始方向;将上述占比最大的初始方向,确定为上述图像的目标方向;以及基于初始方向为上述目标方向的指定对象的初始偏移量,确定上述图像的目标偏移量。在本专利技术的另一实施例中,上述基于初始方向为上述目标方向的指定对象的初始偏移量,确定上述图像的目标偏移量包括:按照预设步长,构建多个偏移量区间;将上述初始方向为上述目标方向的指定对象的初始偏移量离散化至上述多个偏移量区间,以统计每个偏移量区间对应的计数;以及基于计数最多的偏移量区间对应的初始偏移量的均值,确定上述图像的目标偏移量。在本专利技术的又一个实施例中,上述目标特征具有特定大小,基于上述目标特征,获得上述每个指定对象的初始方向和初始偏移量包括:针对特定大小的上述目标特征的每个位置,获取上述每个位置对应的初始方向和初始偏移量;以及基于上述每个位置对应的初始方向和初始偏移量,确定上述每个指定对象的初始方向和初始偏移量。在本专利技术的再一个实施例中,上述方法还包括:确定上述图像中多个对象中每个对象落在上述目标特征对应的上述图像中的置信度;以及将置信度大于或等于置信度阈值的对象确定为上述指定对象。在本专利技术的再又一个实施例中,上述方法还包括:在将图像输入神经网络之前,预处理上述图像,以得到具有预定尺寸的目标图像;以及将图像输入神经网络包括:将上述具有预定尺寸的目标图像输入上述神经网络。在本专利技术实施方式的第二方面中,提供了一种介质,存储有计算机可执行指令,上述指令在被处理单元执行时用于实现上述任一项上述的方法。在本专利技术实施方式的第三方面中,提供了一种数据处理装置,包括:提取模块,配置为将图像输入神经网络,以提取用于对上述图像纠偏的目标特征,其中,上述图像包括多个指定对象,每个指定对象具有对应的方向和偏移量;获得模块,配置为基于上述目标特征,获得上述每个指定对象的初始方向和初始偏移量;第一处理模块,配置为对上述每个指定对象的初始方向和初始偏移量进行数据处理,以确定上述图像的目标方向和目标偏移量;以及第二处理模块,配置为基于上述目标方向和目标偏移量,对上述图像纠偏。在本专利技术的一个实施例中,上述第一处理模块包括:统计子模块,配置为对上述每个指定对象的初始方向进行数据处理,以统计出上述每个指定对象的初始方向中占比最大的初始方向;第一确定子模块,配置为将上述占比最大的初始方向,确定为上述图像的目标方向;以及第二确定子模块,配置为基于初始方向为上述目标方向的指定对象的初始偏移量,确定上述图像的目标偏移量。在本专利技术的另一个实施例中,上述第二确定子模块包括:构建单元,配置为按照预设步长,构建多个偏移量区间;统计单元,配置为将上述初始方向为上述目标方向的指定对象的初始偏移量离散化至上述多个偏移量区间,以统计每个偏移量区间对应的计数;以及确定单元,配置为基于计数最多的偏移量区间对应的初始偏移量的均值,确定上述图像的目标偏移量。在本专利技术的又一个实施例中,上述目标特征具有特定大小,上述获得模块包括:获取子模块,配置为针对特定大小的上述目标特征的每个位置,获取上述每个位置对应的初始方向和初始偏移量;以及第三确定子模块,配置为基于上述每个位置对应的初始方向和初始偏移量,确定上述每个指定对象的初始方向和初始偏移量。在本专利技术的再一个实施例中,上述装置还包括:第一确定模块,配置为确定上述图像中多个对象中每个对象落在上述目标特征对应的上述图像中的置信度;以及第二确定模块,配置为将置信度大于或等于置信度阈值的对象确定为上述指定对象。在本专利技术的再一个实施例中,上述装置还包括:第三处理模块,配置为在将图像输入神经网络之前,预处理上述图像,以得到具有预定尺寸的目标图像;以及提取模块,配置为将上述具有预定尺寸的目标图像输入上述神经网络,以提取用于对上述图像纠偏的目标特征。在本专利技术实施方式的第四方面中,提供了一种计算设备,包括:处理单元;以及存储单元,存储有计算机可执行指令,上述指令在被处理单元执行时用于实现上述任一项上述的方法。本专利技术提供了一种基于深度学习(深层神经网络)和物体检测(图像中的指定对象)的图像纠偏框架,可以基于神经网络提取的目标特征,在目标特征上的每一个位置计算图像中包含的每个指定对象的初始方向和在该初始方向上对应的初始偏移量,对初始方向和在该初始方向上对应的初始偏移量进行数据处理分析,确定该图像的目标方向(也称预测方向)和在该目标方向上的目标偏移量(也称预测偏移量),基于确定的目标方向和目标偏移量,确定对该图像进行纠偏任务所对应的图像偏移角度,可以提高对图像进行纠偏任务的方向和偏移量的预测精度。此外,根据该偏移角度旋转图像以实现对该图像的纠偏,可以使得纠偏后图像中的指定对象对最终OCR效果的影响尽可能小,准确性和鲁棒性优于相关技术采用的图像纠偏方法,提高图像中指定对象的识别准确度。附图说明通过参考附图阅读下文的详细描述,本专利技术示例性实施例的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本专利技术的若干实施方式,其中:图1示意性地示出了根据本专利技术本文档来自技高网...

【技术保护点】
1.一种数据处理方法,包括:将图像输入神经网络,以提取用于对所述图像纠偏的目标特征,其中,所述图像包括多个指定对象,每个指定对象具有对应的方向和偏移量;基于所述目标特征,获得所述每个指定对象的初始方向和初始偏移量;对所述每个指定对象的初始方向和初始偏移量进行数据处理,以确定所述图像的目标方向和目标偏移量;以及基于所述目标方向和目标偏移量,对所述图像纠偏。

【技术特征摘要】
1.一种数据处理方法,包括:将图像输入神经网络,以提取用于对所述图像纠偏的目标特征,其中,所述图像包括多个指定对象,每个指定对象具有对应的方向和偏移量;基于所述目标特征,获得所述每个指定对象的初始方向和初始偏移量;对所述每个指定对象的初始方向和初始偏移量进行数据处理,以确定所述图像的目标方向和目标偏移量;以及基于所述目标方向和目标偏移量,对所述图像纠偏。2.根据权利要求1所述的方法,其中,所述对所述每个指定对象的初始方向和初始偏移量进行数据处理,以确定所述图像的目标方向和目标偏移量包括:对所述每个指定对象的初始方向进行数据处理,以统计出所述每个指定对象的初始方向中占比最大的初始方向;将所述占比最大的初始方向,确定为所述图像的目标方向;以及基于初始方向为所述目标方向的指定对象的初始偏移量,确定所述图像的目标偏移量。3.根据权利要求2所述的方法,其中,所述基于初始方向为所述目标方向的指定对象的初始偏移量,确定所述图像的目标偏移量包括:按照预设步长,构建多个偏移量区间;将所述初始方向为所述目标方向的指定对象的初始偏移量离散化至所述多个偏移量区间,以统计每个偏移量区间对应的计数;以及基于计数最多的偏移量区间对应的初始偏移量的均值,确定所述图像的目标偏移量。4.根据权利要求1所述的方法,其中,所述目标特征具有特定大小,基于所述目标特征,获得所述每个指定对象的初始方向和初始偏移量包括:针对特定大小的所述目标特征的每个位置,获取所述每个位置对应的初始方向和初始偏移量;以及基于所述每个位置对应的初始方向和初始偏移量,确定所述每个指定对象的初始方向和初始偏移量。5.根据权利要求1所述...

【专利技术属性】
技术研发人员:王标林辉段亦涛
申请(专利权)人:网易有道信息技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1