一种图像处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33735968 阅读:17 留言:0更新日期:2022-06-08 21:32
本公开提供了一种图像处理方法、装置、电子设备及存储介质,涉及人工智技术领域,进一步涉及计算机视觉和深度学习技术领域,以至少解决相关技术中对目标对象识别效率低的技术问题。具体实现方案为:获取目标图像,其中,目标图像包括待识别对象;对目标图像进行检测,得到目标像素数据,其中,目标像素数据用于表示待识别对象中的至少一个像素与待识别对象的顶点坐标之间的位置关系;基于目标像素数据对目标图像进行校正,得到校正结果。得到校正结果。得到校正结果。

【技术实现步骤摘要】
一种图像处理方法、装置、电子设备及存储介质


[0001]本公开涉及人工智能
,进一步涉及计算机视觉和深度学习
,尤其涉及一种图像处理方法、装置、电子设备及存储介质。

技术介绍

[0002]对快递单进行文字识别一般包括文字检测、文字识别两部分。但是在实际运输、筛捡的过程中,快递包裹随意放置,拍摄角度不固定,拍出的图片可能正向、倒置、倾斜、扭曲等。直接进行文字检测识别难度较高,人工摆正后识别会大大增加人工和时间成本。因此,采用现有技术对快递单进行检测设别的准确度较低。

技术实现思路

[0003]本公开提供了一种图像处理方法、装置、电子设备及存储介质,以至少解决相关技术中对快递对象进行检测的准确度较低的技术问题。
[0004]根据本公开的一方面,提供了一种图像处理方法,包括:获取目标图像,其中,目标图像包括待识别对象;对目标图像进行检测,得到目标像素数据,其中,目标像素数据用于表示待识别对象中的至少一个像素与待识别对象的顶点坐标之间的位置关系;基于目标像素数据对目标图像进行校正,得到校正结果。
[0005]根据本公开的又一方面,提供了一种图像处理装置,包括:获取模块,用于获取目标图像,其中,目标图像包括待识别对象;检测模块,用于对目标图像进行检测,得到目标像素数据,其中,目标像素数据用于表示待识别对象中的至少一个像素与待识别对象的顶点坐标之间的位置关系;校正模块,用于基于目标像素数据对目标图像进行校正,得到校正结果。
[0006]根据本公开的又一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开提出的图像处理方法。
[0007]根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开提出的图像处理方法。
[0008]根据本公开的又一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行本公开提出的图像处理方法。
[0009]在本公开中,首先获取目标场景种的目标图像,其中,目标图像包括待识别对象;然后对目标图像进行检测,得到目标像素数据,其中,目标像素数据用于表示待识别对象中的至少一个像素与待识别对象的顶点坐标之间的位置关系;最后基于目标像素数据对目标图像进行校正,得到校正结果。实现了提高对目标图像的识别效率。容易注意到的是,可以使用目标像素数据来表示待识别对象中的至少一个像素与待识别对象的顶点坐标之间的位置关系,然后基于目标像素数据对目标图像进行校正,可以进一步的提高识别的准确度,降低误检的情况,进而解决了相关技术中对快递对象进行检测的准确度较低的技术问题。
[0010]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0011]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0012]图1是本公开实施例的一种快递单的局部图;
[0013]图2是根据本公开实施例的一种用于实现数据处理方法的计算机终端(或移动设备)的硬件结构框图;
[0014]图3是根据本公开第一实施例的一种数据处理方法流程图;
[0015]图4a是本公开实施例的一种不规则摆放的快递单图;
[0016]图4b是本公开实施例的一种不规则摆放的快递单图;
[0017]图5a是本公开实施例的一种快递单外框检测图;
[0018]图5b是本公开实施例的一种快递单外框矫正图;
[0019]图5c是根据本公开第二实施例的另一种数据处理方法流程图;
[0020]图6a是本公开实施例的一种样本图像;
[0021]图6b是本公开实施例的一种样本图像的中心高斯分布区域图;
[0022]图6c是根据本公开第三实施例的另一种数据处理方法流程图;
[0023]图7是根据本公开实施例的一种数据处理装置的结构框图。
具体实施方式
[0024]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0025]需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0026]随着电商和交通运输的发展,快递行业蓬勃发展。2021年我国快递数量突破100亿,在促消费和加快经济循环中凸显了非常重要的作用。市面上常见的快递公司有几十家,每家公司又有多种样式的快递单,信息繁杂。每天快递站点分发快递、派送快递的过程中每个人接触的快递有上百件,如果通过人工操作录入单号、收件人信息,更新物流公司内部的信息管理系统的物流状态,或者根据电话、地址等信息划分区域派单,就需要耗费大量的人力和时间成本。在要求快递配送速度的环境下,人工操作出错的几率较高,可能会招致投诉。
[0027]目前,提高目标检测识别的方法主要有以下几种:
[0028]方法1、四方向分类法,四方向分类模型可以输出图片的上下左右4个朝向,然后根据方向旋转90
°
,180
°
,270
°
矫正快递单图片。
[0029]方法2、回归方法,利用回归模型直接检测快递单主体的4个顶点。
[0030]方法3、分割方法,基于分割算法,输出主体区域位置和文字正向1/2、文字正向左上角1/4区域位置。结合主体区域位置和1/4区域位置确定主体4顶点坐标以及起点顶点。
[0031]相关技术中都存在一些问题,分别如下:方法1、四方向分类法,对于摄像头倾斜拍摄出的带仿射变换角度的图片或者旋转45度左右的图片分类困难。分类正确的情况下,旋转后的文字依然有一定角度的倾斜,影响后续文字检测、识别精度;方法2、回归方法,快递单版式多、样式复杂时,会出现顶点位置不准的情况;方法3、分割方法,图1是快递单的局部小图,在快递单小图和局部图如图1所示的场景下,特征分布分散,分割精度易受条形码等大面积图像特征的影响,1/4区域map易错,进而导致顶点起点判断有误差。
[0032]根据本公开实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法,其中,包括:获取目标图像,其中,所述目标图像包括待识别对象;对所述目标图像进行检测,得到目标像素数据,其中,所述目标像素数据用于表示所述待识别对象中的至少一个像素与所述待识别对象的顶点坐标之间的位置关系;基于所述目标像素数据对所述目标图像进行校正,得到校正结果。2.根据权利要求1所述的方法,其中,所述基于所述目标像素数据对所述目标图像进行校正,得到校正结果,包括:基于所述目标像素数据确定所述待识别对象的顶点坐标和所述顶点坐标的排序顺序;基于所述顶点坐标和所述顶点坐标的排序顺序对所述目标图像进行校正,得到所述校正结果。3.根据权利要求2所述的方法,其中,所述基于所述顶点坐标和所述顶点坐标的排序顺序对所述目标图像进行校正,得到校正结果,包括:根据所述顶点坐标的排序顺序确定所述顶点坐标中的起点坐标;基于所述起点坐标和所述顶点坐标对所述待识别对象进行校正,得到所述校正结果。4.根据权利要求1所述的方法,其中,所述方法还包括:获取原始样本,其中,所述原始样本包括:样本图像、与所述样本图像对应的样本坐标和所述样本坐标为所述样本图像中所述待识别对象的顶点坐标;基于所述样本图像和所述样本坐标,确定样本像素数据,其中,所述样本像素数据用于表示所述样本图像中的像素与所述待识别对象之间的位置关系;基于所述样本像素数据和所述样本图像,确定训练数据;基于所述训练数据对初始模型进行训练,得到检测模型;其中,对所述目标图像进行检测,得到目标像素数据,包括:利用所述检测模型对所述目标图像进行检测,得到目标像素数据。5.根据权利要求4所述的方法,其中,所述基于所述样本图像和所述样本坐标,确定样本像素数据,包括:获取所述样本图像中待识别对象的目标区域;获取所述目标区域中的像素和所述样本坐标之间的差值,确定所述样本像素数据。6.根据权利要求1所述的方法,其中,所述方法还包括:基于所述校正结果对所述目标图像进行识别,得到识别结果,其中,所述识别结果用于表示所述目标图像中的所述待识别对象的文本信息。7.一种图像处理装置,其中,包括:获取模块,用于获取目标图像,其中,所述目标图像包括待识别对象;检测模块,用于对所述目标图像进行检测,得到目标像素数据,其中,所述目标像素数据用于表示所述待识别对象中的至少一个像素与所述待识别对象的顶点坐标之间的位置关系;校正模块,用于基于所述目标像素数据对所述目标图像进行校正,得到校正结果。8.根据权利要求7所述的装置,其中...

【专利技术属性】
技术研发人员:王晓燕吕鹏原范森章成全姚锟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1