一种识别面单图像中电话号码的方法技术

技术编号:35989852 阅读:42 留言:0更新日期:2022-12-17 23:04
本发明专利技术公开了一种识别面单图像中电话号码的方法,首先对条码所在区域进行定位,然后根据条码区域与水平位置的夹角对整个面单图像进行翻正,并根据条码区域与整个面单区域的缩放比例关系,对翻正后的面单图像进行裁剪,以过滤掉过多背景信息对电话号码识别的干扰,再通过预先训练的CNN神经网络模型对翻正后的面单图像的朝向进行分类,然后再根据面单朝向与旋转角度及旋转方向的对应关系,将面单图像旋转到朝向为“上向”的位置,最后再使用SSD目标检测模型对变换朝向后的面单图像进行电话号码位置定位,利用CRNN文本识别模型对定位到的电话号码所在区域作最后的电话号码内容识别并展示识别结果,大幅提高了对面单图像中电话号码的识别准确度。话号码的识别准确度。话号码的识别准确度。

【技术实现步骤摘要】
一种识别面单图像中电话号码的方法


[0001]本专利技术涉及人工智能
,具体涉及一种识别面单图像中电话号码的方法。

技术介绍

[0002]巴枪,又称物流PDA或手持终端,在物流快递行业称之为快递扫描巴枪,主要功能是识别面单上的条码信息。目前,市面上有许多具有不同功能的巴枪,部分能在识别条码信息的同时采集面单图像。快递员在收件时需要将包括电话号码在内的客户信息输入到PDA中,现有方案中,通常采用手工输入方式。但快递员一天内可能需要输入较多数量的客户信息,这种手工输入的方式费时费力,并且容易出错。因此,在使用具有面单图像采集功能的巴枪时,希望在扫取条码信息的同时能够自动识别出所采集的面单图像中客户的电话号码,但快递员在使用巴枪扫取条码信息时手握巴枪的角度是比较随意的,导致现场采集的面单图像的可视角度也是随意的,可能是如图1所示的右向,也可能是如图2所示的正向,甚至带有畸变,而巴枪又不具备面单图像采集可视功能,用户无法在巴枪上看到所要采集的面单图像位置是否为图2所示的正向且不带有畸变,这对利用算法准确识别面单图像上的电话号码带来了不利影响。

技术实现思路

[0003]本专利技术以提高算法自动识别面单图像中电话号码的准确性为目的,提供了一种识别面单图像中电话号码的方法。
[0004]为达此目的,本专利技术采用以下技术方案:
[0005]提供一种识别面单图像中电话号码的方法,步骤包括:
[0006]S1,对巴枪采集到的面单图像中的条码区域进行定位;
[0007]S2,计算定位到所述条码区域的最小外接矩形与水平位置的夹角α;
[0008]S3,对所述面单图像旋转α角度以翻正所述面单图像;
[0009]S4,识别出翻正后的所述面单图像中的电话号码。
[0010]作为优选,步骤S1中,对所述巴枪采集到的所述面单图像中的所述条码区域进行定位的方法具体包括步骤:
[0011]S11,对所述巴枪采集到的所述面单图像进行二值化处理并移除图像背景后,得到二值化图像;
[0012]S12,以最小外接矩形检测方式框选出所述二值化图像中的连通区域,并计算每个所述连通区域的长宽比;
[0013]S13,对框选所述连通区域的每个最小外接矩形,判断其长宽比是否大于预设的长宽比阈值,
[0014]若是,则保留所述连通区域作为定位到的疑似条码区域;
[0015]若否,则丢弃所述连通区域。
[0016]作为优选,对所述巴枪采集到的所述面单图像中的所述条码区域进行定位的方法
还包括步骤:
[0017]S14,对步骤S13保留的各所述疑似条码区域按照最小外接矩形尺寸大小进行聚类;
[0018]S15,对于指定类下的各所述疑似条码区域,利用直线检测算法进行区域扩充后,得到完整的所述条码区域。
[0019]作为优选,执行步骤S4之前还包括步骤:
[0020]S31,对翻正后的所述面单图像进行裁剪,裁剪方法为:计算所述最小外接矩形框选的所述条码区域的区域面积,并根据预设的条码区域面积与面单区域面积的缩放比例关系,对所述最小外接矩形框选的所述条码区域进行扩充后裁剪,得到裁剪后的所述面单图像。
[0021]作为优选,步骤S4中,识别出翻正后的所述面单图像中的电话号码的方法步骤包括:
[0022]S41,利用以经步骤S3翻正后的不同朝向的各所述面单图像为样本训练得到的CNN神经网络模型,对输入模型的所述面单图像的朝向进行分类;
[0023]S42,根据预设的朝向与旋转角度以及旋转方向的对应关系,获取步骤S41分类得到的朝向对应的旋转方向和旋转角度;
[0024]S43,控制所述面单图像以获取的所述旋转方向和所述旋转角度旋转到朝向为“上向”的位置;
[0025]S44,利用目标检测模型对朝向为“上向”的所述面单图像中的电话号码的位置区域进行定位;
[0026]S45,利用文本识别模型识别出定位到的电话号码位置区域中的电话号码并显示给用户。
[0027]作为优选,步骤S44中,利用SSD目标检测模型识别所述面单图像中的电话号码所在的位置区域。
[0028]作为优选,所述SSD目标检测模型中的主干网络为MobileNet

V3。
[0029]作为优选,步骤S45中,使用CRNN文本识别模型对定位到的电话号码所在的所述位置区域进行电话号码内容的识别,并输出识别结果展示给所述用户。
[0030]本专利技术具有以下有益效果:
[0031]本专利技术通过对比实验发现直接从原始的面单图像中定位并识别出电话号码比较困难,而条码是面单中非常重要的信息,本申请通过更容易定位到的条码信息,首先对条码所在区域进行定位,然后根据条码区域与水平位置的夹角对整个面单图像进行翻正,并根据条码区域与整个面单区域的缩放比例关系,对翻正后的面单图像进行裁剪,以过滤掉过多背景信息对电话号码识别的干扰,再通过预先训练的CNN神经网络模型对翻正后的面单图像的朝向进行分类,然后再根据面单朝向与旋转角度及旋转方向的对应关系,将面单图像旋转到朝向为“上向”的位置,最后再使用SSD目标检测模型对变换朝向后的面单图像进行电话号码位置定位,利用CRNN文本识别模型对定位到的电话号码所在区域作最后的电话号码内容识别并展示识别结果,大幅提高了对面单图像中电话号码的识别准确度。
附图说明
[0032]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例中所需要使用的附图作简单地介绍。显而易见地,下面所描述的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0033]图1是巴枪采集的面单图像为右向的示意图;
[0034]图2是巴枪采集的面单图像为正向的示意图;
[0035]图3是对图1进行二值化后的二值化图像的示意图;
[0036]图4是对图3移除背景后的示意图;
[0037]图5是对图1进行翻正和裁剪后的示意图;
[0038]图6是对图5进行四个方向分类之后正向的示意图;
[0039]图7是利用SSD目标检测模型定位到面单图像中的电话号码所在区域的示意图;
[0040]图8是利用CRNN文本识别模型识别到图7中所示的电话号码的示意图;
[0041]图9是本专利技术一实施例提供的识别面单图像中电话号码的方法的实现步骤图。
具体实施方式
[0042]下面结合附图并通过具体实施方式来进一步说明本专利技术的技术方案。
[0043]其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本专利的限制;为了更好地说明本专利技术的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
[0044]本专利技术实施例的附图中相同或相似的标号对应相同或相似的部件;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种识别面单图像中电话号码的方法,其特征在于,步骤包括:S1,对巴枪采集到的面单图像中的条码区域进行定位;S2,计算定位到所述条码区域的最小外接矩形与水平位置的夹角α;S3,对所述面单图像旋转α角度以翻正所述面单图像;S4,识别出翻正后的所述面单图像中的电话号码。2.根据权利要求1所述的识别面单图像中电话号码的方法,其特征在于,步骤S1中,对所述巴枪采集到的所述面单图像中的所述条码区域进行定位的方法具体包括步骤:S11,对所述巴枪采集到的所述面单图像进行二值化处理并移除图像背景后,得到二值化图像;S12,以外接矩形检测方式框选出所述二值化图像中的连通区域,并计算每个所述连通区域的长宽比;S13,对框选所述连通区域的每个最小外接矩形,判断其长宽比是否大于预设的长宽比阈值,若是,则保留所述连通区域作为定位到的疑似条码区域;若否,则丢弃所述连通区域。3.根据权利要求2所述的识别面单图像中电话号码的方法,其特征在于,对所述巴枪采集到的所述面单图像中的所述条码区域进行定位的方法还包括步骤:S14,对步骤S13保留的各所述疑似条码区域按照最小外接矩形尺寸大小进行聚类;S15,对于指定类下的各所述疑似条码区域,利用直线检测算法进行区域扩充后,得到完整的所述条码区域。4.根据权利要求1所述的识别面单图像中电话号码的方法,其特征在于,执行步骤S4之前还包括步骤:S31,对翻正后的所述面单图像进行裁剪,裁剪方法为:计算所述最小外接矩形框选的所述条码区域的区域面积,并根据...

【专利技术属性】
技术研发人员:周韶宁张砚冰张芒粒丁聪诸伊娜
申请(专利权)人:浙江百世技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1