标签处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38331726 阅读:14 留言:0更新日期:2023-07-29 09:14
本公开涉及人工智能技术领域,具体为计算机视觉、图像处理、深度学习等技术领域,可应用于光学文字识别、智慧城市等场景,具体涉及一种标签处理方法、装置、电子设备及存储介质。具体实现方案为:获取对商品标签中的多个文本行检测区域进行识别,获得的多个文本识别结果,每个文本识别结果对应一个文本行检测区域;通过数值匹配方式,对多个文本识别结果进行处理,获得商品标签中的标签信息。采用本公开可以有效应对实际业务场景中多样化的标签版式分布情况,从而提高标签处理方法的可用性。从而提高标签处理方法的可用性。从而提高标签处理方法的可用性。

【技术实现步骤摘要】
标签处理方法、装置、电子设备及存储介质


[0001]本公开涉及人工智能
,具体为计算机视觉、图像处理、深度学习等
,可应用于光学文字识别、智慧城市等场景,具体涉及一种标签处理方法、装置、电子设备及存储介质。

技术介绍

[0002]标签处理通常是指获取待处理标签中的文字内容,例如,获取待处理标签中可能存在的商品价格信息、商品编码信息等数值信息,以便推动商家进行数字化化运营。目前,常用的标签处理方法通常仅用于处理简单版式的商品标签,而难以有效应对实际业务场景中多样化的标签版式分布情况,从而降低了标签处理方法的可用性。

技术实现思路

[0003]本公开提供了一种标签处理方法、装置、电子设备及存储介质。
[0004]根据本公开的一方面,提供了一种标签处理方法,包括:
[0005]获取对商品标签中的多个文本行检测区域进行识别,获得的多个文本识别结果,每个文本识别结果对应一个文本行检测区域;
[0006]通过数值匹配方式,对多个文本识别结果进行处理,获得商品标签中的标签信息。
[0007]根据本公开的第二方面,提供了一种标签处理装置,包括:
[0008]识别结果获取单元,用于获取对商品标签中的多个文本行检测区域进行识别,获得的多个文本识别结果,每个文本识别结果对应一个文本行检测区域;
[0009]识别结果处理单元,用于通过数值匹配方式,对多个文本识别结果进行处理,获得商品标签中的标签信息。
[0010]根据本公开的第三方面,提供了一种电子设备,包括:
[0011]至少一个处理器;
[0012]与至少一个处理器通信连接的存储器;
[0013]存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行第一方面所提供的方法。
[0014]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行第一方面所提供的方法。
[0015]根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现第一方面所提供的方法。
[0016]采用本公开可以有效应对实际业务场景中多样化的标签版式分布情况,从而提高标签处理方法的可用性。
[0017]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0018]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0019]图1为本公开实施例提供的一种标签处理方法的流程示意图;
[0020]图2A和图2B为本公开实施例提供的一种文本行检测区域的示意图;
[0021]图3为本公开实施例提供的一种完整数值字段的示意图;
[0022]图4A、图4B和图4C为本公开实施例提供的一种标签信息获取方式说明图;
[0023]图5为本公开实施例提供的一种整数位数分布情况示意图;
[0024]图6为本公开实施例提供的一种商品属性信息获取方式说明图;
[0025]图7为本公开实施例提供的一种标签处理方法的流程示意图;
[0026]图8为本公开实施例提供的一种标签处理方法的辅助性过程说明图;
[0027]图9为本公开实施例提供的一种标签处理方法的完整流程示意图;
[0028]图10为本公开实施例提供的一种标签处理方法的应用场景示意图;
[0029]图11为本公开实施例提供的一种标签处理装置的示意性结构框图;
[0030]图12为本公开实施例提供的一种电子设备的示意性结构框图。
具体实施方式
[0031]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0032]如
技术介绍
所述的,现有标签处理方法通常仅用于处理简单版式的商品标签,例如,价格字段和非价格字段独立的商品价格标签。
[0033]具体地,现有标签处理方法通常是在通过通用的光学文字识别(Optical Character Recognition,OCR)模型,对商品价格标签中的多个文本行检测区域进行识别,获得多个文本识别结果之后,通过价格文本检测模型,将每个文本识别结果简单地划分为价格字段或非价格字段,再选取出属于价格字段的目标识别结果,并基于目标识别结果,获得标签信息,该标签信息包括商品价格信息。由于价格文本检测模型只是将每个文本识别结果简单地划分为价格字段或非价格字段,而实际业务场景中,还包括价格字段和非价格字段混合等复杂情况。这使得现有标签处理方法难以有效应对实际业务场景中多样化的标签版式分布情况,因此,降低了标签处理方法的可用性。
[0034]基于此,本公开实施例提供了一种标签处理方法,该标签处理方法可以应用于电子设备。以下,将结合图1所示流程示意图,对本公开实施例提供的一种标签处理方法进行说明。需要说明的是,虽然在流程示意图中示出了逻辑顺序,但是,在某些情况下,也可以以其他顺序执行所示出或描述的步骤。
[0035]步骤S101,获取对商品标签中的多个文本行检测区域进行识别,获得的多个文本识别结果,每个文本识别结果对应一个文本行检测区域;
[0036]步骤S102,通过数值匹配方式,对多个文本识别结果进行处理,获得商品标签中的标签信息。
[0037]其中,商品标签可以是在商品售卖巡检等实际业务场景中,对商品展架进行拍摄,
获得标签图像之后,从标签图像中确定的一个待处理标签。基于此,商品标签可以是商品价格标签,以用于展示对应商品的商品名称、商品价格信息、容量规格、保质期等。商品标签也可以是在商品存储仓巡检、商品存储定位等实际业务场景中,对商品进行拍摄,获得标签图像之后,从标签图像中确定的一个待处理标签。基于此,商品标签也可以是商品编码标签,以用于展示对应商品的商品名称、商品编码号、商品存储位置等。
[0038]在执行本公开实施例提供的标签处理方法之前,可以从商品标签中确定多个文本行检测区域,再对每个文本行检测区域进行识别,获得每个文本行检测区域的文本识别结果,以获得多个文本识别结果。其中,文本行检测区域可以是矩形检测区域,其内包含一个具有空间连续性、且行中心线高度前后一致、行整体宽度前后也一致的文本字段。其中,文本字段可以由文字、数字、字母和符号中的任意一者组成,也可以由文字、数字、字母和符号中的至少两者组成,本公开实施例对此不作限制。
[0039]请结合图2A和图2B。图2A中,商品标签为商品价格标签,包括6个文本行检测区域。其中,“2.5元”为一个具有空间连续性、且行中心线高度前后一致、行整体宽度前后本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种标签处理方法,包括:获取对商品标签中的多个文本行检测区域进行识别,获得的多个文本识别结果,每个所述文本识别结果对应一个所述文本行检测区域;通过数值匹配方式,对所述多个文本识别结果进行处理,获得所述商品标签中的标签信息。2.根据权利要求1所述的方法,其中,所述通过数值匹配方式,对所述多个文本识别结果进行处理,获得所述商品标签中的标签信息,包括:通过所述数值匹配方式对目标识别结果进行匹配,获得数值匹配结果,所述目标识别结果为所述多个文本识别结果中的任一文本识别结果;在所述数值匹配结果表征所述目标识别结果包含完整数值字段的情况下,获取所述完整数值字段;基于获取到的至少一个完整数值字段,获得所述商品标签中的标签信息。3.根据权利要求2所述的方法,其中,所述数值匹配方式包括小数匹配方式和整数匹配方式,所述通过所述数值匹配方式对目标识别结果进行匹配,获得数值匹配结果,包括:通过所述小数匹配方式对所述目标识别结果进行匹配;在通过所述小数匹配方式,从所述目标识别结果中成功匹配到小数字段的情况下,获得用于表征所述目标识别结果包含完整数值字段、且所述完整数值字段为所述小数字段的数值匹配结果;在通过所述小数匹配方式,未从所述目标识别结果中成功匹配到小数字段的情况下,通过所述整数匹配方式对所述目标识别结果进行匹配;在通过所述整数匹配方式,从所述目标识别结果中成功匹配到整数字段的情况下,获得用于表征所述目标识别结果包含完整数值字段、且所述完整数值字段为所述整数字段的数值匹配结果。4.根据权利要求3所述的方法,其中,所述通过所述小数匹配方式对所述目标识别结果进行匹配,包括:获取用于匹配小数型数值的第一正则表达式;通过所述第一正则表达式,对所述目标识别结果进行匹配。5.根据权利要求3所述的方法,其中,所述通过所述整数匹配方式对所述目标识别结果进行匹配,包括:获取用于匹配整数型数值的第二正则表达式;通过所述第二正则表达式,对所述目标识别结果进行匹配。6.根据权利要求3所述的方法,其中,所述数值匹配方式还包括小数部分匹配方式,所述通过所述数值匹配方式对目标识别结果进行匹配,获得数值匹配结果,还包括:通过所述小数部分匹配方式对所述目标识别结果进行匹配;在通过所述小数部分匹配方式,从所述目标识别结果中成功匹配到小数部分字段的情况下,将所述小数部分字段存入待合并数组;在通过所述小数部分匹配方式,未从所述目标识别结果中成功匹配到小数部分字段的情况下,执行所述通过所述小数匹配方式对所述目标识别结果进行匹配的步骤。7.根据权利要求6所述的方法,其中,所述通过所述小数部分匹配方式对所述目标识别
结果进行匹配,包括:在所述目标识别结果中包含起始字符为小数点的数值字段的情况下,获取用于匹配整数型数值的第三正则表达式;通过所述第三正则表达式,对所述目标识别结果中位于所述小数点之后的剩余字段进行匹配。8.根据权利要求6所述的方法,其中,所述标签信息包括商品价格信息,所述基于获取到的至少一个完整数值字段,获得所述商品标签中的标签信息,包括:从所述多个文本行检测区域中确定每个所述完整数值字段所对应的目标检测区域,以及所述目标检测区域中的数值区域面积;从所述至少一个完整数值字段中确定所对应的数值区域面积最大的目标字段;基于所述目标字段,获得所述商品标签中的商品价格信息。9.根据权利要求8所述的方法,其中,所述基于所述目标字段,获取所述商品标签中的商品价格信息,包括:在所述目标字段为所述小数字段的情况下,将所述小数字段作为所述商品标签中的商品价格信息;在所述目标字段为所述整数字段、且所述待合并数组非空的情况下,将所述整数字段与所述待合并数组中的所述小数部分字段进行合并,获得所述商品标签中的商品价格信息;在所述目标字段为所述整数字段、且所述待合并数组为空的情况下,对所述整数字段进行整数位修正,获得所述商品标签中的商品价格信息。10.根据权利要求9所述的方法,其中,所述对所述整数字段进行整数位修正,获得所述商品标签中的商品价格信息,包括:获取所述整数字段的字符位数;根据所述字符位数,确定修正比;计算所述整数字段与所述修正比的商,作为所述商品标签中的商品价格信息。11.根据权利要求1~10中任一项所述的方法,所述标签信息包括商品价格信息,所述方法还包括:对将多个待处理标签中的任一待处理标签作为所述商品标签,获得的多个标签信息中的商品价格信息进行数值分布统计,获得统计结果,所述多个待处理标签位于同一标签图像、且每个所述标签信息对应一个所述待处理标签;基于所述统计结果,从获取到的多个商品价格信息中确定待修正信息;对所述待修正信息进行归一化修正,获得经过归一化修正的商品价格信息。12.根据权利要求11所述的方法,其中,所述基于所述统计结果,从获取到...

【专利技术属性】
技术研发人员:万星宇倪子涵章成全姚锟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1