【技术实现步骤摘要】
标签处理方法、装置、电子设备及存储介质
[0001]本公开涉及人工智能
,具体为计算机视觉、图像处理、深度学习等
,可应用于光学文字识别、智慧城市等场景,具体涉及一种标签处理方法、装置、电子设备及存储介质。
技术介绍
[0002]标签处理通常是指获取待处理标签中的文字内容,例如,获取待处理标签中可能存在的商品价格信息、商品编码信息等数值信息,以便推动商家进行数字化化运营。目前,常用的标签处理方法通常仅用于处理简单版式的商品标签,而难以有效应对实际业务场景中多样化的标签版式分布情况,从而降低了标签处理方法的可用性。
技术实现思路
[0003]本公开提供了一种标签处理方法、装置、电子设备及存储介质。
[0004]根据本公开的一方面,提供了一种标签处理方法,包括:
[0005]获取对商品标签中的多个文本行检测区域进行识别,获得的多个文本识别结果,每个文本识别结果对应一个文本行检测区域;
[0006]通过数值匹配方式,对多个文本识别结果进行处理,获得商品标签中的标签信息。
[0007]根据本公开的第二方面,提供了一种标签处理装置,包括:
[0008]识别结果获取单元,用于获取对商品标签中的多个文本行检测区域进行识别,获得的多个文本识别结果,每个文本识别结果对应一个文本行检测区域;
[0009]识别结果处理单元,用于通过数值匹配方式,对多个文本识别结果进行处理,获得商品标签中的标签信息。
[0010]根据本公开的第三方面,提供了一种电子设备,包 ...
【技术保护点】
【技术特征摘要】
1.一种标签处理方法,包括:获取对商品标签中的多个文本行检测区域进行识别,获得的多个文本识别结果,每个所述文本识别结果对应一个所述文本行检测区域;通过数值匹配方式,对所述多个文本识别结果进行处理,获得所述商品标签中的标签信息。2.根据权利要求1所述的方法,其中,所述通过数值匹配方式,对所述多个文本识别结果进行处理,获得所述商品标签中的标签信息,包括:通过所述数值匹配方式对目标识别结果进行匹配,获得数值匹配结果,所述目标识别结果为所述多个文本识别结果中的任一文本识别结果;在所述数值匹配结果表征所述目标识别结果包含完整数值字段的情况下,获取所述完整数值字段;基于获取到的至少一个完整数值字段,获得所述商品标签中的标签信息。3.根据权利要求2所述的方法,其中,所述数值匹配方式包括小数匹配方式和整数匹配方式,所述通过所述数值匹配方式对目标识别结果进行匹配,获得数值匹配结果,包括:通过所述小数匹配方式对所述目标识别结果进行匹配;在通过所述小数匹配方式,从所述目标识别结果中成功匹配到小数字段的情况下,获得用于表征所述目标识别结果包含完整数值字段、且所述完整数值字段为所述小数字段的数值匹配结果;在通过所述小数匹配方式,未从所述目标识别结果中成功匹配到小数字段的情况下,通过所述整数匹配方式对所述目标识别结果进行匹配;在通过所述整数匹配方式,从所述目标识别结果中成功匹配到整数字段的情况下,获得用于表征所述目标识别结果包含完整数值字段、且所述完整数值字段为所述整数字段的数值匹配结果。4.根据权利要求3所述的方法,其中,所述通过所述小数匹配方式对所述目标识别结果进行匹配,包括:获取用于匹配小数型数值的第一正则表达式;通过所述第一正则表达式,对所述目标识别结果进行匹配。5.根据权利要求3所述的方法,其中,所述通过所述整数匹配方式对所述目标识别结果进行匹配,包括:获取用于匹配整数型数值的第二正则表达式;通过所述第二正则表达式,对所述目标识别结果进行匹配。6.根据权利要求3所述的方法,其中,所述数值匹配方式还包括小数部分匹配方式,所述通过所述数值匹配方式对目标识别结果进行匹配,获得数值匹配结果,还包括:通过所述小数部分匹配方式对所述目标识别结果进行匹配;在通过所述小数部分匹配方式,从所述目标识别结果中成功匹配到小数部分字段的情况下,将所述小数部分字段存入待合并数组;在通过所述小数部分匹配方式,未从所述目标识别结果中成功匹配到小数部分字段的情况下,执行所述通过所述小数匹配方式对所述目标识别结果进行匹配的步骤。7.根据权利要求6所述的方法,其中,所述通过所述小数部分匹配方式对所述目标识别
结果进行匹配,包括:在所述目标识别结果中包含起始字符为小数点的数值字段的情况下,获取用于匹配整数型数值的第三正则表达式;通过所述第三正则表达式,对所述目标识别结果中位于所述小数点之后的剩余字段进行匹配。8.根据权利要求6所述的方法,其中,所述标签信息包括商品价格信息,所述基于获取到的至少一个完整数值字段,获得所述商品标签中的标签信息,包括:从所述多个文本行检测区域中确定每个所述完整数值字段所对应的目标检测区域,以及所述目标检测区域中的数值区域面积;从所述至少一个完整数值字段中确定所对应的数值区域面积最大的目标字段;基于所述目标字段,获得所述商品标签中的商品价格信息。9.根据权利要求8所述的方法,其中,所述基于所述目标字段,获取所述商品标签中的商品价格信息,包括:在所述目标字段为所述小数字段的情况下,将所述小数字段作为所述商品标签中的商品价格信息;在所述目标字段为所述整数字段、且所述待合并数组非空的情况下,将所述整数字段与所述待合并数组中的所述小数部分字段进行合并,获得所述商品标签中的商品价格信息;在所述目标字段为所述整数字段、且所述待合并数组为空的情况下,对所述整数字段进行整数位修正,获得所述商品标签中的商品价格信息。10.根据权利要求9所述的方法,其中,所述对所述整数字段进行整数位修正,获得所述商品标签中的商品价格信息,包括:获取所述整数字段的字符位数;根据所述字符位数,确定修正比;计算所述整数字段与所述修正比的商,作为所述商品标签中的商品价格信息。11.根据权利要求1~10中任一项所述的方法,所述标签信息包括商品价格信息,所述方法还包括:对将多个待处理标签中的任一待处理标签作为所述商品标签,获得的多个标签信息中的商品价格信息进行数值分布统计,获得统计结果,所述多个待处理标签位于同一标签图像、且每个所述标签信息对应一个所述待处理标签;基于所述统计结果,从获取到的多个商品价格信息中确定待修正信息;对所述待修正信息进行归一化修正,获得经过归一化修正的商品价格信息。12.根据权利要求11所述的方法,其中,所述基于所述统计结果,从获取到...
【专利技术属性】
技术研发人员:万星宇,倪子涵,章成全,姚锟,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。