一种目标文本区域的定位方法及装置制造方法及图纸

技术编号:28473687 阅读:51 留言:0更新日期:2021-05-15 21:41
本发明专利技术提供一种目标文本区域的定位方法及装置,属于计算机技术领域,涉及人工智能和计算机视觉技术,用于提高对商户门头图片中文字区域定位的精确性。其中,确定目标图像中的至少一个文本初选区域,并获取目标图像对应的文本模板图像;对至少一个文本初选区域进行特征提取,得到初选区域特征;将初选区域特征与文本模板图像的模板图像特征进行对比,从至少一个文本初选区域中确定出至少一个文本精选区域;对至少一个文本精选区域进行文本识别,根据文本识别结果从至少一个文本精选区域中确定目标文本区域;若确定目标文本区域的文本识别结果与文本模板图像的标签不一致,则根据文本模板图像的标签扩大目标文本区域的范围。文本模板图像的标签扩大目标文本区域的范围。文本模板图像的标签扩大目标文本区域的范围。

【技术实现步骤摘要】
一种目标文本区域的定位方法及装置


[0001]本专利技术涉及计算机
,尤其涉及一种目标文本区域的定位方法及装置。

技术介绍

[0002]门头,是指企业、事业单位和个体工商户在门口设置的牌匾及相关设施,是一个商铺店门外的装饰形式,是美化销售场所和装饰店铺、吸引顾客的一种手段。
[0003]商户的门头中一般包含有商户名称、商户地址等文字内容,在审核商户真实性时,需要巡检人员前往商铺的地址进行拍照,然后再由审核人员进行信息核对,效率低且易出错。目前,为了实现商户门头图片中自动识别文字,需要在街拍的商户门头图片中定位商户名称的文字位置。
[0004]现有的图像文字识别一般是对图像中的全部文字进行识别,不能对商户门头图片中的商户名称文字区域和其他文字区域进行有效区分,影响后续商户名称识别的准确性。

技术实现思路

[0005]本专利技术实施例提供了一种目标文本区域的定位方法及装置,用于提高对商户门头图片中文字区域定位的精确性。
[0006]一方面,本专利技术实施例提供了一种目标文本区域的定位方法,包括:
...

【技术保护点】

【技术特征摘要】
1.一种目标文本区域的定位方法,其特征在于,所述方法包括:确定目标图像中的至少一个文本初选区域,并获取所述目标图像对应的文本模板图像;对所述至少一个文本初选区域进行特征提取,得到初选区域特征;将初选区域特征与文本模板图像的模板图像特征进行对比,从所述至少一个文本初选区域中确定出至少一个文本精选区域;对所述至少一个文本精选区域进行文本识别,根据文本识别结果从所述至少一个文本精选区域中确定目标文本区域;将所述目标文本区域的文本识别结果与所述文本模板图像的标签进行对比,若确定所述目标文本区域的文本识别结果与所述文本模板图像的标签不一致,则根据所述文本模板图像的标签扩大所述目标文本区域的范围,得到所述目标图像最终的目标文本区域。2.根据权利要求1所述的方法,其特征在于,所述根据所述文本模板图像的标签扩大所述目标文本区域的范围,包括:根据所述文本模板图像的标签与所述文本识别结果确定所述目标文本区域的扩增方向;将所述目标文本区域向所述扩增方向扩大,直至所述目标文本区域的文本识别结果与所述文本模板图像的标签一致。3.根据权利要求1所述的方法,其特征在于,所述对所述至少一个文本初选区域进行特征提取,得到初选区域特征之前,还包括:利用图像特征点提取模型,对所述文本模板图像进行特征提取,得到所述文本模板图像的模板图像特征集;所述对所述至少一个文本初选区域进行特征提取,得到所述至少一个文本初选区域的初选区域特征,包括:利用所述图像特征点提取模型,对所述至少一个文本初选区域进行特征提取,得到所述至少一个文本初选区域的初选区域特征集,所述将初选区域特征与文本模板图像的模板图像特征进行对比,从所述至少一个文本初选区域中确定出至少一个文本精选区域,包括:将所述至少一个文本初选区域的初选区域特征集与所述文本模板图像的模板图像特征集相匹配;将匹配点数大于特征点阈值的文本初选区域作为所述文本精选区域。4.根据权利要求1所述的方法,其特征在于,所述对所述至少一个文本精选区域进行文本识别,根据文本识别结果从所述至少一个文本精选区域中确定目标文本区域,包括:利用文本识别模型,对所述至少一个文本精选区域进行文本识别,得到文本识别结果;将文本识别结果中包含目标文字数量最多的文本精选区域作为所述目标文本区域。5.一种图像文本定位网络训练方法,其特征在于,所述方法包括:获取训练图像;将所述训练图像输入商户文本定位网络,得到所述训练图像中的商户文本位置;确定所述训练图像中的目标文本区域,其中,所述训练图像中的目标文本区域是通过如权利要求1

4中任一项所述的方法得到的;
根据所述商户文本位置与所述目标文本区域计算损失函数,并依据所述损失函数对所述商户文本定位网络的参数进行优化,直至所述损失函数小于预设阈值时,确定对应的参数为所述商户文本定位网络对应的参数,得到所述商户文本定位网络。6.一种目标文本区域的定位装置,其特征在于,所述...

【专利技术属性】
技术研发人员:费志军邱雪涛高鹏飞
申请(专利权)人:中国银联股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1