【技术实现步骤摘要】
一种文本区域的定位方法及装置
本专利技术涉及计算机
,尤其涉及一种文本区域的定位方法及装置。
技术介绍
门头,是指企业、事业单位和个体工商户在门口设置的牌匾及相关设施,是一个商铺店门外的装饰形式,是美化销售场所和装饰店铺、吸引顾客的一种手段。商户的门头中一般包含有商户名称、商户地址等文字内容,在审核商户真实性时,需要巡检人员前往商铺的地址进行拍照,然后再由审核人员进行信息核对,效率低且易出错。目前,为了实现商户门头图片中自动识别文字,需要在街拍的商户门头图片中定位商户名称的文字位置。现有的图像文字识别一般是对图像中的全部文字进行识别,不能对商户门头图片中的商户名称文字区域和其他文字区域进行有效区分,影响后续商户名称识别的准确性。
技术实现思路
本专利技术实施例提供了一种文本区域的定位方法及装置,用于提高对商户门头图片中文字区域定位的精确性。一方面,本专利技术实施例提供了一种文本区域的定位方法,包括:获取目标图像中各个像素点的像素值;根据像素值,从所述目标图像的 ...
【技术保护点】
1.一种文本区域的定位方法,其特征在于,所述方法包括:/n获取目标图像中各个像素点的像素值;/n根据像素值,从所述目标图像的所有像素点中确定文本像素点,并由文本像素点形成多个文本连通域;/n针对任意两个文本连通域,根据文本连通域中各个像素点的颜色值,计算所述两个文本连通域之间的差异特征值,并根据所述两个文本连通域之间的距离,计算所述两个文本连通域之间的邻接特征值;/n根据差异特征值和邻接特征值,将所述多个文本连通域进行合并;/n根据合并后的文本连通域的面积,确定所述目标图像中的目标文本区域。/n
【技术特征摘要】
1.一种文本区域的定位方法,其特征在于,所述方法包括:
获取目标图像中各个像素点的像素值;
根据像素值,从所述目标图像的所有像素点中确定文本像素点,并由文本像素点形成多个文本连通域;
针对任意两个文本连通域,根据文本连通域中各个像素点的颜色值,计算所述两个文本连通域之间的差异特征值,并根据所述两个文本连通域之间的距离,计算所述两个文本连通域之间的邻接特征值;
根据差异特征值和邻接特征值,将所述多个文本连通域进行合并;
根据合并后的文本连通域的面积,确定所述目标图像中的目标文本区域。
2.根据权利要求1所述的方法,其特征在于,所述根据像素值,从所述目标图像的所有像素点中确定文本像素点,包括:
将所述目标图像输入已训练的像素分类模型中,通过像素分类模型中交替的卷积操作和池化操作得到所有像素点的像素特征提取结果;
根据所述像素分类模型学习到的历史图像中像素点的分类结果,确定所述目标图像中每个像素点的分类结果,所述像素点的分类结果为所述像素点为文本像素点或非文本像素点。
3.根据权利要求1所述的方法,其特征在于,所述由文本像素点形成多个文本连通域,包括:
针对每一个文本像素点,确定所述文本像素点与所述文本像素点相邻的像素点之前的邻接关系;
根据邻接关系,连通文本像素点,形成多个文本连通域。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述由文本像素点形成多个文本连通域之后,还包括:
确定每个文本连通域的最小外接矩形;
所述根据文本连通域中各个像素点的颜色值,计算所述两个文本连通域之间的差异特征值,包括:
根据每个文本连通域对应的最小外接矩形中各个像素的颜色值,计算两个最小外接矩形之间的差异特征值;
所述根据所述两个文本连通域之间的距离,计算所述两个文本连通域之间的邻接特征值,包括:
根据两个文本连通域的最小外接矩形之间的重叠面积,计算所述两个最小外接矩形之间的邻接特征值。
5.根据权利要求4所述的方法,其特征在于,所述根据每个文本连通域对应的最小外接矩形中各个像素的颜色值,计算两个最小外接矩形之间的差异特征值,包括:
针对每一个文本连通域的最小外接矩形,获取所述最小外接矩形中各个像素点的颜色值;计算所有像素点的颜色值的均值,作为所述最小外接矩形的颜色特征值;所述颜色特征值包括红色分量值、绿色分量值和蓝色分量值;
根据最小外接矩形的颜色特征值,计算所述两个最小外接矩形之间的多个颜色差异分量;
选取值最大的颜色差异分量作为所述两个最小外接矩形之间的差异特征值。
6.根据权利要求4所述的方法,其特征在于,所述根据两个文本连通域的最小外接矩形之间的重叠面积,计算所述两个最小外接矩形之间的邻接特征值,包括:
将两个最小外接矩形之间的重叠面积与所述两个最小外接矩形的面积之和相比,得到所述两个最小外接矩形之间的邻接特征值。
7.根据权利要求5或6所述的方法,其特征在于,所述根据差异特征值和邻接特征值,将所述多个文本连通域进行合并,包括:
确定差异特征值小于颜色阈值,并且邻接特征值大于面积阈值的两个最小外接矩形存在关联关系;
利用并查集算法,根据关联关系对所有最小外接矩形进行合并。
8.一种图像文字识别方法,其特征在于,所述方法包括:
确定目标图像中的目标文本区域,其中,所述目标图像中的目标文本区域是通过如权利要求1-7中任一项所述的方法得到的;
将所述目标文本区域输入已训练的特征提取模型中,得到所述目标文本区域的目标特征向量,所述特征提取模型利用训练文本图像以及对应的文字信息进行训练;
将所述目标特征向量与标注样本的标注特征向量进行相似度对比,确定相似度最大的标注文本图像,所述标注样本包括标注文本图像、对应的标注特征向量以及文字信息;
...
【专利技术属性】
技术研发人员:费志军,邱雪涛,何朔,
申请(专利权)人:中国银联股份有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。