一种包含文本的图像生成方法及装置制造方法及图纸

技术编号:26531702 阅读:32 留言:0更新日期:2020-12-01 14:13
本发明专利技术提供一种包含文本的图像生成方法及装置,属于计算机技术领域,涉及人工智能和计算机视觉技术。其中,包含文本的图像生成方法包括:获取第一样本图像中各个像素点的像素值;根据像素值,确定所述第一样本图像中的文本区域;将所述第一样本图像进行图像语义分割,得到多个语义分割区域;根据所述文本区域与语义分割区域的重合关系,从所述多个语义分割区域中确定目标背景区域;获取目标文本图像,并将所述目标文本图像与所述目标背景区域融合,生成第二样本图像。

【技术实现步骤摘要】
一种包含文本的图像生成方法及装置
本专利技术涉及计算机
,尤其涉及一种包含文本的图像生成方法及装置。
技术介绍
门头,是指企业、事业单位和个体工商户在门口设置的牌匾及相关设施,是一个商铺店门外的装饰形式,是美化销售场所和装饰店铺、吸引顾客的一种手段。商户的门头中一般包含有商户名称、商户地址等文字内容,在审核商户真实性时,需要根据商户门头中的商户名称进行信息核对。目前一般利用文本识别模型对商户门头图像中的商户名称进行识别。为了训练文本识别模型,需要大量标注的商户门头图像作为训练样本。但依靠巡检人员前往商铺的地址进行拍照得到的商户门头图像数量较少,无法满足网络模型的训练要求。
技术实现思路
本专利技术实施例提供了一种包含文本的图像生成方法及装置,用于增加网络模型的训练样本数量,提高网络模型的训练效果和准确度。一方面,本专利技术实施例提供了一种包含文本的图像生成方法,包括:获取第一样本图像中各个像素点的像素值;根据像素值,确定所述第一样本图像中的文本区域;将所述第一样本图像进行图像语义本文档来自技高网...

【技术保护点】
1.一种包含文本的图像生成方法,其特征在于,所述方法包括:/n获取第一样本图像中各个像素点的像素值;/n根据像素值,确定所述第一样本图像中的文本区域;/n将所述第一样本图像进行图像语义分割,得到多个语义分割区域;/n根据所述文本区域与语义分割区域的重合关系,从所述多个语义分割区域中确定目标背景区域;/n获取目标文本图像,并将所述目标文本图像与所述目标背景区域融合,生成第二样本图像。/n

【技术特征摘要】
1.一种包含文本的图像生成方法,其特征在于,所述方法包括:
获取第一样本图像中各个像素点的像素值;
根据像素值,确定所述第一样本图像中的文本区域;
将所述第一样本图像进行图像语义分割,得到多个语义分割区域;
根据所述文本区域与语义分割区域的重合关系,从所述多个语义分割区域中确定目标背景区域;
获取目标文本图像,并将所述目标文本图像与所述目标背景区域融合,生成第二样本图像。


2.根据权利要求1所述的方法,其特征在于,所述根据像素值,确定所述第一样本图像中的文本区域,包括:
将所述第一样本图像输入文本定位模型,通过所述文本定位模型对所述第一样本图像进行特征统计,得到所述第一样本图像中的多个待选文本区域;
利于非极大值抑制算法,对所述多个待选文本区域进行合并过滤,得到所述第一样本图像中的文本区域。


3.根据权利要求1所述的方法,其特征在于,所述获取目标文本图像,并将所述目标文本图像与所述目标背景区域融合,生成第二样本图像,包括:
确定目标文本内容,以及所述目标文本内容对应的文本信息;
根据所述目标文本内容和文本信息,生成目标文本图像;
采用图像融合算法,将所述目标文本图像与所述目标背景区域融合,生成所述第二样本图像。


4.根据权利要求1至3任一项所述的方法,其特征在于,所述将所述第一样本图像进行图像语义分割,得到多个语义分割区域之后,所述根据所述文本区域与语义分割区域的重合关系,从所述多个语义分割区域中确定目标背景区域之前,还包括:
确定所述第一样本图像中文本区域的面积,将面积小于第一面积阈值的文本区域删去;
确定所述语义分割区域的面积,将面积小于第二面积阈值的语义分割区域删去。


5.一种包含文本的图像生成装置,其特征在于,所述装置包括:
获取单元,用于获取第一样本图...

【专利技术属性】
技术研发人员:费志军邱雪涛何朔
申请(专利权)人:中国银联股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1