【技术实现步骤摘要】
智能识别图片文字的方法、装置、计算机设备及存储介质
[0001]本申请涉及人工智能
,尤其涉及智能识别图片文字的方法、装置、计算机设备及存储介质。
技术介绍
[0002]随着计算机技术的不断革新与发展,计算机技术已经逐渐的应用于各行各业,影响着人们的生活。在计算机技术中人工智能具有重要的地位,近年来,随着人工智能的发展,通过计算机技术对图片中的文字进行识别已得到广泛应用,文字是视觉中主要的信息来源,因此识别图像中的文字信息有着重大的意义。
[0003]目前,深度学习模型在场景文字识别上取得很好的效果,能够快速识别出图片中的文字。但是,由于图片中常常存在不同的字体,在对深度学习模型进行训练的时候,需要收集海量的不同字体的图片来训练深度学习模型,而在增加新的字体时,又需要收集对应字体的海量图片,造成图片收集周期长,收集繁琐等问题。
技术实现思路
[0004]本申请实施例的目的在于提出一种智能识别图片文字的方法、装置、计算机设备及存储介质,无需准备大量的数据单图片作为训练样本,提升模型的训练效率。r/>[0005]为本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种智能识别图片文字的方法,其特征在于,包括下述步骤:接收多张数据单图片,基于所述数据单图片生成初始单文字图层,其中,不同的数据单图片之间的文字类型不同;标注所述初始单文字图层,生成目标单文字图层,并基于所述目标单文字图层生成单字体图片库;接收目标字符串,基于所述目标字符串提取所述单字体图片库中的目标单文字图层,基于所述目标单文字图层和预设的背景图片生成训练样本,其中,所述背景图片中包含噪声;将所述训练样本输入至预设的初始文字识别模型中,获得第一文字识别结果,并基于所述第一文字识别结果和预设的损失函数计算损失值,直至所述损失函数收敛,获得目标文字识别模型;接收待识别数据单图片,将所述待识别数据单图片输入至目标文字识别模型中,获得第二文字识别结果。2.根据权利要求1所述的智能识别图片文字的方法,其特征在于,所述基于所述数据单图片生成初始单文字图层的步骤包括:基于预先训练的行文本切分模型,切分所述数据单图片中的文字,获得行文字图片;将所述文字图片转换为灰度图,并基于所述灰度图生成图片直方图;基于预设的三角法获取所述图片直方图中的二值化阈值,并通过所述二值化阈值调整所述灰度图,获得文字二值化图片;获取所述文字二值化图片中每个连通域的高和宽,并根据所述高和宽确定出当前连通域的相邻区域,将所述当前连通域和所述相邻区域作为待识别区域;判断所述待识别区域中是否含除所述当前连通域以外的连通域,在所述待识别区域中不含有除所述当前连通域以外的连通域时,将所述待识别区域设定为孤立域;去除所述孤立域,获得调整后的文字图层,并基于预先训练的单文字切分模型切分所述调整后的文字图层生成所述单文字图层。3.根据权利要求2所述的智能识别图片文字的方法,其特征在于,所述通过所述二值化阈值调整所述灰度图,获得文字二值化图片的步骤包括:对比所述灰度图中每个像素的灰度值是否超过所述二值化阈值;在所述灰度值超过所述二值化阈值时,将对应的像素的灰度值调整为预设的第一灰度值;在所述灰度值未超过所述二值化阈值时,将对应的像素的灰度值调整为预设的第二灰度值;当完成对所述灰度图中所有像素的调整后,获得所述文字二值化图片。4.根据权利要求2所述的智能识别图片文字的方法,其特征在于,所述基于预先训练的文本切分模型,切分所述数据单图片中的文字,获得行文字图片的步骤包括:基于预先训练的行文本切分模型,切分所述数据单图片中的文字,获得行文字图片;将所述初始文字图片等比例缩放至预设的尺寸,获得所述行文字图片。5.根...
【专利技术属性】
技术研发人员:谢达荣,
申请(专利权)人:平安普惠企业管理有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。