【技术实现步骤摘要】
图像识别方法、装置和电子设备
[0001]本申请涉及人工智能领域,具体而言,涉及一种图像识别方法、装置和电子设备。
技术介绍
[0002]如今我国互联网在不断发展的同时,互联网金融业也在逐步增长,网上支付逐渐成为人们日常的支付的主要方式,通常情况下,手动输入银行卡号不仅耗时也容易误输数字,特别对于文化水平较低的老年人,避免复杂性的操作,如何高效正确绑定银行卡成为亟待发展的一项技术。同时,在某种自然场景下中由于银行卡的翻折、磨损、银行卡上字体模糊等问题,快速准确的在复杂场景中检测到文字仍面临着巨大挑战。因此,如何从图像中精准定位文本所在位置区域成为了目前亟待解决的技术问题。
[0003]针对相关技术中无法对图像中的文本所在的位置区域进行准确定位的问题,目前尚未提出有效的解决方案。
技术实现思路
[0004]本申请的主要目的在于提供一种图像识别方法、装置和电子设备,以解决相关技术中无法对图像中的文本所在的位置区域进行准确定位的问题。
[0005]为了实现上述目的,根据本申请的一个方面,提供了一种图 ...
【技术保护点】
【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:获取待识别的目标图像,其中,所述目标图像中的目标区域与所述目标图像的图像区域之间的面积比值小于或等于目标阈值,所述目标区域为显示有文本对象的图像区域;在目标图像识别模型中的特征增强网络中对所述目标图像的第一图像特征进行空洞卷积处理,得到第二图像特征,其中,所述第一图像特征为所述目标图像识别模型中的特征提取网络根据所述目标图像提取得到的图像特征,所述第二图像特征对应的感受野大于所述第一图像特征对应的感受野;根据所述第二图像特征确定多个候选区域,并通过所述目标图像识别模型中的预测网络确定出所述多个候选区域各自对应的置信度;将所述置信度大于或等于置信阈值的所述候选区域确定为所述目标区域。2.根据权利要求1所述的方法,其特征在于,所述在目标图像识别模型中的特征增强模块中对所述目标图像的第一图像特征进行空洞卷积处理,得到第二图像特征,包括:在所述特征增强模块中,按照目标采样率的空洞卷积对所述第一图像特征进行采样,得到第二图像特征。3.根据权利要求2所述的方法,其特征在于,所述在所述特征增强模块中,按照目标采样率的空洞卷积对所述第一图像特征进行采样,得到第二图像特征,包括:获取扩张系数序列和与所述扩张系数序列匹配的空洞系数序列,其中,所述扩张系数序列中的每一个扩张系数用于指示卷积核之间的间隔数量;依次获取所述扩张系数序列和所述空洞系数序列中的一个所述扩张系数和与所述扩张系数对应的一个空洞系数,并基于所述扩张系数和所述空洞系数对所述第一图像特征按照所述目标采样率进行采样,得到N个第二图像特征,其中,所述扩张系数序列中包括N个扩张系数,所述空洞系数序列中包括与所述N个扩张系数分别对应的N个空洞系数,所述N为大于或等于1的整数。4.根据权利要求1所述的方法,其特征在于,所述根据所述第二图像特征确定多个候选区域,并通过所述目标图像识别模型中的预测网络确定出所述多个候选区域各自对应的置信度,包括:根据所述目标图像识别模型中的特征融合网络,对所述第二图像特征进行特征融合处理,得到融合特征;利用目标激活函数以及第一卷积核对所述融合特征进行处理,得到第一预测方程矩阵,其中,所述第一预测方程矩阵用于指示所述目标图像中的像素点为文本图像中的像素点的第一概率值;利用所述目标激活函数和第二卷积核对所述融合特征进行处理,得到第二预测方程矩阵,其中,所述第二预测方程矩阵用于指示所述目标图像中的所述候选区域为所述目标区域的第二概率值;利用所述目标激活函数和第三卷积核对所述融合特征进行处理,得到第三预测方程矩阵,其中,所述第三预测方程矩阵用于指示所述目标图像中的所述候选区域的区域倾斜角度的第三概率值。5.根据权利要求1所述的方法,其特征在于,所述在目标图像识别模型中的特征增强网络中对所述目标图像的第一图像特征进行空洞卷积处理,得到第二图像特征之前,还包括:
对所述目标图像进行图像预处理,得到参考图像;利用特征提取网络对所述参考图像进行特征提取,得到所述第一图像特征,其中,所述特征提取网络包括所述深度残差网络。6.根据权利要求...
【专利技术属性】
技术研发人员:张森,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。