图像特征识别方法及装置制造方法及图纸

技术编号:28505212 阅读:13 留言:0更新日期:2021-05-19 22:57
本发明专利技术涉及一种图像特征识别方法及装置,所述方法包括获取图片,采用预设模板或形状识别模型对所述图片进行识别,并在识别成功后进行定位;所述采用预设模板对所述图片进行识别,包括:获取所述图片中与预设模板的图像的匹配区域;计算所述匹配区域的匹配度,在所述匹配度大于预设阈值时确定识别成功。本发明专利技术能够实现对图片上的文字或图像的识别,从而进行定位。定位。定位。

【技术实现步骤摘要】
图像特征识别方法及装置


[0001]本专利技术属于图像识别
,具体涉及一种图像特征识别方法及装置。

技术介绍

[0002]图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术,是应用深度学习算法的一种实践应用。现阶段图像识别技术一般分为人脸识别与商品识别,人脸识别主要运用在安全检查、身份核验与移动支付中;商品识别主要运用在商品流通过程中,特别是无人货架、智能零售柜等无人零售领域。
[0003]相关技术中,图像识别方式存在无法实现定位的问题。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于克服现有技术的不足,提供一种图像特征识别方法及装置,以解决现有技术中图像识别无法定位的问题。
[0005]为实现以上目的,本专利技术采用如下技术方案:一种图像特征识别方法,包括:
[0006]获取图片;
[0007]采用预设模板或形状识别模型对所述图片进行识别,并在识别成功后进行定位;
[0008]所述采用预设模板对所述图片进行识别,包括:
[0009]获取所述图片中与预设模板的图像的匹配区域;
[0010]计算所述匹配区域的匹配度,在所述匹配度大于预设阈值时确定识别成功。
[0011]进一步的,所述获取图片,包括:
[0012]通过移动客户端的相机拍摄或截图的方式获取到待识别的图片;
[0013]如果所述待识别的图片上文字的倾斜角大于预设阈值时,对所述待识别的图片进行倾斜校正,得到图片。
[0014]进一步的,采用形状识别模型对所述图片进行识别,包括:
[0015]获取样本图片,对所述样本图片进行形状和类型设定,得到训练集和测试数据集;
[0016]根据训练集和测试数据集对神经网络模型进行训练至神经网络模型收敛,得到形状识别模型;
[0017]对所述图片进行预处理,得到待处理图像;
[0018]将所述待处理图像输入到所述形状识别模型中进行计算,输出识别结果。
[0019]进一步的,对所述图片进行预处理,包括:
[0020]对所述图片进行灰度化,得到灰度图像;
[0021]将所述灰度图像进行压缩,得到压缩图像;
[0022]将所述压缩图像转换为一维向量并进行归一化。
[0023]进一步的,对所述图片进行预处理,还包括:
[0024]对所述图片进行版面分析,包括:
[0025]将所述图片中所有文字块进行切分,区分文本段落、排版顺序、域内属性及各文字
块的联系关系;
[0026]当所述图片中含有表格区域时,对表格区域单独进行表格分析处理。
[0027]进一步的,所述采用预设模板对所述图片进行识别,还包括:
[0028]计算识别率。
[0029]进一步的,所述计算识别率,包括:
[0030]将匹配度值存储在矩阵中;所述匹配度值作为所述矩阵的左上角顶点;
[0031]计算所述矩阵的相关系数并进行归一化处理。
[0032]本申请实施例提供一种图像特征识别装置,包括:
[0033]获取模块,用于获取图片;
[0034]识别模块,用于采用预设模板或形状识别模型对所述图片进行识别,并在识别成功后进行定位;
[0035]所述采用预设模板对所述图片进行识别,包括:
[0036]获取所述图片中与预设模板的图像的匹配区域;
[0037]计算所述匹配区域的匹配度,在所述匹配度大于预设阈值时确定识别成功。
[0038]本申请实施例提供一种计算机设备,包括处理器,以及与处理器连接的存储器;
[0039]存储器用于存储计算机程序,计算机程序用于执行上述任一实施例提供的图像特征识别方法;
[0040]处理器用于调用并执行存储器中的计算机程序。
[0041]本专利技术采用以上技术方案,能够达到的有益效果包括:
[0042]本专利技术提供一种图像特征识别方法及装置,所述方法包括获取图片,采用预设模板或形状识别模型对所述图片进行识别,并在识别成功后进行定位;所述采用预设模板对所述图片进行识别,包括:获取所述图片中与预设模板的图像的匹配区域;计算所述匹配区域的匹配度,在所述匹配度大于预设阈值时确定识别成功。本专利技术能够实现对图片上的文字或图像的识别,从而进行定位。
附图说明
[0043]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0044]图1为本专利技术图像特征识别方法的步骤示意图;
[0045]图2为本专利技术图像特征识别装置的结构示意图。
具体实施方式
[0046]为使本专利技术的目的、技术方案和优点更加清楚,下面将对本专利技术的技术方案进行详细的描述。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本专利技术所保护的范围。
[0047]下面结合附图介绍本申请实施例中提供的一个具体的图像特征识别方法。
[0048]如图1所示,本申请实施例中提供的图像特征识别方法包括:
[0049]S101,获取图片;
[0050]S102,采用预设模板或形状识别模型对所述图片进行识别,并在识别成功后进行定位;
[0051]所述采用预设模板对所述图片进行识别,包括:
[0052]获取所述图片中与预设模板的图像的匹配区域;
[0053]计算所述匹配区域的匹配度,在所述匹配度大于预设阈值时确定识别成功。
[0054]优选的,所述获取图片,包括:
[0055]通过移动客户端的相机拍摄或截图的方式获取到待识别的图片;
[0056]如果所述待识别的图片上文字的倾斜角大于预设阈值时,对所述待识别的图片进行倾斜校正,得到图片。
[0057]本申请是通过相机或截图的方式获取到需要识别的图文资料,通常来说就是图片。图片的质量是OCR正确识别的前提条件。需要识别的图像在预处理检测的时文字的倾斜角小,在进行倾斜校正后,文字图像的变形就小。图像文字的清晰度也是重要的识别指标。图像的质量越高,文字的识别正确率就越高。反之如果图片质量较低,文字的断笔等其他噪点过多可能会分检出半个文字等图像样本。文字断笔和笔画粘连会造成有些特征丢失,在将其特征与特征库比较时,会使其特征距离加大,识别率就会降低。
[0058]图像特征识别方法的工作原理为:本申请首先获取图片,然后采用预设模板或形状识别模型对图片进行识别,如果能够识别到图片上的特征,则识别成功,对特征进行定位。例如,用户想要点击验证码,首先识别是否存在验证码,如果存在,则进行定位,定位后对验证本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像特征识别方法,其特征在于,包括:获取图片;采用预设模板或形状识别模型对所述图片进行识别,并在识别成功后进行定位;所述采用预设模板对所述图片进行识别,包括:获取所述图片中与预设模板的图像的匹配区域;计算所述匹配区域的匹配度,在所述匹配度大于预设阈值时确定识别成功。2.根据权利要求1所述的方法,其特征在于,所述获取图片,包括:通过移动客户端的相机拍摄或截图的方式获取到待识别的图片;如果所述待识别的图片上文字的倾斜角大于预设阈值时,对所述待识别的图片进行倾斜校正,得到图片。3.根据权利要求1所述的方法,其特征在于,采用形状识别模型对所述图片进行识别,包括:获取样本图片,对所述样本图片进行形状和类型设定,得到训练集和测试数据集;根据训练集和测试数据集对神经网络模型进行训练至神经网络模型收敛,得到形状识别模型;对所述图片进行预处理,得到待处理图像;将所述待处理图像输入到所述形状识别模型中进行计算,输出识别结果。4.根据权利要求3所述的方法,其特征在于,对所述图片进行预处理,包括:对所述图片进行灰度化,得到灰度图像;将所述灰度图像进行压缩,得到压缩图像;将所述压缩图像转换为一维向量并进行归一化。5.根据权利要求4所述的方法...

【专利技术属性】
技术研发人员:褚建杰
申请(专利权)人:北京东方金朔信息技术有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1