The present invention provides an image recognition method based on neural network, which comprises the following steps: S101, multi class neural network learning sample pictures; S102, training the neural network identification picture sample; S103, according to the test image multiscale convolution test; S104, multiple convolution results combined with; S105, the total weight of the highest or highest confidence label output as the only label, the invention can treat all the information in the test image under a variety of conditions for identification and classification, wide application range, high recognition accuracy.
【技术实现步骤摘要】
一种基于神经网络的图像识别方法
本专利技术涉及神经网络领域,尤其是一种基于神经网络的图像识别方法。
技术介绍
随着计算机与信息技术的不断演进,机器学习以及模式识别已成为近几年来最炙手可热的领域之一。在一些以往需要人执行的图像识别任务正在逐渐被机器替代,例如车牌识别,人脸识别以及指纹识别等。虽然这些领域已经有相对成熟的解决方案,但是其方案应用的领域非常有限,往往只能在特定条件的环境下才能达到预期的识别效果;除此之外,传统的图像识别技术往往只能提取图片的局部信息,而无法对待测试图片中的所有信息作识别以及分类,应用范围广泛,识别准确度高。
技术实现思路
本专利技术的目的在于提供一种基于神经网络的图像识别方法,克服了现有技术的困难,能够在各种条件下对待测试图片中的所有信息作识别以及分类,应用范围广泛,识别准确度高。根据本专利技术的一个方面,提供一种基于神经网络的图像识别方法,包括以下步骤:S101、多类神经网络学习图片样本:所述多类神经网络包括大量的神经元,将多个带有字符的图片样本以及背景图片样本分别提供给所述神经元进行学习,所述多类神经网络针对所述图片样本生成若N类标签,所 ...
【技术保护点】
一种基于神经网络的图像识别方法,其特征在于,包括以下步骤:S101、多类神经网络学习图片样本:所述多类神经网络包括大量的神经元,将多个带有字符的图片样本以及背景图片样本分别提供给所述神经元进行学习,所述多类神经网络针对所述图片样本生成若N类标签,所述标签至少包括一个代表背景的标签、若干代表阿拉伯数字的标签和/或若干代表英文字母的标签,每个所述图片样本对应所述标签中的一类;S102、训练所述多类神经网络辨识图片样本:将多个带有字符的图片样本以及背景图片样本分别提供给所述神经网络进行训练,根据所述多类神经网络汇总对于所有训练样本的权值,并将所述权值作为所述神经网络的匹配参数;S ...
【技术特征摘要】
1.一种基于神经网络的图像识别方法,其特征在于,包括以下步骤:S101、多类神经网络学习图片样本:所述多类神经网络包括大量的神经元,将多个带有字符的图片样本以及背景图片样本分别提供给所述神经元进行学习,所述多类神经网络针对所述图片样本生成若N类标签,所述标签至少包括一个代表背景的标签、若干代表阿拉伯数字的标签和/或若干代表英文字母的标签,每个所述图片样本对应所述标签中的一类;S102、训练所述多类神经网络辨识图片样本:将多个带有字符的图片样本以及背景图片样本分别提供给所述神经网络进行训练,根据所述多类神经网络汇总对于所有训练样本的权值,并将所述权值作为所述神经网络的匹配参数;S103、通过不同卷积窗的尺寸针对待测试图片进行多尺度卷积测试:在同一尺寸的卷积窗卷积测试中,将每一次的卷积窗内对应的局部所述待测试图片输入到所述图像识别神经网络,通过神经网络运算得到一个N*1的一维输出矩阵,将所述一维输出矩阵中的最大值作为代表每个所述卷积窗的置信度,所述最大值所对应的标签作为所述卷积窗的标签,随着卷积窗会逐步位移,依次扫描整张待测试图片,以此将每个所述卷积窗映射到代表该卷积窗在待测试图片中位置的二维矩阵中得到一个最大值矩阵和一个标签矩阵;S104、将多种卷积窗尺寸下的标签矩阵进行结合:将多种不同卷积窗尺寸通过所述卷积测试得到的最大值标签矩阵投影到同一个平面矩阵,然后将所述平面矩阵中所有代表相同字符且位置相近的点的集合认为其预测的是同一个字符,作为一簇,并且不断地将簇之间距离小于卷积窗的长度或是宽度的一半的点归为该簇,将簇之间距离大于卷积窗的长度或是宽度的一半的点归为新的一簇,从而计算出所有簇的中心坐标;以及S105、将所述簇中累计权重最高的标签或是将置信度最高的标签输出作为唯一的标签。2.如权利要求1所述的基于神经网络的图像识别方法,其特征在于:所述步骤S101中,在N类标签中,将每个带有字符的图片样本的标签设为大于0的不同整数数值,而所述背景图片样本的标签设为-1。3.如权利要求2所述的基于神经网络的图像识别方法,其特征在于:带有单个阿拉伯数字字符的所述图片样本的标签是0至9中的一个;带有单个英文字母字符的所述图片样本的标签是11至36中的一个。4.如权利要求1所述的基于神经网络的图像识别方法,其特征在于:所述标签还包括若干代表中文字符的标签、若干日文字符的标签、若干韩文字符的标签、若干法文字符的标签以及若干俄文字符的标签。5.如权利要求1所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。