一种图像识别的方法及装置制造方法及图纸

技术编号:16645310 阅读:47 留言:0更新日期:2017-11-26 18:25
本发明专利技术提供了一种图像识别的方法及装置,该方法,包括:预先构建初始神经网络;对所述初始神经网络进行训练,生成训练后的神经网络;将待处理图像输入到所述训练后的神经网络中;利用所述训练后的神经网络,确定出所述待处理图像中的至少一个识别目标,并生成每个所述识别目标的预设数量个图像特征值。本发明专利技术提供了一种图像识别的方法及装置,能够缩短图像识别的时间。

Method and device for image recognition

The present invention provides a method and device, the method of image recognition, including: pre construction of the initial neural network; training of the initial neural network, neural network generated after training; the original image is input into the trained neural network; using the trained neural network. Determine the at least one recognition target image to be processed, and generate each of the target identification number of a preset image characteristic value. The invention provides a method and device for image recognition, which can shorten the time of image recognition.

【技术实现步骤摘要】
一种图像识别的方法及装置
本专利技术涉及图像识别
,特别涉及一种图像识别的方法及装置。
技术介绍
随着图像识别技术的快速发展,图像识别应用越来越广泛,用户对图像识别的要求也越来越高。现有技术中,图像识别主要是包括两个步骤,首先是要确定待识别的目标的位置,针对该位置进行识别。这个过程一般需要通过两个神经网络来实现,其中,第一个神经网络确定目标的位置,第二个神经网络针对给位置进行识别。通过上述描述可见,现有技术在进行图像识别时,需要通过两个神经网络来实现,需要进行至少两次神经网络演算,需要的时间较长。
技术实现思路
本专利技术实施例提供了一种图像识别的方法及装置,能够缩短图像识别的时间。第一方面,本专利技术实施例提供了一种图像识别的方法,包括:预先构建初始神经网络;对所述初始神经网络进行训练,生成训练后的神经网络;包括:将待处理图像输入到所述训练后的神经网络中;利用所述训练后的神经网络,确定出所述待处理图像中的至少一个识别目标,并生成每个所述识别目标的预设数量个图像特征值。进一步地,所述预先构建初始神经网络,包括:将YOLO神经网络的输出结果设置为所述图像特征值,生成基于所述YOLO神经网络的所述初始神经网络。进一步地,所述预先构建初始神经网络,包括:设置所述初始神经网络的损失函数;根据所述初始神经网络的损失函数,生成所述初始神经网络;其中,所述初始神经网络的损失函数为:其中,λc为位置权重,S2为从当前训练图像中分出的方格的数量,B为每个所述方格产生的定位框的数量,为第i个方格的第j个定位框中含有所述当前训练图像中的识别目标的矩阵,xi为从第i个方格选出的目标定位框的预测出的中心横坐标,为所述目标定位框的实际的中心横坐标,yi为所述目标定位框的预测出的中心纵坐标,为所述目标定位框的实际的中心纵坐标,wi为所述目标定位框的预测出的宽度,为所述目标定位框的实际的宽度,hi为所述目标定位框的预测出的高度,为所述目标定位框的实际的高度,Ci为预测出的第i个方格中有识别目标的概率值,为实际的第i个方格中有识别目标的概率值,λn为没有识别目标的权重,为第i个方格的第j个定位框中不含有所述当前训练图像中的识别目标的矩阵,N为三元组个数,为第i个三元组中的元素,为第i个三元组中与属于相同类别的元素,为第i个三元组中的与属于不同类别的元素,为的所述预设数量个图像特征值构成的特征向量值,为的所述预设数量个图像特征值构成的特征向量值,为的所述预设数量个图像特征值构成的特征向量值,α为所述三元组的阈值。进一步地,所述对所述初始神经网络进行训练,生成训练后的神经网络,包括:根据所述初始神经网络的损失函数,对所述初始神经网络进行训练,当所述初始神经网络的损失函数的值满足预设要求时,生成所述训练后的神经网络。进一步地,该方法进一步包括:预先设置至少一个标准目标的所述预设数量个标准特征值;在所述利用所述训练后的神经网络,确定出所述待处理图像中的至少一个识别目标,并生成每个所述识别目标的预设数量个图像特征值之后,进一步包括:针对每个所述识别目标,执行:将当前识别目标的所述预设数量个所述图像特征值输入到预先设置的分类器中;利用所述分类器,将所述当前识别目标的所述预设数量个所述图像特征值与所述至少一个标准目标的所述预设数量个标准特征值进行比对,输出比对结果。进一步地,所述图像特征值,包括:人脸特征值。进一步地,所述预设数量包括:128。第二方面,本专利技术实施例提供了一种图像识别的装置,包括:构建单元,用于构建初始神经网络;神经网络训练单元,用于对所述初始神经网络进行训练,生成训练后的神经网络;输入单元,用于将待处理图像输入到所述训练后的神经网络中;识别单元,用于利用所述训练后的神经网络,确定出所述待处理图像中的至少一个识别目标,并生成每个所述识别目标的预设数量个图像特征值。进一步地,所述构建单元,用于将YOLO神经网络的输出结果设置为所述图像特征值,生成基于所述YOLO神经网络的所述初始神经网络。进一步地,所述构建单元,用于设置所述初始神经网络的损失函数,根据所述初始神经网络的损失函数,生成所述初始神经网络;其中,所述初始神经网络的损失函数为:其中,λc为位置权重,S2为从当前训练图像中分出的方格的数量,B为每个所述方格产生的定位框的数量,为第i个方格的第j个定位框中含有所述当前训练图像中的识别目标的矩阵,xi为从第i个方格选出的目标定位框的预测出的中心横坐标,为所述目标定位框的实际的中心横坐标,yi为所述目标定位框的预测出的中心纵坐标,为所述目标定位框的实际的中心纵坐标,wi为所述目标定位框的预测出的宽度,为所述目标定位框的实际的宽度,hi为所述目标定位框的预测出的高度,为所述目标定位框的实际的高度,Ci为预测出的第i个方格中有识别目标的概率值,为实际的第i个方格中有识别目标的概率值,λn为没有识别目标的权重,为第i个方格的第j个定位框中不含有所述当前训练图像中的识别目标的矩阵,N为三元组个数,为第i个三元组中的元素,为第i个三元组中与属于相同类别的元素,为第i个三元组中的与属于不同类别的元素,为的所述预设数量个图像特征值构成的特征向量值,为的所述预设数量个图像特征值构成的特征向量值,为的所述预设数量个图像特征值构成的特征向量值,α为所述三元组的阈值。进一步地,所述神经网络训练单元,用于根据所述初始神经网络的损失函数,对所述初始神经网络进行训练,当所述初始神经网络的损失函数的值满足预设要求时,生成所述训练后的神经网络。进一步地,该装置进一步包括:设置单元,用于设置至少一个标准目标的所述预设数量个标准特征值;分类单元,用于针对所述识别单元确定出的每个所述识别目标,执行:将所述识别单元生成的当前识别目标的所述预设数量个所述图像特征值输入到预先设置的分类器中;利用所述分类器,将所述当前识别目标的所述预设数量个所述图像特征值与所述至少一个标准目标的所述预设数量个标准特征值进行比对,输出比对结果。进一步地,所述图像特征值,包括:人脸特征值。进一步地,所述预设数量包括:128。在本专利技术实施例中,构建了初始神经网络,并对该初始神经网络进行训练,生成训练后的神经网络,利用该训练后的神经网络进行待处理图像的识别,利用该训练后的神经网络能够在同一个神经网络中实现确定识别目标和生成识别目标的图像特征值,只进行一次神经网络的演算即可,缩短了图像识别的时间。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例提供的一种图像识别的方法的流程图;图2是本专利技术一实施例提供的另一种图像识别的方法的流程图;图3是本专利技术一实施例提供的一种图像识别的装置的示意图;图4是本专利技术一实施例提供的另一种图像识别的装置的示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例,基于本专利技术中的实施例,本领域普通技术本文档来自技高网...
一种图像识别的方法及装置

【技术保护点】
一种图像识别的方法,其特征在于,预先构建初始神经网络;对所述初始神经网络进行训练,生成训练后的神经网络;包括:将待处理图像输入到所述训练后的神经网络中;利用所述训练后的神经网络,确定出所述待处理图像中的至少一个识别目标,并生成每个所述识别目标的预设数量个图像特征值。

【技术特征摘要】
1.一种图像识别的方法,其特征在于,预先构建初始神经网络;对所述初始神经网络进行训练,生成训练后的神经网络;包括:将待处理图像输入到所述训练后的神经网络中;利用所述训练后的神经网络,确定出所述待处理图像中的至少一个识别目标,并生成每个所述识别目标的预设数量个图像特征值。2.根据权利要求1所述的方法,其特征在于,所述预先构建初始神经网络,包括:将YOLO神经网络的输出结果设置为所述图像特征值,生成基于所述YOLO神经网络的所述初始神经网络。3.根据权利要求1所述的方法,其特征在于,所述预先构建初始神经网络,包括:设置所述初始神经网络的损失函数;根据所述初始神经网络的损失函数,生成所述初始神经网络;其中,所述初始神经网络的损失函数为:其中,λc为位置权重,S2为从当前训练图像中分出的方格的数量,B为每个所述方格产生的定位框的数量,为第i个方格的第j个定位框中含有所述当前训练图像中的识别目标的矩阵,xi为从第i个方格选出的目标定位框的预测出的中心横坐标,为所述目标定位框的实际的中心横坐标,yi为所述目标定位框的预测出的中心纵坐标,为所述目标定位框的实际的中心纵坐标,wi为所述目标定位框的预测出的宽度,为所述目标定位框的实际的宽度,hi为所述目标定位框的预测出的高度,为所述目标定位框的实际的高度,Ci为预测出的第i个方格中有识别目标的概率值,为实际的第i个方格中有识别目标的概率值,λn为没有识别目标的权重,为第i个方格的第j个定位框中不含有所述当前训练图像中的识别目标的矩阵,N为三元组个数,为第i个三元组中的元素,为第i个三元组中与属于相同类别的元素,为第i个三元组中的与属于不同类别的元素,为的所述预设数量个图像特征值构成的特征向量值,为的所述预设数量个图像特征值构成的特征向量值,为的所述预设数量个图像特征值构成的特征向量值,α为所述三元组的阈值。4.根据权利要求3所述的方法,其特征在于,所述对所述初始神经网络进行训练,生成训练后的神经网络,包括:根据所述初始神经网络的损失函数,对所述初始神经网络进行训练,当所述初始神经网络的损失函数的值满足预设要求时,生成所述训练后的神经网络。5.根据权利要求1-4中的任一所述的方法,其特征在于,进一步包括:预先设置至少一个标准目标的所述预设数量个标准特征值;在所述利用所述训练后的神经网络,确定出所述待处理图像中的至少一个识别目标,并生成每个所述识别目标的预设数量个图像特征值之后,进一步包括:针对每个所述识别目标,执行:将当前识别目标的所述预设数量个所述图像特征值输入到预先设置的分类器中;利用所述分类器,将所述当前识别目标的所述预设数量个所述图像特征值与所述至少一个标准目标的所述预设数量个标准特征值进行比对,输出比对结果;和/或,所述图像特征值,包括:人脸特征...

【专利技术属性】
技术研发人员:张旭段成德于治楼
申请(专利权)人:济南浪潮高新科技投资发展有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1