一种图像识别方法、装置及终端设备制造方法及图纸

技术编号:23985363 阅读:33 留言:0更新日期:2020-04-29 13:16
本申请适用于图像处理技术领域,提供了一种图像识别方法、装置及终端设备,所述方法包括:获取样本训练集;执行特征提取操作,将样本训练集中的样本图像组输入孪生神经网络中,得到第一特征向量和第二特征向量,第一特征向量和第二特征向量均为归一化后的特征向量;根据第一特征向量、第二特征向量、样本标记以及基于余弦距离的对比损失函数计算损失值;若损失值大于预设损失阈值且迭代次数小于预设迭代次数,根据损失值更新孪生神经网络,迭代次数加1,返回特征提取操作;若损失值小于或等于预设损失阈值,或迭代次数大于或等于预设迭代次数,使用孪生神经网络对待处理图像组进行图像识别。本申请可以解决现有的图像识别方法的准确率低的问题。

An image recognition method, device and terminal equipment

【技术实现步骤摘要】
一种图像识别方法、装置及终端设备
本申请属于图像处理
,尤其涉及一种图像识别方法、装置及终端设备。
技术介绍
在当前的图像处理领域中,人脸识别、行人重识别等图像识别任务属于细粒度图像分类问题,类别数多,不同的人脸图像、行人图像之间的差别小,辨识难度高。目前的图像识别方法在处理这些细粒度的图像分类问题时,仍存在准确率较低的问题。人们积极探索各类图像识别方案,希望能够将相同人或物体的图像特征的距离拉近,将不同人或物体的图像特征的距离拉远,更高精度地处理这些细粒度的图像分类问题。因此,如何提高当前的图像识别方法的准确率成为了本领域技术人员亟需解决的问题。
技术实现思路
有鉴于此,本申请实施例提供了一种图像识别方法、装置及终端设备,以解决现有的图像识别方法的准确率低的问题。本申请实施例的第一方面提供了一种图像识别方法,包括:获取样本训练集,所述训练样本集包括至少一组样本图像组以及所述样本图像组对应的样本标记,每组样本图像组包括两张样本图像;执行特征提取操作,所述特征提取操作包括将所述样本训练集中的所述样本图像组输入孪生神经网络中,得到所述样本图像组对应的第一特征向量和第二特征向量,其中,所述第一特征向量和所述第二特征向量均为归一化后的特征向量;根据所述第一特征向量、所述第二特征向量、所述样本标记以及基于余弦距离的对比损失函数计算损失值;若所述损失值大于预设损失阈值且迭代次数小于预设迭代次数,则根据所述损失值更新所述孪生神经网络,所述迭代次数加1,返回所述特征提取操作;若所述损失值小于或等于预设损失阈值,或所述迭代次数大于或等于预设迭代次数,则使用所述孪生神经网络对待处理图像组进行图像识别。本申请实施例的第二方面提供了一种图像识别装置,包括:训练样本模块,用于获取样本训练集,所述训练样本集包括至少一组样本图像组以及所述样本图像组对应的样本标记,每组样本图像组包括两张样本图像;特征提取模块,用于执行特征提取操作,所述特征提取操作包括将所述样本训练集中的所述样本图像组输入孪生神经网络中,得到所述样本图像组对应的第一特征向量和第二特征向量,其中,所述第一特征向量和所述第二特征向量均为归一化后的特征向量;损失计算模块,用于根据所述第一特征向量、所述第二特征向量、所述样本标记以及基于余弦距离的对比损失函数计算损失值;模型更新模块,用于若所述损失值大于预设损失阈值且迭代次数小于预设迭代次数,则根据所述损失值更新所述孪生神经网络,所述迭代次数加1,触发特征提取模块;图像识别模块,用于若所述损失值小于或等于预设损失阈值,或所述迭代次数大于或等于预设迭代次数,则使用所述孪生神经网络对待处理图像组进行图像识别。本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述方法的步骤。本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述方法的步骤。本申请实施例的第五方面提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备实现如上述方法的步骤。本申请实施例与现有技术相比存在的有益效果是:在本申请的图像识别方法中,采用的孪生神经网络提取图像组的特征时,会对特征向量进行归一化,特征向量的归一化可以使得到的深度图像特征更加分离,提高图像识别的效果。并且,对特征向量进行归一化后,特征向量会被映射到一个超球体的球面,而非欧式空间,因此,本方法使用基于余弦距离的对比损失函数替代基于欧式距离的对比损失函数,可以更好地度量归一化的特征向量之间的损失值,更好地对孪生神经网络进行训练,提高孪生神经网络的图像识别准确率,解决了现有的图像识别方法的准确率低的问题。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的一种图像识别方法的流程示意图;图2是本申请实施例提供的一种图像识别装置的结构示意图;图3是本申请实施例提供的终端设备的示意图;图4是本申请实施例提供的一种损失值变化示意图;图5是本申请实施例提供的另一种损失值变化示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。另外,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。实施例一:下面对本申请实施例一提供的一种图像识别方法进行描述,请参阅附图1,本申请实施例一中的图像识别方法包括:步骤S101、获取样本训练集,所述训练样本集包括至少一组样本图像组以及所述样本图像组对应的样本标记,每组样本图像组包括两张样本图像;在使用神经网络进行图像识别时,神经网络的类型选择、模型设置以及模型训练对神经网络的识别准确性息息相关。在本实施例的图像识别方法中,选用孪生神经网络作为图像识别的神经网络。孪生神经网络是一种连体的神经网络,孪生神经网络有两个输入端,可以衡量两个输入的相似程度,可以在人脸识别、行人重识别等细粒度的图像识别场景得到良好的识别效果。选用了孪生神本文档来自技高网...

【技术保护点】
1.一种图像识别方法,其特征在于,包括:/n获取样本训练集,所述训练样本集包括至少一组样本图像组以及所述样本图像组对应的样本标记,每组样本图像组包括两张样本图像;/n执行特征提取操作,所述特征提取操作包括将所述样本训练集中的所述样本图像组输入孪生神经网络中,得到所述样本图像组对应的第一特征向量和第二特征向量,其中,所述第一特征向量和所述第二特征向量均为归一化后的特征向量;/n根据所述第一特征向量、所述第二特征向量、所述样本标记以及基于余弦距离的对比损失函数计算损失值;/n若所述损失值大于预设损失阈值且迭代次数小于预设迭代次数,则根据所述损失值更新所述孪生神经网络,所述迭代次数加1,返回所述特征提取操作;/n若所述损失值小于或等于预设损失阈值,或所述迭代次数大于或等于预设迭代次数,则使用所述孪生神经网络对待处理图像组进行图像识别。/n

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:
获取样本训练集,所述训练样本集包括至少一组样本图像组以及所述样本图像组对应的样本标记,每组样本图像组包括两张样本图像;
执行特征提取操作,所述特征提取操作包括将所述样本训练集中的所述样本图像组输入孪生神经网络中,得到所述样本图像组对应的第一特征向量和第二特征向量,其中,所述第一特征向量和所述第二特征向量均为归一化后的特征向量;
根据所述第一特征向量、所述第二特征向量、所述样本标记以及基于余弦距离的对比损失函数计算损失值;
若所述损失值大于预设损失阈值且迭代次数小于预设迭代次数,则根据所述损失值更新所述孪生神经网络,所述迭代次数加1,返回所述特征提取操作;
若所述损失值小于或等于预设损失阈值,或所述迭代次数大于或等于预设迭代次数,则使用所述孪生神经网络对待处理图像组进行图像识别。


2.如权利要求1所述的图像识别方法,其特征在于,所述根据所述第一特征向量、所述第二特征向量、所述样本标记以及基于余弦距离的对比损失函数计算损失值包括:
计算所述第一特征向量和所述第二特征向量的余弦距离;
若所述样本标记为所述样本图像组中的两张图像为相似图像,则将所述余弦距离的平方作为损失值;
若所述样本标记为所述样本图像组中的两张图像为非相似图像,则计算预设距离阈值与所述余弦距离的差值,将0和所述差值中的最大值的平方作为所述损失值。


3.如权利要求1所述的图像识别方法,其特征在于,在所述获取样本训练集之后,还包括:
选取所述样本训练集中预设数量的样本图像组,对所述样本图像组中的至少一张样本图像进行形态变换,得到新的样本图像组,将所述新的样本图像组增加至所述样本训练集。


4.如权利要求3所述的图像识别方法,其特征在于,所述形态变换包括裁剪、旋转、翻转、亮度调节、锐化、增加噪声中的一种或多种。


5.如权利要求1所述的图像识别方法,其特征在于,所述若所述损失值小于或等于预设损失阈值,或所述迭代次数大于或等于预设迭代次数,则使用所述孪生神经网络对待处理图像组进行图像识别包括:
若所述损失值小于或等于预设损失阈值,或所述迭代次数大于或等于预设迭代次数,则使用样本测试集对所述孪生神经网络进行测试,计算所述孪生神经网络的准确率,所述样本测试集包括至少一个测试图像组以及所述测试图像组对应的样本标记,每组测试图像组包括两张测试图像;
若所述孪生神经网络的准确率低于预设准确率阈值,则更换样本训练集,返回特征提取操作;
若...

【专利技术属性】
技术研发人员:宋方良
申请(专利权)人:深圳云天励飞技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1