学习型图像处理方法、系统及服务器技术方案

技术编号:18115838 阅读:47 留言:0更新日期:2018-06-03 08:37
本发明专利技术实施例公开了一种学习型图像处理方法、系统及服务器,包括下述步骤:采集待测目标图像;将所述待测目标图像输入到预设的卷积神经网络模型中,获取所述卷积神经网络模型响应所述人脸图像输入而输出分类数据,所述卷积神经网络模型以损失函数为约束条件,限定所述分类数据中类内特征的余弦距离趋向于欧氏距离;获取所述分类数据,并根据所述分类数据对所述待测目标图像进行内容理解。通过联合损失函数中的基于余弦距离的损失函数对分类数据的筛选,使分类数据中的余弦距离最大化,但由于简单图像中的色彩单一,因此类内收敛性较强余弦距离的最大化,反而会使余弦距离趋向于欧氏距离的计算结果,以此简化实现的复杂性。

【技术实现步骤摘要】
学习型图像处理方法、系统及服务器
本专利技术实施例涉及图像处理领域,尤其是一种学习型图像处理方法、系统及服务器。
技术介绍
随着深度学习技术的发展,卷积神经网络已经成为提取人脸特征的有力工具,对于模型固定的卷积神经网络而言,最核心的技术是如何设计损失函数,使其能有效地监督卷积神经网络的训练,从而使卷积神经网络具有提取人脸特征的能力。现有技术中常用损失函数基于Softmax+Centerloss的损失函数因为效果好,训练简单,成为最常使用的监督损失函数,Centerloss损失函数是指对每一个类统计一个平均的中心点,然后利用类中每个样本与中心点的欧式距离作为损失函数来调整网络参数,增加类内样本的聚敛行,相对于单纯的使用Softmax损失函数来说,Centerloss能够使相对于Softmax的hard样本更能准确分类,利用基于Softmax+Centerloss的损失函数学习到的模型提取的特征有更好的表达。本专利技术创造的专利技术人在研究中发现,基于Softmax+Centerloss的损失函数可以更好解决相对于Softmax的复杂样本,但是对部分简单样本并没有进行优化,在余弦距离测度上,反而加大了部分简单样本的类内距离,虽然总体上能更好的表达人脸特征,但是对部分简单样本的特征表达还是有待进一步优化。
技术实现思路
本专利技术实施例提供一种能够将简单样本中的余弦距离趋向于欧氏距离的学习型图像处理方法、系统及服务器。为解决上述技术问题,本专利技术创造的实施例采用的一个技术方案是:提供一种学习型图像处理方法,包括下述步骤:采集待测目标图像;将所述待测目标图像输入到预设的卷积神经网络模型中,获取所述卷积神经网络模型响应所述人脸图像输入而输出分类数据,所述卷积神经网络模型以损失函数为约束条件,限定所述分类数据中类内特征的余弦距离趋向于欧氏距离;获取所述分类数据,并根据所述分类数据对所述待测目标图像进行内容理解。具体地,所述损失函数包括:交叉熵损失函数、基于余弦距离的Centerloss损失函数和基于欧氏距离的Centerloss损失函数。具体地,所述损失函数正向传播过程描述为:其中,L表示为总的损失函数,Lcrossentropy表示为交叉熵损失函数,(f(xi)-ci)2表示为基于欧式距离的centerloss损失函数,表示为基于余弦距离的centerloss损失函数,ci表示类内平均特征,λ1和λ2为调整损失函数权重的超参数。具体地,所述损失函数反向传播过程描述为:其中,L表示为总的损失函数,f(xi)表示深度学习模型提取的图像特征,ci表示类内平均特征,λ1和λ2为调整损失函数权重的超参数。具体地,所述卷积神经网络模型通过下述步骤训练形成:获取标记有分类判断信息的训练样本数据;将所述训练样本数据输入卷积神经网络模型获取所述训练样本数据的模型分类参照信息;通过止损函数比对所述训练样本数据内不同样本的模型分类参照信息与所述分类判断信息是否一致;当所述模型分类参照信息与所述分类判断信息不一致时,反复循环迭代的更新所述卷积神经网络模型中的权重,至所述比对结果与所述分类判断信息一致时结束。具体地,所述人脸图像进行内容理解包括:对人脸图像进行性别识别、年龄判断、颜值打分或人脸相似度比对。为解决上述技术问题,本专利技术实施例还提供一种学习型图像处理系统,包括:采集模块,用于采集待测目标图像;处理模块,用于将所述待测目标图像输入到预设的卷积神经网络模型中,获取所述卷积神经网络模型响应所述人脸图像输入而输出分类数据,所述卷积神经网络模型以损失函数为约束条件,限定所述分类数据中类内特征的余弦距离趋向于欧氏距离;执行模块,用于获取所述分类数据,并根据所述分类数据对所述待测目标图像进行内容理解。具体地,所述损失函数包括:交叉熵损失函数、基于余弦距离的Centerloss损失函数和基于欧氏距离的Centerloss损失函数。具体地,所述损失函数正向传播过程描述为:其中,L表示为总的损失函数,Lcrossentropy表示为交叉熵损失函数,(f(xi)-ci)2表示为基于欧式距离的centerloss损失函数,表示为基于余弦距离的centerloss损失函数,ci表示类内平均特征,λ1和λ2为调整损失函数权重的超参数。具体地,所述损失函数反向传播过程描述为:其中,L表示为总的损失函数,f(xi)表示深度学习模型提取的图像特征,ci表示类内平均特征,λ1和λ2为调整损失函数权重的超参数。具体地,所述卷积神经网络模型通过下述步骤训练形成:第一获取子模块,用于获取标记有分类判断信息的训练样本数据;第一输入子模块,用于将所述训练样本数据输入卷积神经网络模型获取所述训练样本数据的模型分类参照信息;第一比对子模块,用于通过止损函数比对所述训练样本数据内不同样本的模型分类参照信息与所述分类判断信息是否一致;第一处理子模块,用于当所述模型分类参照信息与所述分类判断信息不一致时,反复循环迭代的更新所述卷积神经网络模型中的权重,至所述比对结果与所述分类判断信息一致时结束。具体地,所述人脸图像进行内容理解包括:对人脸图像进行性别识别、年龄判断、颜值打分或人脸相似度比对。为解决上述技术问题,本专利技术实施例还提供一种服务器,包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述所述的学习型图像处理方法。本专利技术实施例的有益效果是:卷积神经网络模型以损失函数为约束条件,对卷积神经网络模型的类内数据,当待测目标图像的内容比较简单(即色彩较为单一)时,因此卷积提取的类内数据本身的收敛程度较高,鲁棒性较好。通过联合损失函数中的基于余弦距离的损失函数对分类数据的筛选,使分类数据中的余弦距离最大化,但由于简单图像中的色彩单一,因此类内收敛性较强余弦距离的最大化,反而会使余弦距离趋向于欧氏距离的计算结果,以此简化实现的复杂性使简单样本的类内距离更加的收敛,同时使卷积神经网络模型的分类结果更加准确。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例学习型图像处理方法的基本流程示意图;图2为本专利技术实施例卷积神经网络模型训练方法基本流程示意图;图3为本专利技术实施例学习型图像处理系统基本结构框图;图4为本专利技术实施例服务器基本结构框图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。在本专利技术的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,本文档来自技高网
...
学习型图像处理方法、系统及服务器

【技术保护点】
一种学习型图像处理方法,其特征在于,包括下述步骤:采集待测目标图像;将所述待测目标图像输入到预设的卷积神经网络模型中,获取所述卷积神经网络模型响应所述人脸图像输入而输出分类数据,所述卷积神经网络模型以损失函数为约束条件,限定所述分类数据中类内特征的余弦距离趋向于欧氏距离;获取所述分类数据,并根据所述分类数据对所述待测目标图像进行内容理解。

【技术特征摘要】
1.一种学习型图像处理方法,其特征在于,包括下述步骤:采集待测目标图像;将所述待测目标图像输入到预设的卷积神经网络模型中,获取所述卷积神经网络模型响应所述人脸图像输入而输出分类数据,所述卷积神经网络模型以损失函数为约束条件,限定所述分类数据中类内特征的余弦距离趋向于欧氏距离;获取所述分类数据,并根据所述分类数据对所述待测目标图像进行内容理解。2.根据权利要求1所述的学习型图像处理方法,其特征在于,所述损失函数包括:交叉熵损失函数、基于余弦距离的Centerloss损失函数和基于欧氏距离的Centerloss损失函数。3.根据权利要求2所述的学习型图像处理方法,其特征在于,所述损失函数正向传播过程描述为:其中,L表示为总的损失函数,Lcrossentropy表示为交叉熵损失函数,(f(xi)-ci)2表示为基于欧式距离的centerloss损失函数,表示为基于余弦距离的centerloss损失函数,ci表示类内平均特征,λ1和λ2为调整损失函数权重的超参数。4.根据权利要求2所述的学习型图像处理方法,其特征在于,所述损失函数反向传播过程描述为:其中,L表示为总的损失函数,f(xi)表示深度学习模型提取的图像特征,ci表示类内平均特征,λ1和λ2为调整损失函数权重的超参数。5.根据权利要求1所述的脸部图像处理方法,其特征在于,所述卷积神经网络模型通过下述步骤训练形成:获取标记有分类判断信息的训练样本数据;将所述训练样本数据输入卷积神经网络模型获取所述训练样本数据的模...

【专利技术属性】
技术研发人员:杨帆张志伟
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1