一种目标对象识别方法、装置及存储介质制造方法及图纸

技术编号:23513128 阅读:29 留言:0更新日期:2020-03-18 00:19
本发明专利技术实施例提供一种目标对象识别方法、装置及存储介质,该方法包括:获取目标对象的图像;通过目标网络识别该目标对象属于每个类别的概率,目标网络包括生成式对抗网络和残差网络;将概率最大的类别确定为目标对象所属类别。实施本发明专利技术实施例,可以提高目标对象识别的准确性。

An object recognition method, device and storage medium

【技术实现步骤摘要】
一种目标对象识别方法、装置及存储介质
本专利技术涉及图像识别
,具体涉及一种目标对象识别方法、装置及存储介质。
技术介绍
深度学习由于其在解决高级抽象的问题上有着较为明显的效果,例如神经网络。使用神经网络识别图像中目标对象可以明显提高目标对象识别的效率。然而,当图像中存在由于相机抖动、动态场景的快速移动或暗光环境产生的运动模糊和噪声时,神经网络识别图像中目标对象的准确性较低。
技术实现思路
本专利技术实施例提供一种目标对象识别方法、装置及存储介质,可以提高图像中目标对象识别的准确性。本专利技术实施例第一方面提供一种目标对象识别方法,包括:获取目标对象的图像;通过目标网络识别所述目标对象属于每个类别的概率,所述目标网络包括生成式对抗网络(GenerativeAdversarialNerworks,GAN)和残差网络(ResNet);将所述概率最大的类别确定为所述目标对象所属类别。在一个实施例中,所述方法还包括:所述GAN包括第一生成器,所述方法还包括:获取第一图像集和第二图像集,所述第一图像集为清晰图像的集合,所述第二图像集为模糊图像的集合;将第一图像输入所述第一生成器,获得第一特征张量,所述第一图像为所述第一图像集中的任一图像;将第二图像输入所述第一生成器,获得第二特征张量,所述第二图像为所述第二图像集中的任一图像;将所述第一特征张量输入所述残差网络,获得所述第一图像中的对象属于每个类别的第一概率;将所述第二特征张量输入所述残差网络,获得所述第二图像中的对象属于每个类别的第二概率;根据所述第一图像、所述第一特征张量、所述第二图像、所述第二特征张量、所述第一概率和所述第二概率,计算总损失;根据所述总损失优化所述GAN和所述残差网络的参数,获得目标网络。在一个实施例中,所述根据所述第一图像、所述第一特征张量、所述第二图像、所述第二特征张量、所述第一概率和所述第二概率,计算总损失包括:根据所述第一图像、所述第一特征张量、所述第二图像和所述第二特征张量,计算第一损失;根据所述第一概率和所述第二概率,计算第二损失;根据所述第一损失和所述第二损失,计算总损失。在一个实施例中,所述根据所述第一图像、所述第一特征张量、所述第二图像和所述第二特征张量,计算第一损失包括:根据所述第一特征张量和所述第二图像,计算第三损失;根据所述第一图像和所述第二特征张量,计算第四损失;根据所述第一图像、所述第一特征张量、所述第二图像和所述第二特征张量,计算第五损失;根据所述第三损失、所述第四损失和所述第五损失,计算第一损失。在一个实施例中,所述GAN还包括第一辨别器,所述根据所述第一特征张量和所述第二图像,计算第三损失包括:将所述第一特征张量输入所述第一辨别器,获得第一输出;将所述第二图像输入所述第一辨别器,获得第二输出;根据所述第一输出和所述第二输出,计算第三损失。在一个实施例中,所述根据所述第一输出和所述第二输出,计算第三损失包括:根据所述第一输出、所述第二输出和第一损失函数,计算第三损失;所述第一损失函数的表达式为:L1=E[logDY(y)]+E[1-logDY(G(x))]其中,x为所述第一图像,y为所述第二图像,G(x)为所述第一特征张量,DY(G(x))为所述第一输出,DY(y)为所述第二输出,E为均值操作算子。在一个实施例中,所述GAN还包括第二辨别器,所述根据所述第一图像和所述第二特征张量,计算第四损失包括:将所述第二特征张量输入所述第二辨别器,获得第三输出;将所述第一图像输入所述第二辨别器,获得第四输出;根据所述第三输出和所述第四输出,计算第四损失。在一个实施例中,所述根据所述第三输出和所述第四输出,计算第四损失包括:根据所述第三输出、所述第四输出和第二损失函数,计算第四损失;所述第二损失函数的表达式为:L2=E[logDX(x)]+E[1-logDX(G(y))]其中,G(y)为所述第二特征张量,DX(G(y))为所述第三输出,DX(x)为所述第四输出。在一个实施例中,所述GAN还包括第二生成器,所述根据所述第一图像、所述第一特征张量、所述第二图像和所述第二特征张量,计算第五损失包括:将所述第一特征张量输入所述第二生成器,获得第五输出;将所述第二特征张量输入所述第二生成器,获得第六输出;根据所述第一图像、所述第二图像、所述第五输出和所述第六输出,计算第五损失。在一个实施例中,所述根据所述第一图像、所述第二图像、所述第五输出和所述第六输出,计算第五损失包括:根据所述第一图像、所述第二图像、所述第五输出、所述第六输出和第三损失函数,计算第五损失;所述第三损失函数的表达式为:L3=||F(G(x))-x||1+||F(G(y))-y||1其中,F(G(x))为所述第五输出,F(G(y))为所述第六输出,||·||1表示平均绝对误差。在一个实施例中,所述根据所述第一概率和所述第二概率,计算第二损失包括:根据所述第一概率、所述第二概率和第四损失函数,计算第二损失;所述第四损失函数的表达式为:其中,m为所述第一图像集中图像数量和所述第二图像集中图像数量中的最大值,yi为所述第一图像集和所述第二图像集中的图像的标签,xi为所述第一图像集和所述第二图像集中的图像的概率,h(·)为非线性激活函数。本专利技术实施例第二方面提供一种目标对象识别装置,包括用于执行第一方面或第一方面的任一实施例提供的目标对象识别方法的单元。本专利技术实施例第三方面提供一种目标对象识别装置,包括处理器和存储器,所述处理器和所述存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于调用所述程序指令执行第一方面或第一方面的任一实施例提供的目标对象识别方法。第四方面提供了一种可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行第一方面或第一方面的任一实施例提供的目标对象识别方法。第五方面提供了一种应用程序,该应用程序用于在运行时执行第一方面或第一方面的任一实施例提供的目标对象识别方法。本专利技术实施例中,通过包括GAN和ResNet的目标网络识别图像中目标对象属于每个类别的概率,将概率最大的类别确定为目标对象所属类别,由于结合GAN和ResNet共同识别图像中的目标对象,因此,可以提高图像中目标对象识别的准确性。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以本文档来自技高网...

【技术保护点】
1.一种目标对象识别方法,其特征在于,包括:/n获取目标对象的图像;/n通过目标网络识别所述目标对象属于每个类别的概率,所述目标网络包括生成式对抗网络和残差网络;/n将所述概率最大的类别确定为所述目标对象所属类别。/n

【技术特征摘要】
1.一种目标对象识别方法,其特征在于,包括:
获取目标对象的图像;
通过目标网络识别所述目标对象属于每个类别的概率,所述目标网络包括生成式对抗网络和残差网络;
将所述概率最大的类别确定为所述目标对象所属类别。


2.根据权利要求1所述的方法,其特征在于,所述生成式对抗网络包括第一生成器,所述方法还包括:
获取第一图像集和第二图像集,所述第一图像集为清晰图像的集合,所述第二图像集为模糊图像的集合;
将第一图像输入所述第一生成器,获得第一特征张量,所述第一图像为所述第一图像集中的任一图像;
将第二图像输入所述第一生成器,获得第二特征张量,所述第二图像为所述第二图像集中的任一图像;
将所述第一特征张量输入所述残差网络,获得所述第一图像中的对象属于每个类别的第一概率;
将所述第二特征张量输入所述残差网络,获得所述第二图像中的对象属于每个类别的第二概率;
根据所述第一图像、所述第一特征张量、所述第二图像、所述第二特征张量、所述第一概率和所述第二概率,计算总损失;
根据所述总损失优化所述生成式对抗网络和所述残差网络的参数,获得目标网络。


3.根据权利要求2所述的方法,其特征在于,所述根据所述第一图像、所述第一特征张量、所述第二图像、所述第二特征张量、所述第一概率和所述第二概率,计算总损失包括:
根据所述第一图像、所述第一特征张量、所述第二图像和所述第二特征张量,计算第一损失;
根据所述第一概率和所述第二概率,计算第二损失;
根据所述第一损失和所述第二损失,计算总损失。


4.根据权利要求3所述的方法,其特征在于,所述根据所述第一图像、所述第一特征张量、所述第二图像和所述第二特征张量,计算第一损失包括:
根据所述第一特征张量和所述第二图像,计算第三损失;
根据所述第一图像和所述第二特征张量,计算第四损失;
根据所述第一图像、所述第一特征张量、所述第二图像和所述第二特征张量,计算第五损失;
根据所述第三损失、所述第四损失和所述第五损失,计算第一损失。


...

【专利技术属性】
技术研发人员:吴涛吴伟王孝宇
申请(专利权)人:深圳云天励飞技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1