识别装置、识别方法和训练方法制造方法及图纸

技术编号:36597609 阅读:12 留言:0更新日期:2023-02-04 18:09
本发明专利技术提供一种识别装置、识别方法和训练方法。所述识别装置包括:提取单元,所述提取单元被配置为从输入数据中提取第二格式的N维特征向量,所述第二格式的N维特征向量包括第一格式的M维特征向量(M为2或更大的整数,N为大于M的整数);以及识别单元,所述识别单元被配置为基于所述第一格式的所述特征向量和所述第二格式的所述特征向量,识别所述输入数据中的识别目标。的识别目标。的识别目标。

【技术实现步骤摘要】
识别装置、识别方法和训练方法


[0001]本专利技术涉及一种识别装置、识别方法和训练方法。

技术介绍

[0002]日本专利特开No.4903192讨论了一种面部检测装置。在图像数据的检测区域中使用第一面部检测算法计算出的面部似然度大于或等于阈值α的检测区域中,面部检测装置使用第二面部检测算法计算面部周边似然度。与第二面部检测算法相比,第一面部检测算法是一种高速面部检测算法,而与第一面部检测算法相比,第二面部检测算法在面部图像区域中具有高检测率和低误检率。

技术实现思路

[0003]本专利技术要解决的问题是在防止识别准确性降低的同时减少与识别有关的计算量。根据本专利技术的一个方面,一种识别装置包括:提取单元,所述提取单元被配置为,从输入数据提取第二格式的N维特征向量,所述第二格式的N维特征向量包括第一格式的M维特征向量(M是2或更大的整数,N是大于M的整数);以及识别单元,所述识别单元被配置为,基于第一格式的特征向量和第二格式的特征向量,识别输入数据中的识别目标。
[0004]通过以下参照附图对示例性实施例的描述,本专利技术的其他特征将变得显而易见。
附图说明
[0005]图1是图示根据第一示例性实施例的识别装置的配置示例的框图。
[0006]图2是图示根据第一示例性实施例的识别装置的详细配置示例的框图。
[0007]图3是图示图2中所示的识别单元的处理的示意性流程的图。
[0008]图4是图示根据第一示例性实施例的特征向量的配置示例的图。
[0009]图5是描述根据第一示例性实施例的识别处理的流程图。
[0010]图6是描述根据第二示例性实施例的识别处理的流程图。
[0011]图7是图示根据第三示例性实施例的训练装置的配置示例的框图。
[0012]图8是图示根据第四示例性实施例的识别装置的配置示例的框图。
[0013]图9是图示根据第五示例性实施例的用于特征提取的模型的示例的图。
[0014]图10是图示根据第六示例性实施例的识别装置的硬件配置示例的框图。
具体实施方式
[0015]下面将参照附图详细描述本专利技术的示例性实施例。以下示例性实施例不限制本专利技术,并且示例性实施例中描述的特征的所有组合对于解决本专利技术的问题的手段不一定是必需的。依据应用本专利技术的装置的规格和各种条件(使用条件、使用环境等),可适当地校正或变更示例性实施例的配置。本专利技术的技术范围由要求保护的专利技术限定,并且不受以下各个示例性实施例的限制。
[0016]在以下描述中,将使用面部认证的对象识别装置用作识别装置的示例。然而,示例性实施例并不限于使用面部认证的对象识别装置,并且可应用于对诸如狗或猫等宠物的识别以及对诸如汽车或自行车等对象的识别。示例性实施例可以应用于除了对象识别装置以外的图像识别装置、字符识别装置、语音识别装置等,并且可以应用于使用特征向量进行识别的任何识别装置。
[0017]图1是图示根据第一示例性实施例的识别装置的配置示例的框图。在图1的示例中,将面部认证装置图示为识别装置。面部认证装置能够在初步登记的人物之中识别出在监控相机系统中看到的人物,并且可应用于入口/出口管理系统的入口/出口大门处的面部认证。
[0018]对于图1所示的功能块之中由软件实现的功能,用于提供每个功能块的功能的程序存储在诸如只读存储器(ROM)之类的存储器中。由中央处理单元(CPU)将程序加载到随机存取存储器(RAM)中并执行程序来实现该程序。对于由硬件实现的功能,例如,只需要使用预定编译器从用于实现现场可编程门阵列(FPGA)电路上的每个功能块的功能的程序自动生成专用电路即可。另一选择是,每个功能块的功能可以通过形成类似于FPGA电路的门阵列电路而作为硬件来实现。再一选择是,每个功能块的功能可以通过专用集成电路(ASIC)来实现。图1所示的功能块的配置仅为示例,并且多个功能块可以组成一个功能块,或者多个功能块中的任何一者可以被分割成多个功能块。
[0019]在图1中,面部认证装置包括检测单元1、特征提取单元2和识别单元3。
[0020]检测单元1从输入图像11中检测识别目标,即面部区域。检测单元1能够使用例如基于TensorFlow进行面部检测的多任务级联卷积神经网络(MTCNN)来检测面部区域。
[0021]特征提取单元2从检测单元1检测到的面部图像中提取特征量。特征量可由特征向量12A表示。在面部认证处理中,特征向量12A被设计成能够高准确性地确定人物是否为同一人物。在面部认证的情况下,无论面部表情、图像拍摄方向、是否存在照明以及是否存在装饰品,如果人物为同一人物,则特征向量12A均取相似的值,而如果人物为不同的人物,则取显著不同的值。
[0022]识别单元3将由特征提取单元2提取的特征向量12A与初步登记的特征向量12B进行比对。在识别处理S13中,识别初步登记的特征向量12B中与特征提取单元2提取的特征向量12A最接近的一者。此时,识别单元3可初步登记从多个已知人物的图像中提取的特征向量12B,并且将特征提取单元2提取的特征向量12A与多个初步登记的特征向量12B中的每一者进行比对。
[0023]本文中提到的特征向量12A和12B中的每一者为第二格式的N维特征向量(其包括第一格式的M维特征向量,M是2或更大的整数,N是大于M的整数)。然后,识别单元3基于第一格式的特征向量和第二格式的特征向量来识别面部。此时,识别单元3计算第一格式的特征向量之间的第一相似度。在第一相似度大于预定值的情况下,识别单元3可计算第二相似度。在该计算中,第一相似度的召回率可高于第二相似度的召回率,而第二相似度的精度可高于第一相似度的精度。召回率是输入图像中同一对象的识别率。在面部认证的情况下,召回率是在人物是同一人物的情况下,人物被确定为同一人物的比率。精度是指作为同一人物,能够被正确识别的比率。在面部认证的情况下,精度是被确定为同一人物的人物之中真正为同一人物的人物比率。
[0024]通常,在计算多个人物的特征向量之间的相似度的情况下,特征向量在大多数情况下属于不同的人物。此时,不同人物之间的特征向量差大于相似人物之间的特征向量差。在确定人物是否为不同人物的情况下,与确定人物是否为同一人物的情况相比,即使特征向量的维数少,也能够确保确定的准确性。为此,识别单元3基于第一相似度,从多个人物的特征向量之中消除不同人物的特征向量,并且识别相似人物的特征向量。然后,识别单元3基于第二相似度,识别相似人物的特征向量之中真正为同一人物的特征向量。这消除了识别单元3针对包括不同人物的多个人物的特征向量、获得高维特征向量之间的相似度的计算需要,并且能够在防止降低识别准确性的同时减少与识别有关的计算量。
[0025]图2是图示根据第一示例性实施例的识别装置的详细配置示例的框图。
[0026]在图2中,识别装置30包括图像输入单元31、检测单元32、特征提取单元33、识别单元34和特征保持单元35。识别单元34包括比对单元340。比对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种识别装置,所述识别装置包括:提取单元,所述提取单元被配置为从输入数据中提取第二格式的N维特征向量,所述第二格式的N维特征向量包括第一格式的M维特征向量,M为2或更大的整数,N为大于M的整数;以及识别单元,所述识别单元被配置为基于所述第一格式的所述特征向量和所述第二格式的所述特征向量,识别所述输入数据中的识别目标。2.根据权利要求1所述的识别装置,其中,所述输入数据为图像数据,并且所述识别目标为对象。3.根据权利要求1所述的识别装置,其中,所述识别单元包括:第一计算单元,所述第一计算单元被配置为计算所述第一格式的特征向量之间的第一相似度;以及第二计算单元,所述第二计算单元被配置为基于所述第一相似度的计算结果,计算所述第二格式的特征向量之间的第二相似度。4.根据权利要求3所述的识别装置,其中,在所述第一相似度大于预定值的情况下,所述第二计算单元被配置为计算所述第二相似度。5.根据权利要求3所述的识别装置,其中,所述第一相似度的召回率大于所述第二相似度的召回率,而所述第二相似度的精度大于所述第一相似度的精度。6.根据权利要求3所述的识别装置,其中,所述第二计算单元被配置为基于所述第一计算单元计算所述第一相似度时的中间结果,计算所述第二相似度。7.根据权利要求1至6任一所述的识别装置,其中,所述提取单元为使用第一损失函数和第二损失函数训练的深度神经网络,所述第一损失函数被设计为利用所述第一格式的所述特征向量来提高召回率,而所述第二损失函数被设计为利用所述第二格式的所述特征向量来提高识别性能。8.一种识别方法,所述识别方法包括:从输入数据中提取第二格式的N维特征向量,所述第二格式的N维特征向量包括第一格式的M维特征向量,M为2或更大的整...

【专利技术属性】
技术研发人员:野吕英生矢野光太郎佐藤博
申请(专利权)人:佳能株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1