图像识别装置及其方法制造方法及图纸

技术编号:2929583 阅读:237 留言:0更新日期:2012-04-11 18:40
根据本发明专利技术的实施例,一种从具有三维形状的对象的拍摄图像对该对象进行图像识别的方法,包括:输入图像;存储三维形状信息作为对象的三维模型的初始;使用输入图像和三维形状信息生成三维模型;生成在不同方向上三维模型投影到平面上的多个图案图像;从多个图案图像提取特征量;保存对象的字典特征量;以及计算所提取的特征量和对象的字典特征量之间的相似度,以便根据所计算的相似度识别对象。

【技术实现步骤摘要】

本专利技术涉及图像识别装置和图像识别方法,其中通过使用输入图像和三维形状信息生成三维模型,并且执行识别处理。
技术介绍
使用脸面图像的识别在安全上是一种非常有用的技术,因为与物理钥匙或密码不同,不用担心丢失或遗忘。但是,脸面的形状随着用户的站立位置或者体型的个体差异而改变,并且脸面的方向也不恒定,识别时的照射条件也不能事先确定。因此,为了高精度地执行识别,吸收由这些情况引起的脸面图案的变化是必不可少的。到目前为止,作为使用脸面图像进行个人身份识别的技术,存在例如由O.Yamaguchi和K.Fukui公开的一种方法(“Smartface”-A RobustFace Recognition System under Varying Facial Pose and Expression”,IEICE Trans.On Information and Systems Vol.E86-D,No.1,pp.37-44,2003。这相应于Yamaguchi,Fukui的“Face Recognition System“Smartface”Robust to Change in Face Direction and Expression”SINGAKURON(D-II)Vol.J84-D-II,No.6,pp.1045-1052,2001的英文译文)。按照这种方法,通过使用运动图像来抑制脸面图案的变化,并且进行识别。为了高精度地执行识别,从运动图像收集各种个人脸面图案非常重要,但是,这存在图案收集依赖用户自己的脸面方向的问题。除此之外,由于对于输入和字典两者都需要多个图像,因此例如在只有一幅照片可以用于识别的情形下该方法不能应用。根据JP-2002-157595A(日本专利申请公开2002-157595)的方法,通过使用范围取景器(range finder)事先执行测量,以便拍摄脸面的三维形状,并且在运动和旋转脸面形状以使其与检查对象具有相同的脸面方向时执行检查。由于针对每一个个体拍摄了精确的形状,因此能够在脸面的方向和大小正确时执行检查,但却需要特殊设备以便拍摄形状。除此之外,对于已经通过普通相机拍摄的图像,例如在护照或许可证上的图像,由于不能获得形状,因此该方法不能应用。根据V.Blanz和T.Vetter(“A morphable model for the synthesis of3-D faces”,Proc.SIGGRAPH,1999,pp.187-194)的方法,事先拍摄大量脸面形状,通过线性组合生成与输入图像最相似的模型,并且能够执行识别。尽管脸面的形状、方向和大小以及照射条件能够从一个图像进行估计,但是由于所生成的脸面模型的三维形状信息取决于事先拍摄的脸面形状,因此该方法并必然地能够高精度地应用到任意脸面。除此之外,由于估计大量参数并进行身份识别,因此需要大量处理时间。如上所述,为了吸收人脸面图案的各种变化,尽管现有技术中通过某些方法收集或生成各种脸面图案并进行身份识别的方法是有效的,但是存在需要大量图像、需要特殊设备、以及可适用脸面受到限制的问题。
技术实现思路
为了解决现有技术的上述问题作出了本专利技术,并且本专利技术的目的是提供一种图像识别装置、图像识别方法和图像识别程序产品,其能够通过使用普通相机从任意数量的图像并且使用三维形状信息通过三维脸面模型生成应用到任意脸面。根据本专利技术的实施例,提供一种图像识别装置,使用通过拍摄具有三维形状的对象所获得的图像并且执行该对象的图像识别,包括图像输入单元,图像输入其中;三维形状信息保存单元,配置以存储三维形状信息作为对象的三维模型的初始;模型生成单元,配置以使用输入图像和三维形状信息生成三维模型;图案生成单元,配置以生成在不同方向上三维模型投影到平面上的多个图案图像;特征提取单元,配置以从多个图案图像提取特征量;登记字典保存单元,配置以登记对象的特征量;以及相似度计算单元,配置以计算所提取的特征量和所登记的对象的特征量之间的相似度,以便根据所计算的相似度识别对象。根据本专利技术的实施例,提供一种图像识别装置,使用通过拍摄具有三维形状的对象所获得的图像并且执行该对象的图像识别,包括图像输入单元,图像输入其中;三维形状信息保存单元,配置以存储三维形状信息作为对象的三维模型的初始;模型生成单元,配置以使用输入图像和三维形状信息生成三维模型;纹理扰动分析单元,配置以将两维变化添加到三维模型上并生成多个图案图像;特征提取单元,配置以从多个图案图像提取特征量;登记字典保存单元,配置以登记对象的特征量;以及相似度计算单元,配置以计算所提取的特征量和所登记的对象的特征量之间的相似度,以便根据所计算的相似度识别对象。根据本专利技术的实施例,通过使用三维形状信息生成三维模型,能够从任意数量的图像和使用普通相机进行高精度的识别。附图说明图1示出本专利技术的第一实施例的结构方框图。图2是从三维模型的图案图像生成的概念图。图3示出本专利技术的第二实施例的结构方框图。图4是从纹理图像的图案图像生成的概念图。图5示出本专利技术的第三实施例的结构方框图。图6示出本专利技术的第四实施例的结构方框图。图7示出本专利技术的第五实施例的结构方框图。图8是从输入形状的形状规格化的概念图。具体实施例方式(第一实施例)下面将参照图1和2描述本专利技术的第一实施例的图像识别装置10。(1)图像识别装置10的结构如图1的方框图所示,该实施例的图像识别装置10包括图像输入单元12,用于输入目标人的脸面;对象检测单元14,用于从输入图像检测人的脸面;模型生成单元16,用于使用所检测的脸面和事先保存的三维形状信息生成三维脸面模型;图案生成单元18,用于从所生成的三维脸面模型生成脸面图案图像;特征提取单元20,用于从所生成的脸面图案图像提取用以识别的特征量;以及相似度计算单元24,用于计算对事先登记的登记字典22的相似度。下面将参照图1描述图像识别装置10的操作。(2)图像输入单元12首先,图像输入单元12输入脸面图像作为处理对象。作为构成图像输入单元12的设备示例,可以使用USB相机或数字相机。除此之外,也可以使用存储事先拍摄并保存的脸面图像数据的记录设备、录像带、DVD等,或者也可以使用用于扫描脸面照片的扫描仪。图像也可以通过网络输入。通过图像输入单元12所获得的图像顺次发送给对象检测单元14。(3)对象检测单元14对象检测单元14检测图像中脸面部分的坐标作为脸面特征点。尽管可以使用任何方法来检测脸面特征点,可以通过使用例如Fukui和Yamaguchi(“Facial Feature Extraction Method based on Combination ofShape Extraction and Pattern Matching”SINGAKURON(D-II)Vol.J80-D-II,No.9,pp.2170-2177,1997)的方法来执行检测。被检测的特征点可以任意为瞳孔、鼻孔、嘴角、眼外框、眼内框、鼻尖、嘴轮廓、嘴中点、眉梢、脸面轮廓、以及下颏,只要它们为不在同一平面上的四点或更多点即可。除此之外,待输出的特征点可以为多组点。例如,针对所检测的特征点在任意方向上受扰的不同特征点进行计算并输出。此时,模型生成和图案生本文档来自技高网
...

【技术保护点】
一种图像识别装置,使用通过拍摄具有三维形状的对象所获得的图像并且执行该对象的图像识别,包括:    图像输入单元,图像输入其中;    三维形状信息保存单元,配置以存储三维形状信息作为对象的三维模型的初始;    模型生成单元,配置以使用输入图像和三维形状信息生成三维模型;    图案生成单元,配置以生成在不同方向上三维模型投影到平面上的多个图案图像;    特征提取单元,配置以从多个图案图像提取特征量;    字典保存单元,配置以保存对象的字典特征量;以及    相似度计算单元,配置以计算所提取的特征量和对象的字典特征量之间的相似度,以便根据所计算的相似度识别对象。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:小坂谷达夫
申请(专利权)人:株式会社东芝
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1