基于稀疏编码的唇语特征身份认证方法技术

技术编号:13375751 阅读:100 留言:0更新日期:2016-07-20 22:38
本发明专利技术提供了一种基于稀疏编码的唇语特征身份认证方法,包括如下步骤:步骤1:依据嘴唇位置,从输入视频中提取嘴唇图像块;步骤2:建立稀疏编码特征字典群,并对嘴唇图像块进行重构,计算重构误差;步骤3:根据重构误差对讲话用户进行身份识别和认证。本发明专利技术将唇语的生理结构与行为习惯双重特征同时考虑,从唇语特征中获得较多的信息量,提高了识别的准确率;并采用稀疏编码算法较好地对抗视频采集过程中因为环境和讲话人自身因素带来的各类噪声,有较强的鲁棒性;并且使用稀疏编码的重构及重构误差作为判定依据,计算机执行效率高,速度快。

【技术实现步骤摘要】

本专利技术涉及信息安全
,具体地,涉及一种基于稀疏编码的唇语特征身份认证方法
技术介绍
在过去的若干年间,生物特征已经被广泛地应用于身份认证。一些较为成熟的生物特征,例如指纹、瞳孔、人脸等,已经走出实验室,得到商业应用。一些近期的研究工作表明,嘴唇区域的视觉信息及运动信息,能为讲话人的身份认证提供充足的信息。因此其有望成为一种新的生物特征,被应用于身份认证。与传统生物特征有所不同,唇语生物特征同时包含了生理结构与行为习惯的双重信息,用以确定讲话人的身份。不同的人,其嘴唇区域的形状与纹理(嘴唇区域的灰度变化)有所不同,是为唇语的生理结构信息。另一方面,说话时嘴唇区域的运动模式反映了讲话人经年累月养成的习惯,是为唇语的行为习惯信息。两类信息相辅相成,有助于提高身份认证的准确率,同时也能提高身份认证系统的鲁棒性及抗攻击能力。将上述两类信息应用于身份认证领域,近年来国际上有一定影响力的研究成果有:Luettin等人使用主动形状模型(ASM)对上下嘴唇的形状与纹理进行建模,以描述嘴唇的静态生理结构特征。Broun等人将讲话时显露的口腔内部区域的相关信息加入唇语的生理结构特征。Wang等人使用独立成分分析技术,对上下嘴唇及口腔区域进行表示,改进了传统使用主成分分析描述唇语生理结构特征。行为习惯特征,则采用对静态特征的一阶导数的形式加以体现。经对现有技术的文献检索发现,Goswami等人在2012年在IEEE信息取证与安全专刊(EEETransactionsonInformationForensicsandSecurity,vol.7,issue2,pp.602-612,2012.)上发表的“基于局部有向对比度模式直方图的时空唇语身份认证”(LocalOrdinalContrastPatternHistogramsforSpatiotemporal,Lip-BasedSpeakerAuthentication)。该文中采用局部有向对比度模式算子对嘴唇纹理进行描述,实现了将生理结构信息与行为习惯信息结合,达到了一定的正确率。其不足在于:1)唇语特征的提取准确性不足;2)缺乏有身份鉴别力的唇语特征表达;3)缺乏适合唇语特征的身份认证机制。
技术实现思路
针对现有技术中的缺陷,本专利技术的目的是提供一种基于稀疏编码的唇语特征身份认证方法。根据本专利技术提供的基于稀疏编码的唇语特征身份认证方法,包括如下步骤:步骤1:依据嘴唇位置,从输入视频中提取嘴唇图像块;步骤2:建立稀疏编码特征字典群,并对嘴唇图像块进行重构,计算重构误差;步骤3:根据重构误差对输入视频中讲话用户进行身份识别和认证。优选地,所述步骤1包括:步骤1.1:识别输入视频某一帧面部图片的嘴唇区域图像;步骤1.2:以步骤1.1中的输入视频的该帧为起始帧,提取一段时间内输入视频所有帧的嘴唇区域图像;步骤1.3:将该段时间内提取的所有帧的嘴唇区域图像按照时间顺序进行堆叠获得具有时空维度的嘴唇图像块。优选地,所述步骤2包括:步骤2.1:建立用户稀疏编码特征字典群;具体地,包括如下步骤:步骤2.1.1:将训练集中所有用户讲述提示语的视频片段作为训练样本总体,并从每一段视频片段中提取出具有相应用户特征的嘴唇图像块;步骤i:将用户对应的所有嘴唇图像块作为输入信号,采用K-奇异值分解,即K-SingularValueDecomposition,简称为K-SVD算法构建稀疏编码字典;所述稀疏编码字典中包含若干用户独特的嘴唇图像块基础信号,能够作为与用户的特征字典;步骤2.1.2:对训练集中每一个用户的嘴唇图像块执行步骤i,获得所有用户的特征字典,所有用户的特征字典构成稀疏编码特征字典群;步骤2.2:使用正交匹配追踪OrthogonalMatchingPursuit,简称为OMP算法,以给定特征字典中的基础信号为基底,对待识别视频提取的嘴唇图像块进行变换;步骤2.2.1:选取变换向量中特征值最大的S(一般取3或5或7)个元素,将其他元素置为0,其中S称为稀疏编码的稀疏度;步骤2.2.2:将部分置0后的变换向量进行逆变换,得到重构的嘴唇图像块;步骤2.2.3:将重构的嘴唇图像块与初始嘴唇图像块进行比较,计算每一帧每一像素点的差值的绝对值,并求和,得到重构误差。优选地,所述步骤2.2.3中重构误差的计算公式如下:Δ=Σx,y,t|Mo(x,y,t)-Mr(x,y,t)|]]>式中:△表示重构误差,Mo(x,y,t)表示初始嘴唇图像块,Mr(x,y,t)表示重构后的嘴唇图像块,其中嘴唇图像块中坐标(x,y,t)位置的取值为输入视频第t帧所提取的嘴唇区域图像的行列坐标(x,y)位置的像素RGB值。优选地,在步骤2中,使用用户稀疏编码特征字典群中的每一个特征字典,依次对嘴唇图像块进行重构并计算重构误差;所述步骤3包括:确定最小的重构误差所对应的特征字典,则讲话人被识别为该特征字典对应的用户。优选地,在所述步骤2中,从用户稀疏编码特征字典群中选取申明身份对应的特征字典,对所提取的嘴唇图像块进行重构,并计算重构误差;所述步骤3还包括:将该重构误差与设定的阈值进行比较,若重构误差小于设定阈值,则认为识别出的讲话用户与该用户申明的身份相符,若重构误差大于等于设定阈值,则认为识别出的讲话用户与该用户申明的身份不相符。优选地,还包括:训练步骤,即学习待识别用户唇语特征的过程,通过对用户预先输入的唇语特征进行学习,获得后续用于识别和认证的特征字典,具体包括如下步骤:步骤E1:采集用户讲述提示语视频片段;对待识别的用户,分别采集若干讲述提示语的视频片段,将采集的视频片段以对应用户的身份识别符进行标识,并分别存储;所述标识符包括:名字、工号或身份证号;步骤E2:对于每一位待识别的用户,将步骤E1中采集的讲述提示语的所有视频片段进行嘴唇图像块提取,获得若干嘴唇图像块,所述嘴唇图像块反映了该用户唇语的生理结构和行为习惯特征;步骤E3:对于步骤E2中获得的若干嘴唇图像块,使用K-奇异值分解算法,构建稀疏编码字典,所述编码字典中包含若干基础信号,每一个基础信号为一个三维矩阵,该三维矩阵的尺寸与输入的嘴唇图像块一致,所述基础信号是输入嘴唇图像块的奇异值,表达了对应用户的唇语特征的一致性信息与独特性信息,称为对应用户的特征字典;步骤E4:对所有待识别用户执行步骤E2和步骤E3,获得等同于用户数量的特征字典,将每一个特征字典以对应用户的身份标识符进本文档来自技高网
...

【技术保护点】
一种基于稀疏编码的唇语特征身份认证方法,其特征在于,包括如下步骤:步骤1:依据嘴唇位置,从输入视频中提取嘴唇图像块;步骤2:建立稀疏编码特征字典群,并对嘴唇图像块进行重构,计算重构误差;步骤3:根据重构误差对输入视频中讲话用户进行身份识别和认证。

【技术特征摘要】
1.一种基于稀疏编码的唇语特征身份认证方法,其特征在于,包括如下步骤:
步骤1:依据嘴唇位置,从输入视频中提取嘴唇图像块;
步骤2:建立稀疏编码特征字典群,并对嘴唇图像块进行重构,计算重构误差;
步骤3:根据重构误差对输入视频中讲话用户进行身份识别和认证。
2.根据权利要求1所述的基于稀疏编码的唇语特征身份认证方法,其特征在于,
所述步骤1包括:
步骤1.1:识别输入视频某一帧面部图片的嘴唇区域图像;
步骤1.2:以步骤1.1中的输入视频的该帧为起始帧,提取一段时间内输入视频所有
帧的嘴唇区域图像;
步骤1.3:将该段时间内提取的所有帧的嘴唇区域图像按照时间顺序进行堆叠获得
具有时空维度的嘴唇图像块。
3.根据权利要求1所述的基于稀疏编码的唇语特征身份认证方法,其特征在于,
所述步骤2包括:
步骤2.1:建立用户稀疏编码特征字典群;具体地,包括如下步骤:
步骤2.1.1:将训练集中所有用户讲述提示语的视频片段作为训练样本总体,并从每
一段视频片段中提取出具有相应用户特征的嘴唇图像块;
步骤i:将用户对应的所有嘴唇图像块作为输入信号,采用K-奇异值分解,即
K-SingularValueDecomposition,简称为K-SVD算法构建稀疏编码字典;所述稀疏编码
字典中包含若干用户独特的嘴唇图像块基础信号,能够作为与用户的特征字典;
步骤2.1.2:对训练集中每一个用户的嘴唇图像块执行步骤i,获得所有用户的特征
字典,所有用户的特征字典构成稀疏编码特征字典群;
步骤2.2:使用正交匹配追踪OrthogonalMatchingPursuit,简称为OMP算法,以给
定特征字典中的基础信号为基底,对待识别视频提取的嘴唇图像块进行变换;
步骤2.2.1:选取变换向量中特征值最大的S个元素,将其他元素置为0,其中S称
为稀疏编码的稀疏度;
步骤2.2.2:将部分置0后的变换向量进行逆变换,得到重构的嘴唇图像块;
步骤2.2.3:将重构的嘴唇图像块与初始嘴唇图像块进行比较,计算每一帧每一像素
点的差值的绝对值,并求和,得到重构误差。
4.根据权利要求3所述的基于稀疏编码的唇语特征身份认证方法,其特征在于,
所述步骤2.2.3中重构误差的计算公式如下:
Δ=Σx,y,t|Mo(x,y,t)-Mr(x,y,t)|]]>式中:△...

【专利技术属性】
技术研发人员:王士林赖骏尧夏霙李翔裘瑛
申请(专利权)人:上海交通大学上海数据分析与处理技术研究所
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1