基于人脸识别和语音识别的考勤系统技术方案

技术编号:15799379 阅读:187 留言:0更新日期:2017-07-11 13:28
本发明专利技术提供了基于人脸识别和语音识别的考勤系统,包括人脸图像识别处理模块、语音识别处理模块和考勤模块,所述人脸图像识别处理模块用于获取人脸图像,并对人脸图像进行处理识别,输出人脸图像识别结果;所述语音识别处理模块用于对录入语音并对语音进行处理识别,输出语音识别结果;所述考勤模块用于在人脸图像识别结果和语音识别结果皆为已经识别时,将考勤时间录入设定的考勤数据库。本发明专利技术采用基于语音和人脸图像的识别的方式进行考勤,对主体身份识别的真实性高,安全性好,考勤更精确。

Attendance system based on face recognition and speech recognition

The invention provides an attendance system based on face recognition and speech recognition based on image recognition, including face processing module, voice recognition module and attendance module, the face image recognition processing module is used for face image acquisition and processing, identification of human face image, the output of face image recognition results; the processing module is used for speech recognition the voice input and processing of voice recognition, speech recognition result is output; the attendance module used in face image recognition results and speech recognition results are identified, will set the entry time attendance attendance database. The present invention adopts the method of identification based on voice and face image to check attendance, and has high authenticity, good safety and accurate attendance for the identity of the subject.

【技术实现步骤摘要】
基于人脸识别和语音识别的考勤系统
本专利技术涉及人脸检测
,具体涉及基于人脸识别和语音识别的考勤系统。
技术介绍
相关技术中的考勤系统通过指纹进行识别考勤,当指纹受损时,会直接影响考勤结果,另外,指纹容易被伪造,对主体身份的识别的真实性差。相关技术中,采用对人脸特征进行识别处理的方式获取人脸图像信息。对人脸图像进行增强处理,可以突显边缘和细节信息,同时抑制噪声,改善人脸图像的视觉效果。目前,小波变换在图像增强方面取得一定的效果,但小波变换不能“最优”表示含“线”或“面”奇异的高维函数。Contourlet变换是一种真正的二维图像表示方法,该变换是一种多分辨的、局域的、多方向的图像表示方法。该变换将多尺度分析与方向分析分开进行,可较好地表达细小有方向的轮廓和线段,能很好地用于图像增强处理。然而,Contourlet变换存在下采样,其并不存在平移不变性,在处理后的图像中会产生伪影现象。NSCT(NonsubsampledContourlettransform,非下采样Contourlet变换)是Contourlet变换的一种改进方式,该变换取消了Contourlet变换中的下采样环节,其具有多尺度,多方向、局域性及平移不变性等特点而适合于图像增强技术中。在图像分割处理方面,已经有了很多种非常好的分割方法,例如直方图阈值分割方法,迭代法阈值分割和OTSU算法(最大类间方差法),这些阈值分割方法都能得到非常好的分割效果,其中OTSU算法能自动算出输入图像的阈值,再与输入图像中的每一个像素点进行比对,最后能分割出输入图像中的目标部分和背景部分,其运算速度比较快
技术实现思路
针对上述问题,本专利技术旨在提供基于人脸识别和语音识别的考勤系统。本专利技术的目的采用以下技术方案来实现:基于人脸识别和语音识别的考勤系统,包括人脸图像识别处理模块、语音识别处理模块和考勤模块,所述人脸图像识别处理模块用于获取人脸图像,并对人脸图像进行处理识别,输出人脸图像识别结果;所述语音识别处理模块用于对录入语音并对语音进行处理识别,输出语音识别结果;所述考勤模块用于在人脸图像识别结果和语音识别结果皆为已经识别时,将考勤时间录入设定的考勤数据库。本专利技术的有益效果为:采用基于语音和人脸图像的识别的方式进行考勤,对主体身份识别的真实性高,安全性好,考勤更精确。附图说明利用附图对本专利技术作进一步说明,但附图中的实施例不构成对本专利技术的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。图1本专利技术的框架结构图;图2是本专利技术人脸图像识别处理模块的框架结构图。附图标记:人脸图像识别处理模块1、语音识别处理模块2、考勤模块3、考勤结果显示模块4、人脸图像采集单元10、人脸图像过滤单元11、人脸图像预处理单元12、人脸图像后处理单元13、人脸图像识别单元14。具体实施方式结合以下应用场景对本专利技术作进一步描述。参见图1,本实施例的基于人脸识别和语音识别的考勤系统,包括人脸图像识别处理模块1、语音识别处理模块2和考勤模块3,所述人脸图像识别处理模块1用于获取人脸图像,并对人脸图像进行处理识别,输出人脸图像识别结果;所述语音识别处理模块2用于对录入语音并对语音进行处理识别,输出语音识别结果;所述考勤模块3用于在人脸图像识别结果和语音识别结果皆为已经识别时,将考勤时间录入设定的考勤数据库。进一步地,所述基于人脸识别和语音识别的考勤系统还包括考勤结果显示模块4,该考勤结果显示模块4在人脸图像识别结果和语音识别结果皆为已经识别时,通过显示屏显示考勤成功,在人脸图像识别结果或语音识别结果为识别失败时通过显示屏显示考勤失败。优选地,所述语音识别处理模块2对语音进行处理识别,包括:对录入语音进行降噪处理,将降噪后的录入语音与语音数据库的语音样本进行一一比对,根据降噪后的录入语音和语音数据库的语音样本的距离判断,若该距离小于设定的阈值,则输出语音识别结果为已经识别,否则输出语音识别结果为识别失败。优选地,参见图2,所述人脸图像识别处理模块1包括依次连接的人脸图像采集单元10、人脸图像过滤单元11、人脸图像预处理单元12、人脸图像后处理单元13、人脸图像识别单元14;所述人脸图像采集单元10用于获取多张人脸图像;所述人脸图像过滤单元11用于多张人脸图像中筛选有效的人脸图像,对其余的人脸图像进行过滤;所述人脸图像预处理单元12用于对筛选出的人脸图像进行初步预处理,去除人脸图像的随机噪声;所述人脸图像后处理单元13用于对人脸图像进行分割处理,获取人脸图像的人脸特征;所述人脸图像识别单元14用于对人脸图像的人脸特征进行识别。本专利技术上述实施例,采用基于语音和人脸图像的识别的方式进行考勤,对主体身份识别的真实性高,安全性好,考勤更精确。优选地,所述人脸图像过滤单元11在筛选人脸图像时按照自定义的图像筛选函数进行筛选,选取图像筛选函数的值最大的人脸图像作为优选人脸图像,对剩余的人脸图像进行删除,其中自定义的图像筛选函数为:式中,W表示自定义的图像筛选函数,ζi为第i张人脸图像的设定区域的平均灰度值,ζ为根据实际情况设定的灰度值阈值,ηi为第i张人脸图像的边缘锐度,η为根据实际情况设定的边缘锐度阈值,为人脸图像的数量。本优选实施例,设置人脸图像过滤单元11,筛选出最优的人脸图像进行人脸图像识别检测,能够大大节约系统存储空间,提高人脸图像识别检测的速度和精度。优选地,所述去除人脸图像的随机噪声,包括:(1)对筛选出的人脸图像进行NSCT变换(非下采样Contourlet变换),得到该人脸图像的低频子带系数和高频子带系数;(2)采用方向滤波器对分解后的高频子带系数进行处理,提高分解后的高频子带系数的稀疏性,再采用伪随机傅里叶矩阵对高频子带系数进行观测采样,得到观测值,对于观测值,采用交互分裂Bregman迭代方法进行重构,得到最优高频子带系数;(3)将最优高频子带系数和所述低频子带系数一起进行图像重构,即得到滤波后的人脸图像。本优选实施例,采用上述方式对筛选出的人脸图像进行去噪,能够清晰全面的表示人脸图像的边缘信息以及其细节特征,从而实现有效的图像去噪,并最大限度的保留了人脸图像的细节信息。优选地,所述对人脸图像进行分割处理,包括:(1)采用OTSU算法对人脸图像进行全局分割阈值估计,得到优选全局分割阈值;(2)将整个人脸图像划分为大小相同的多个子图像;(3)采用OTSU算法对子图像进行局部分割阈值估计,获得各子图像的优选局部分割阈值;(4)对不同位置的子图像使用不同的分割阈值进行分割,定义子图像的分割阈值的计算公式为:式中,H为优选全局分割阈值,Hij′为第i行第j列的子图像的优选局部分割阈值,ρ表示整个人脸图像的灰度方差,ρij表示第i行第j列的子图像的灰度方差,δij表示第i行第j列的子图像的灰度均值,δ表示整个人脸图像的灰度均值,min(λ1H,λ2Hij′)表示从λ1H、λ2Hij′中选择最小值,λ1、λ2为设定的权重因子,λ1+λ2=1;λk表示λ1H、λ2Hij′所对应的权重因子,当λ1H的值为最小时λk=λ1,当λ2Hij′最小时λk=λ2。其中,所述对人脸图像进行全局分割阈值估计,具体为:获取人脸图像的灰度级,并根据所述灰度级本文档来自技高网
...
基于人脸识别和语音识别的考勤系统

【技术保护点】
基于人脸识别和语音识别的考勤系统,其特征是,包括人脸图像识别处理模块、语音识别处理模块和考勤模块,所述人脸图像识别处理模块用于获取人脸图像,并对人脸图像进行处理识别,输出人脸图像识别结果;所述语音识别处理模块用于对录入语音并对语音进行处理识别,输出语音识别结果;所述考勤模块用于在人脸图像识别结果和语音识别结果皆为已经识别时,将考勤时间录入设定的考勤数据库。

【技术特征摘要】
1.基于人脸识别和语音识别的考勤系统,其特征是,包括人脸图像识别处理模块、语音识别处理模块和考勤模块,所述人脸图像识别处理模块用于获取人脸图像,并对人脸图像进行处理识别,输出人脸图像识别结果;所述语音识别处理模块用于对录入语音并对语音进行处理识别,输出语音识别结果;所述考勤模块用于在人脸图像识别结果和语音识别结果皆为已经识别时,将考勤时间录入设定的考勤数据库。2.根据权利要求1所述的基于人脸识别和语音识别的考勤系统,其特征是,还包括考勤结果显示模块,该考勤结果显示模块在人脸图像识别结果和语音识别结果皆为已经识别时,通过显示屏显示考勤成功,在人脸图像识别结果或语音识别结果为识别失败时通过显示屏显示考勤失败。3.根据权利要求2所述的基于人脸识别和语音识别的考勤系统,其特征是,所述语音识别处理模块对语音进行处理识别,包括:对录入语音进行降噪处理,将降噪后的录入语音与语音数据库的语音样本进行一一比对,根据降噪后的录入语音和语音数据库的语音样本的距离判断,若该距离小于设定的阈值,则输出语音识别结果为已经识别,否则输出语音识别结果为识别失败。4.根据权利要求1所述的基于人脸识别和语音识别的考勤系统,其特征是,所述人脸图像识别处理模块包括依次连接的人脸图像采集单元、人脸图像过滤单元、人脸图像预处理单元、人脸图像后处理单元、人脸图像识别单元;所述人脸图像采集单元用于获取多张人脸图像;所述人脸图像过滤单元用于多张人脸图像中筛选有效的人脸图像,对其余的人脸图像进行过滤;所述人脸图像预处理单元用于对筛选出的人脸图像进行初步预处理,去除人脸图像的随机噪声;所述人脸图像后处理单元用于对人脸图像进行分割处理,获取人脸图像的人脸特征;所述人脸图像识别单元用于对人脸图像的人脸特征进行...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:深圳汇通智能化科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1