当前位置: 首页 > 专利查询>吴田平专利>正文

声纹考勤机制造技术

技术编号:3045415 阅读:650 留言:0更新日期:2012-04-11 18:40
一种声纹考勤机,其语音采集模块采用说话人输入的语音ID号码口令,将其转换成数字信号,并把数字信号传送至语音处理模块;语音预处理模块对输入语音的数字信号进行语音分析处理,并输出处理得到的语音的微特征参数传送至训练模块;训练模块接收语音预处理的数据,对指定的语音样本进行训练,形成声纹考勤模板,存入存储系统模块中的员工档案中;考勤时,识别模块调用存储系统中的利用训练模块生成的现有声纹考勤模板和从语音预处理模块得到的说话人语音微特征参数,找出合法ID,进入声纹识别模块进行说话人确认,声纹识别模块识别出说话人,找出说话人所对应的ID号,在将这个ID号所对应的员工信息显示在液晶显示模块的显示屏上。

【技术实现步骤摘要】

本专利技术涉及电子产品
,尤其涉及生物特征识别领域的声纹比对类电子产品,特别是一种声纹考勤机
技术介绍
目前市场上的考勤产品,种类繁多,从使用方式可分为脱机考勤机和联机考勤机两种;从应用技术方式可分为打印类、刷卡类、生物识别类三种。刷卡类主要包括磁卡、条码卡、IC卡三类;生物识别类主要包括指纹考勤和虹膜考勤两类。传统的机械打卡机虽然价格相对较低,但是统计烦琐,后续投入较大,每月都需要更换卡片,且机械故障率较高,特别插卡口易受破坏;而刷卡类考勤机使用的卡片成本和机械故障率也很高,比如磁卡考勤机因使用时间过久就会产生磁卡与磁头损坏的情况,条形码考勤机条形码脏了后灵敏度下降就会出现错码现象。另外这两类打卡机还具有一些通病,比如“代打卡问题”、“卡丢失问题”、“材料耗费问题”、“一卡多用问题”、“使用方便性问题”、“维护问题”。而新兴出现的生物识别类考勤机,成本较高,易磨损,对使用者要求高,比如说手指划伤,粘有灰尘,手指摆放不正等都易造成拒识,而且指纹的接触性使其也不够卫生,且易使人产生被侵犯的感觉。在生物特征识别领域,目前出现了一种利用人类的语音执行声纹识别并对其(声纹识别)进行处理的技术,在这一技术中比较有代表的有,如本专利技术申请人作为专利技术人申请的公开号为CN1567431A公开的一种说话者身份识别方法和系统。该系统由语音接收设备,语音获取模块,语音编辑、预处理模块、说话者训练、识别模块和后台数据库构成,语音接收设备接收被识别人的声音信号,语音获取模块可以将接收到的语音形成语音文件并有秩序地存储起来,语音编辑、预处理模块对语音文件进行处理、语音分析处理,并输出语音的微特征参数,识别模块依靠训练生成的声纹模板、神经网络算法、以及语音预处理得到的说话人语音微特征参数识别出说话人。这种系统具有仿生性、增量式训练、可学习性、识别双向通话,强分辨能力和识别率、强鲁棒性、识别速度快、非语音信号过滤等特点。
技术实现思路
本专利技术所要解决的技术问题是提供一种通过说话人声纹来验证人员个体的唯一身份,并记录下每次验证的详细时间的声纹考勤机,以做考勤证明。只要说话人说出预先确定好的一句话,如员工号码,即可考勤,不必担心忘带卡,忘带密码、按指纹等烦恼,使用方便、误识率低、便于信息统计。本专利技术解决技术问题是通过以下技术方案来实现的一种声纹考勤机是通过以下方法来实现的1、先用键盘模块通过输入法模块中的输入法来新建一个员工的档案,并存入存储系统模块中;2、然后语音采集模块采集说话人输入的语音ID号码口令,将其转换成数字信号,并把数字信号传送至语音处理模块;3、语音预处理模块对输入语音的数字信号进行语音分析处理,包括语音口令检测、静音拼接、预加重、加窗、加帧、去噪、MFCC特征提取分析处理,并输出处理得到的语音的微特征参数传送至训练模块;4、训练模块接收语音预处理的数据,对指定的用户ID号码对应的语音样本进行训练,形成已训练人独有的声纹考勤模板,存入存储系统模块中的员工档案中;5、考勤时,语音采集模块采用说话人输入的语音ID号码口令,将其转换成数字信号,并把数字信号传送至所述的语音处理模块;语音预处理模块对输入语音的数字信号进行语音分析处理,包括语音口令检测、静音拼接、预加重、加窗、加帧、去噪、MFCC特征提取分析处理,并输出处理得到的语音的微特征参数传送至识别模块,识别模块调用存储系统中的利用训练模块生成的现有声纹考勤模板和从语音预处理模块得到的说话人语音微特征参数,找出合法ID,进入声纹识别模块进行说话人确认,声纹识别模块通过语音信号特征模糊动态集合的聚类,并利用单层感知机网络实现已聚类的激励群到说话人的转换,识别出说话人,找出说话人所对应的ID号,在将这个ID号所对应的员工信息显示在液晶显示模块的显示屏上;6、辨别结束后,将说话人说话声音的时间记录到存储系统模块所建立的考勤记录库中。本专利技术语音采集模块是利用麦克风和AD转换芯片采集用户输入的语音口令的。本专利技术训练模块包括DTW、DCT训练和ANN训练,其中DTW训练是将若干个训练样本通过动态时间弯折算法DTW规整成一个特征向量,称为DTW模板,DCT训练是对DTW模板进行一次DCT变换,将变换后的特征向量称为DCT模板,ANN训练是利用已训练人员的语音样本和非持有者的语音样本来分割一个多维的频谱空间,使得已训练人语音样本所占据的频谱空间被映射到已训练人的输出,而非已训练人语音样本所占据的频谱空间被映射到非已训练人的输出,形成已训练人独有的声纹考勤模板。本专利技术的识别模块利用训练模块生成的声纹考勤模板和语音预处理模块得到的说话人语音微特征参数采用DCT算法对所有已训练人员进行预选,从而得到与被识别人特征最接近的若干已训练者ID号,再利用DTW算法比对DCT算法预选的若干已训练者,得到与被识别人特征最接近的一个已训练者ID,若为合法ID,进入声纹识别模块进行说话人确认。本专利技术的存储系统模块还具有一存储量监测模块,用以监测存储系统模块的存储信息量,在液晶显示模块中设有一显示报警模块,存储量监测模块驱动显示报警模块并通过液晶显示模块中的液晶屏进行显示报警。本专利技术的存储系统模块由大容量Flash存储系统模块和文件系统模块组成,其中大容量Flash存储系统模块用于提供信息存储介质,文件系统模块用于向开发者提供操作大容量Flash存储系统模块的方法。存储系统模块用以保存考勤信息和用户声纹考勤模板等信息,可以在断电状态下长期保存信息。本专利技术的键盘模块与液晶显示模块共同组成一交互平台。在本专利技术中,还包括一USB通讯接口模块。也可以包括一IP和网关的设置,用于PC机和考勤机通讯,以传递考勤记录,用户信息等数据,利于用户通过PC机管理和统计记录信息以及员工信息。在本专利技术中,还包括一图形用户界面(GUI)模块用于提供一种快速稳定的图形界面开发方式,以利于程序员开发出所需要的图形界面,向用户提供友好的操作界面;在本专利技术中,还包括一备用电源,使本专利技术在没有外接电源的情况下也能继续工作。本专利技术的主要特点和效果为可以直接在本专利技术上采用中文输入的方式输入员工的档案资料,直接利用人体声纹特征进行考勤,有效地防止代打卡现象;员工无须携带用具便可以进行考勤,方便了员工的上下班考勤,也不会出现考勤卡遗失的问题;使用后无须追加其它额外的如纸张或磁卡的投入费用;使用者简单易学,易操作。独特的宽大屏幕显示和窗口式操作,提高了考勤机操作的交互性。直接在机上浏览及统计打印考勤数据,可以通过多种方式进行数据交换,极大地方便了考勤管理人员进行统计。附图说明下面结合附图和具体的实施方式,对本专利技术声纹考勤机进行详细的说明图1为本专利技术声纹考勤机的结构示意图;图2为本专利技术声纹考勤机的识别技术示意图;图3为本专利技术声纹考勤机的DTW的扫描范围示意图;图4为本专利技术声纹考勤机的DTW的路径示意图;图5为本专利技术声纹考勤机的声纹识别原理示意图;图6为本专利技术声纹考勤机的液晶显示驱动示意图;图7为本专利技术声纹考勤机的用户图形接口示意图;图8为本专利技术声纹考勤机的大容量Flash存储系统模块结构框图;图9为本专利技术声纹考勤机的输入法操作方法示意图;图10为本专利技术声纹考勤机的电路结构框示意图;图11为本专利技术声纹考勤机的软件结构框示意图;图12为本专利技术声纹考本文档来自技高网
...

【技术保护点】
一种声纹考勤机是通过以下方法来实现的:    [1]、先用键盘模块通过输入法模块中的输入法来新建一个员工的档案,并存入存储系统模块中;    [2]、然后语音采集模块采用说话人输入的语音ID号码口令,将其转换成数字信号,并把数字信号传送至所述的语音处理模块;    [3]、语音预处理模块对输入语音的数字信号进行语音分析处理,包括语音口令检测、静音拼接、预加重、加窗、加帧、去噪、MFCC特征提取分析处理,并输出处理得到的语音的微特征参数传送至训练模块;    [4]、训练模块接收语音预处理的数据,对指定的用户ID号码对应的语音样本进行训练,形成已训练人独有的声纹考勤模板,存入存储系统模块中的员工档案中;    [5]、考勤时,语音采集模块采用说话人输入的语音ID号码口令,将其转换成数字信号,并把数字信号传送至所述的语音处理模块;语音预处理模块对输入语音的数字信号进行语音分析处理,包括语音口令检测、静音拼接、预加重、加窗、加帧、去噪、MFCC特征提取分析处理,并输出处理得到的语音的微特征参数传送至识别模块,识别模块调用存储系统中的利用训练模块生成的现有声纹考勤模板和从语音预处理模块得到的说话人语音微特征参数,找出合法ID,进入声纹识别模块进行说话人确认,声纹识别模块通过语音信号特征模糊动态集合的聚类,并利用单层感知机网络实现已聚类的激励群到说话人的转换,识别出说话人,找出说话人所对应的ID号,在将这个ID号所对应的员工信息显示在液晶显示模块的显示屏上;    [6]、辨别结束后,将说话人说话声音的时间记录到存储系统模块所建立的考勤记录库中。...

【技术特征摘要】
1.一种声纹考勤机是通过以下方法来实现的[1]、先用键盘模块通过输入法模块中的输入法来新建一个员工的档案,并存入存储系统模块中;[2]、然后语音采集模块采用说话人输入的语音ID号码口令,将其转换成数字信号,并把数字信号传送至所述的语音处理模块;[3]、语音预处理模块对输入语音的数字信号进行语音分析处理,包括语音口令检测、静音拼接、预加重、加窗、加帧、去噪、MFCC特征提取分析处理,并输出处理得到的语音的微特征参数传送至训练模块;[4]、训练模块接收语音预处理的数据,对指定的用户ID号码对应的语音样本进行训练,形成已训练人独有的声纹考勤模板,存入存储系统模块中的员工档案中;[5]、考勤时,语音采集模块采用说话人输入的语音ID号码口令,将其转换成数字信号,并把数字信号传送至所述的语音处理模块;语音预处理模块对输入语音的数字信号进行语音分析处理,包括语音口令检测、静音拼接、预加重、加窗、加帧、去噪、MFCC特征提取分析处理,并输出处理得到的语音的微特征参数传送至识别模块,识别模块调用存储系统中的利用训练模块生成的现有声纹考勤模板和从语音预处理模块得到的说话人语音微特征参数,找出合法ID,进入声纹识别模块进行说话人确认,声纹识别模块通过语音信号特征模糊动态集合的聚类,并利用单层感知机网络实现已聚类的激励群到说话人的转换,识别出说话人,找出说话人所对应的ID号,在将这个ID号所对应的员工信息显示在液晶显示模块的显示屏上;[6]、辨别结束后,将说话人说话声音的时间记录到存储系统模块所建立的考勤记录库中。2.根据权利要求1所述的一种声纹考勤机,其特征在于所述的语音采集模块是利用麦克风和AD转换芯片采集用户输入的语音口令的。3.根据权利要求1所述的一种声纹考勤机,其特征在于所述的训练模块包括DTW、DCT训练和ANN训练,其中DTW训练是将若干个训练...

【专利技术属性】
技术研发人员:吴田平
申请(专利权)人:吴田平
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利