The invention discloses a teaching attendance method based on voice recognition. The processor classifies the students'voice signals by using the acoustic model depth neural network in speech recognition, extracts the speaker information, and uses it to extract DNN I vector to recognize the voiceprint that answers to the students' voice, and then answers the recognition to the students. Voice print matching, using five pickups to answer the spatial location of students'voice source, judging whether students are speaking privately by the location, direction and volume of the voice source, achieves the purpose of attendance and classroom discipline monitoring, and can solve the pitch cycle coefficient in the distinction between voiceless and low-level voice. In the stage of voiceprint recognition, GMM is used to train and recognize a particular person's voiceprint and the environment noise disturbance is large, and the error of source position estimation is small.
【技术实现步骤摘要】
一种基于声音识别的教学考勤方法
本专利技术属于语音识别领域,尤其涉及一种基于声音识别的教学考勤方法。
技术介绍
目前的考勤管理系统虽然跟以往签到方式相比有着明显的进步,但由于还是由有线数据的传输,需要布局布线以及线口对接等比较复杂的过程来完成,而且这样的工作方式不仅费时费力,浪费原材料,而且必须人为的来完成线路的管理以及数据的分析,所以能够把考勤信息远距离的无线传输和接收,实现低成本、高效率、无错化的考勤管理系统日趋成为了大家的迫切需要,目前市场上已经出现基于声纹信息的考勤系统,但是复杂课堂语音环境下声纹识别率不高,而且现有语音考勤系统不具备课上监测课堂纪律的功能。
技术实现思路
针对现有技术存在的问题,本专利技术提供了一种基于声音识别的教学考勤方法。本专利技术是这样实现的,一种基于声音识别的教学考勤方法包括:步骤一、采集老师点名的声音信号,利用正交小波滤波器组来对信号进行预滤波,对语言信号的每个频率段进行细粒度去噪,提取出各频段小波系数,重构出语音信号;步骤二、将预滤波后的语音信息发送给教学电脑的处理器内,利用倒谱法计算出基音周期参数,通过Mel滤波器组将小波系数转换成Mel倒谱系数,将得出的两种参数组成一个特征矢量作为声纹特征,并在数据库内查找与该声纹特征信息匹配的相对应姓名的学生个人信息;步骤三、多个拾音器获取答到学生的声音,并在数据库内查找该姓名的学生个人信息,对拾取的学生声音进行预处理,并将预处理后的音频信号传输到教学电脑的处理器内;步骤四、处理器利用语音识别中的声学模型深度神经网络分别对该学生预处理后的声音信号的不同音素上的语音特征进行分类,在毎个 ...
【技术保护点】
1.一种基于声音识别的教学考勤方法,其特征在于,该方法包括:步骤一、采集老师点名的声音信号,利用正交小波滤波器组来对信号进行预滤波,对语言信号的每个频率段进行细粒度去噪,提取出各频段小波系数,重构出语音信号;步骤二、将预滤波后的语音信息发送给教学电脑的处理器内,利用倒谱法计算出基音周期参数,通过Mel滤波器组将小波系数转换成Mel倒谱系数,将得出的两种参数组成一个特征矢量作为声纹特征,并在数据库内查找与该声纹特征信息匹配的相对应姓名的学生个人信息;步骤三、多个拾音器获取答到学生的声音,并在数据库内查找该姓名的学生个人信息,对拾取的学生声音进行预处理,并将预处理后的音频信号传输到教学电脑的处理器内;步骤四、处理器利用语音识别中的声学模型深度神经网络分别对该学生预处理后的声音信号的不同音素上的语音特征进行分类,在毎个音素子空间内实现对特征降维,提取出说话人信息并用于提取DNN i‑vector进行答到学生语音的声纹识别,每一个说话人都由一个GMM表示,计算出特征矢量序列的每个似然函数,找到其中最大的说话人模型,判定为说话人;步骤五、将识别出来的答到学生的声纹,与数据库中学生个人信息中的声纹 ...
【技术特征摘要】
1.一种基于声音识别的教学考勤方法,其特征在于,该方法包括:步骤一、采集老师点名的声音信号,利用正交小波滤波器组来对信号进行预滤波,对语言信号的每个频率段进行细粒度去噪,提取出各频段小波系数,重构出语音信号;步骤二、将预滤波后的语音信息发送给教学电脑的处理器内,利用倒谱法计算出基音周期参数,通过Mel滤波器组将小波系数转换成Mel倒谱系数,将得出的两种参数组成一个特征矢量作为声纹特征,并在数据库内查找与该声纹特征信息匹配的相对应姓名的学生个人信息;步骤三、多个拾音器获取答到学生的声音,并在数据库内查找该姓名的学生个人信息,对拾取的学生声音进行预处理,并将预处理后的音频信号传输到教学电脑的处理器内;步骤四、处理器利用语音识别中的声学模型深度神经网络分别对该学生预处理后的声音信号的不同音素上的语音特征进行分类,在毎个音素子空间内实现对特征降维,提取出说话人信息并用于提取DNNi-vector进行答到学生语音的声纹识别,每一个说话人都由一个GMM表示,计算出特征矢量序列的每个似然函数,找到其中最大的说话人模型,判定为说话人;步骤五、将识别出来的答到学生的声纹,与数据库中学生个人信息中的声纹信息进行匹配,若匹配相似程度超过预设值,则判断学生答到通过,若匹配相似程度不超过预设值,则向警报器发出报警信息;步骤六、采用五个拾音器组成的阵列作为声源定位获取的耳朵,离线采样阶段,捕获各拾音器定位参考点处声源信号并完成位置特征提取,据此特征和参考点位置信息构建定位数据库,其中四个拾音器组成的平面阵确定声源空间位置,另外一个拾音器辅助完成声源位于拾音器前后方的判断,并通过改进的时延算法实现答到学生声源的空间定位,若答到学生的声源位置超出预设的教室范围,则判定学生迟到;步骤七、教学过程中,拾音器实时获取教室内的声音,通过在线定位,提取待定位点处实时信号特征并和定位数据库中信息进行匹配,通过声纹识别识别出老师、学生声音,通过步骤六的声源位置确定方法确定老师声源及学生声源的位置及朝向,并计算相对应的老师及学生的声源的音量大小,通过声源位置、声源朝向、声源音量大小判断学生是否在私自讲话。2.如权利要求1所述基于声音识别的教学考勤方法,其特征在于,步骤七所述判断学生是否在私自讲话的具体方法为:步骤一、若识别...
【专利技术属性】
技术研发人员:贾成举,朱永峰,张琳琳,
申请(专利权)人:贾成举,朱永峰,张琳琳,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。