当前位置: 首页 > 专利查询>贾成举专利>正文

一种基于声音识别的教学考勤方法技术

技术编号:19551090 阅读:24 留言:0更新日期:2018-11-24 21:54
本发明专利技术公开了一种基于声音识别的教学考勤方法,处理器利用语音识别中的声学模型深度神经网络对学生的声音信号进行分类,提取出说话人信息并用于提取DNN i‑vector进行答到学生语音的声纹识别,将识别出来的答到学生的声纹进行答到匹配,采用五个拾音器进行答到学生声源的空间定位,通过声源位置、声源朝向、声源音量大小判断学生是否在私自讲话,达到了考勤与课堂纪律监测的目的,而且可以解决基音周期系数在区别清音和低电平的浊音较困难及MFCC参数抗噪性不佳的问题,声纹识别阶段,利用GMM来训练和识别特定人声纹、环境噪声干扰较大的情况下,具有较小的声源位置估计偏差。

A Method of Teaching Attendance Based on Voice Recognition

The invention discloses a teaching attendance method based on voice recognition. The processor classifies the students'voice signals by using the acoustic model depth neural network in speech recognition, extracts the speaker information, and uses it to extract DNN I vector to recognize the voiceprint that answers to the students' voice, and then answers the recognition to the students. Voice print matching, using five pickups to answer the spatial location of students'voice source, judging whether students are speaking privately by the location, direction and volume of the voice source, achieves the purpose of attendance and classroom discipline monitoring, and can solve the pitch cycle coefficient in the distinction between voiceless and low-level voice. In the stage of voiceprint recognition, GMM is used to train and recognize a particular person's voiceprint and the environment noise disturbance is large, and the error of source position estimation is small.

【技术实现步骤摘要】
一种基于声音识别的教学考勤方法
本专利技术属于语音识别领域,尤其涉及一种基于声音识别的教学考勤方法。
技术介绍
目前的考勤管理系统虽然跟以往签到方式相比有着明显的进步,但由于还是由有线数据的传输,需要布局布线以及线口对接等比较复杂的过程来完成,而且这样的工作方式不仅费时费力,浪费原材料,而且必须人为的来完成线路的管理以及数据的分析,所以能够把考勤信息远距离的无线传输和接收,实现低成本、高效率、无错化的考勤管理系统日趋成为了大家的迫切需要,目前市场上已经出现基于声纹信息的考勤系统,但是复杂课堂语音环境下声纹识别率不高,而且现有语音考勤系统不具备课上监测课堂纪律的功能。
技术实现思路
针对现有技术存在的问题,本专利技术提供了一种基于声音识别的教学考勤方法。本专利技术是这样实现的,一种基于声音识别的教学考勤方法包括:步骤一、采集老师点名的声音信号,利用正交小波滤波器组来对信号进行预滤波,对语言信号的每个频率段进行细粒度去噪,提取出各频段小波系数,重构出语音信号;步骤二、将预滤波后的语音信息发送给教学电脑的处理器内,利用倒谱法计算出基音周期参数,通过Mel滤波器组将小波系数转换成Mel倒谱系数,将得出的两种参数组成一个特征矢量作为声纹特征,并在数据库内查找与该声纹特征信息匹配的相对应姓名的学生个人信息;步骤三、多个拾音器获取答到学生的声音,并在数据库内查找该姓名的学生个人信息,对拾取的学生声音进行预处理,并将预处理后的音频信号传输到教学电脑的处理器内;步骤四、处理器利用语音识别中的声学模型深度神经网络分别对该学生预处理后的声音信号的不同音素上的语音特征进行分类,在毎个音素子空间内实现对特征降维,提取出说话人信息并用于提取DNNi-vector进行答到学生语音的声纹识别,每一个说话人都由一个GMM表示,计算出特征矢量序列的每个似然函数,找到其中最大的说话人模型,判定为说话人;步骤五、将识别出来的答到学生的声纹,与数据库中学生个人信息中的声纹信息进行匹配,若匹配相似程度超过预设值,则判断学生答到通过,若匹配相似程度不超过预设值,则向警报器发出报警信息;步骤六、采用五个拾音器组成的阵列作为声源定位获取的耳朵,离线采样阶段,捕获各拾音器定位参考点处声源信号并完成位置特征提取,据此特征和参考点位置信息构建定位数据库,其中四个拾音器组成的平面阵确定声源空间位置,另外一个拾音器辅助完成声源位于拾音器前后方的判断,并通过改进的时延算法实现答到学生声源的空间定位,若答到学生的声源位置超出预设的教室范围,则判定学生迟到;步骤七、教学过程中,拾音器实时获取教室内的声音,通过在线定位,提取待定位点处实时信号特征并和定位数据库中信息进行匹配,通过声纹识别识别出老师、学生声音,通过步骤六的声源位置确定方法确定老师声源及学生声源的位置及朝向,并计算相对应的老师及学生的声源的音量大小,通过声源位置、声源朝向、声源音量大小判断学生是否在私自讲话。进一步,步骤七所述判断学生是否在私自讲话的具体方法为:步骤一、若识别出学生的声音,则判断当前时间老师是否在发声,若老师在发声,则判断学生在私自讲话,记录在考勤中;步骤二、若老师未发声,读取前n秒钟时间点时老师的声源的位置,根据学生声源的朝向,判断学生声音是否是否朝向老师,若不是朝向老师,则判定学生在课程上私自讲话,记录在考勤系统中;步骤三、若学生声源朝向老师,则根据学生与老师位置的距离,判断声源音量大小是否在阈值内,若是,则判定学生在回答老师的问题,若不是,则判定学生在私自讲话,记录在考勤系统中。进一步,步骤四所述语音的声纹识别方法如下:步骤一、把原始语音信号转化成数字信号,使用一阶高通滤波器去除语音信号中多余的噪声,消除直流漂移,通过加重处理保留对特征参数有用的池音信号;步骤二、语音信号的处理,取256个点作为一个32ms音框,对每个音框乘以汉明窗,消除音框两端的不连续性,采用低通滤波器去除噪声;步骤三、采用基于似然概率的的加权投票法,根据不同语音帧与概率模型之间的似然概率取值,对每一帧语音进行加权;步骤四、把不同地区及不同性别的声音片段映射到多维的特征空间,表征说话人个性特征的向量序列;步骤五、采用RBM对DNN网络参数初始化,采用带有标签的训练数据对DNN网络进行监督的参数更新,在DNN训练中采用误差反向传递算法巧进行参数训练;步骤六、在基于GMM的特征端因子分析中采用DNN替代GMM模型划分音素特征子空间,实现在每个子空间内对特征进行降维;步骤七、对每个子空间内降维后的特征端因子与表征说话人个性特征的向量序列分别进行匹配。进一步,所述声纹识别方法还包括构建不同地区及不同性别的语音信息数据库,将该语音数据库中的语音数据信息添加上地理区域信息标签和性别信息标签。进一步,所述声纹识别方法还包括对每个子空间内降维后的特征端因子与带有地理区域信息标签和性别信息标签的表征说话人个性特征的向量序列分别进行匹配;将匹配后的特征端因子添加地理区域信息标签和性别信息标签,将DNN网络中该特征端因子参数更新,以性别信息标签的数据信息为基准进行声纹信息的匹配,以地理区域信息标签的数据信息为基准对匹配信息予以确认。本专利技术将识别出来的答到学生的声纹,与数据库中学生个人信息中的声纹信息进行匹配,判断学生是否答到通过,通过声源位置、声源朝向、声源音量大小判断学生是否迟到、是否在私自讲话,达到考勤与课堂纪律监测的目的,而且可以解决基音周期系数在区别清音和低电平的浊音较困难及MFCC参数抗噪性不佳的问题,声纹识别阶段,利用GMM来训练和识别特定人声纹、环境噪声干扰较大的情况下,具有较小的声源位置估计偏差。附图说明图1是本专利技术实施例提供的基于声音识别的教学考勤方法流程图。具体实施方式为能进一步了解本专利技术的
技术实现思路
、特点及功效,兹例举以下实施例,并配合附图详细说明如下。下面结合附图对本专利技术的结构作详细的描述。一种基于声音识别的教学考勤方法包括:S101、采集老师点名的声音信号,利用正交小波滤波器组来对信号进行预滤波,对语言信号的每个频率段进行细粒度去噪,提取出各频段小波系数,重构出语音信号;S102、将预滤波后的语音信息发送给教学电脑的处理器内,利用倒谱法计算出基音周期参数,通过Mel滤波器组将小波系数转换成Mel倒谱系数,将得出的两种参数组成一个特征矢量作为声纹特征,并在数据库内查找与该声纹特征信息匹配的相对应姓名的学生个人信息;S103、多个拾音器获取答到学生的声音,并在数据库内查找该姓名的学生个人信息,对拾取的学生声音进行预处理,并将预处理后的音频信号传输到教学电脑的处理器内;S104、处理器利用语音识别中的声学模型深度神经网络分别对该学生预处理后的声音信号的不同音素上的语音特征进行分类,在毎个音素子空间内实现对特征降维,提取出说话人信息并用于提取DNNi-vector进行答到学生语音的声纹识别,每一个说话人都由一个GMM表示,计算出特征矢量序列的每个似然函数,找到其中最大的说话人模型,判定为说话人;在说话人识别中,不同说话人的差异只要表现在其短时语音的差异,而这又可以用每个说话人的短时谱特征矢量所具有的额概率密度函数来衡量,我们可以用高斯混合模型来表示这一概率密度函数。典型单峰高斯说话人模型代表了一个以均值矢量和协方差矩阵表示本文档来自技高网
...

【技术保护点】
1.一种基于声音识别的教学考勤方法,其特征在于,该方法包括:步骤一、采集老师点名的声音信号,利用正交小波滤波器组来对信号进行预滤波,对语言信号的每个频率段进行细粒度去噪,提取出各频段小波系数,重构出语音信号;步骤二、将预滤波后的语音信息发送给教学电脑的处理器内,利用倒谱法计算出基音周期参数,通过Mel滤波器组将小波系数转换成Mel倒谱系数,将得出的两种参数组成一个特征矢量作为声纹特征,并在数据库内查找与该声纹特征信息匹配的相对应姓名的学生个人信息;步骤三、多个拾音器获取答到学生的声音,并在数据库内查找该姓名的学生个人信息,对拾取的学生声音进行预处理,并将预处理后的音频信号传输到教学电脑的处理器内;步骤四、处理器利用语音识别中的声学模型深度神经网络分别对该学生预处理后的声音信号的不同音素上的语音特征进行分类,在毎个音素子空间内实现对特征降维,提取出说话人信息并用于提取DNN i‑vector进行答到学生语音的声纹识别,每一个说话人都由一个GMM表示,计算出特征矢量序列的每个似然函数,找到其中最大的说话人模型,判定为说话人;步骤五、将识别出来的答到学生的声纹,与数据库中学生个人信息中的声纹信息进行匹配,若匹配相似程度超过预设值,则判断学生答到通过,若匹配相似程度不超过预设值,则向警报器发出报警信息;步骤六、采用五个拾音器组成的阵列作为声源定位获取的耳朵,离线采样阶段,捕获各拾音器定位参考点处声源信号并完成位置特征提取,据此特征和参考点位置信息构建定位数据库,其中四个拾音器组成的平面阵确定声源空间位置,另外一个拾音器辅助完成声源位于拾音器前后方的判断,并通过改进的时延算法实现答到学生声源的空间定位,若答到学生的声源位置超出预设的教室范围,则判定学生迟到;步骤七、教学过程中,拾音器实时获取教室内的声音,通过在线定位,提取待定位点处实时信号特征并和定位数据库中信息进行匹配,通过声纹识别识别出老师、学生声音,通过步骤六的声源位置确定方法确定老师声源及学生声源的位置及朝向,并计算相对应的老师及学生的声源的音量大小,通过声源位置、声源朝向、声源音量大小判断学生是否在私自讲话。...

【技术特征摘要】
1.一种基于声音识别的教学考勤方法,其特征在于,该方法包括:步骤一、采集老师点名的声音信号,利用正交小波滤波器组来对信号进行预滤波,对语言信号的每个频率段进行细粒度去噪,提取出各频段小波系数,重构出语音信号;步骤二、将预滤波后的语音信息发送给教学电脑的处理器内,利用倒谱法计算出基音周期参数,通过Mel滤波器组将小波系数转换成Mel倒谱系数,将得出的两种参数组成一个特征矢量作为声纹特征,并在数据库内查找与该声纹特征信息匹配的相对应姓名的学生个人信息;步骤三、多个拾音器获取答到学生的声音,并在数据库内查找该姓名的学生个人信息,对拾取的学生声音进行预处理,并将预处理后的音频信号传输到教学电脑的处理器内;步骤四、处理器利用语音识别中的声学模型深度神经网络分别对该学生预处理后的声音信号的不同音素上的语音特征进行分类,在毎个音素子空间内实现对特征降维,提取出说话人信息并用于提取DNNi-vector进行答到学生语音的声纹识别,每一个说话人都由一个GMM表示,计算出特征矢量序列的每个似然函数,找到其中最大的说话人模型,判定为说话人;步骤五、将识别出来的答到学生的声纹,与数据库中学生个人信息中的声纹信息进行匹配,若匹配相似程度超过预设值,则判断学生答到通过,若匹配相似程度不超过预设值,则向警报器发出报警信息;步骤六、采用五个拾音器组成的阵列作为声源定位获取的耳朵,离线采样阶段,捕获各拾音器定位参考点处声源信号并完成位置特征提取,据此特征和参考点位置信息构建定位数据库,其中四个拾音器组成的平面阵确定声源空间位置,另外一个拾音器辅助完成声源位于拾音器前后方的判断,并通过改进的时延算法实现答到学生声源的空间定位,若答到学生的声源位置超出预设的教室范围,则判定学生迟到;步骤七、教学过程中,拾音器实时获取教室内的声音,通过在线定位,提取待定位点处实时信号特征并和定位数据库中信息进行匹配,通过声纹识别识别出老师、学生声音,通过步骤六的声源位置确定方法确定老师声源及学生声源的位置及朝向,并计算相对应的老师及学生的声源的音量大小,通过声源位置、声源朝向、声源音量大小判断学生是否在私自讲话。2.如权利要求1所述基于声音识别的教学考勤方法,其特征在于,步骤七所述判断学生是否在私自讲话的具体方法为:步骤一、若识别...

【专利技术属性】
技术研发人员:贾成举朱永峰张琳琳
申请(专利权)人:贾成举朱永峰张琳琳
类型:发明
国别省市:安徽,34

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1