基于声纹识别帮助失聪患者判断声音类别的方法技术

技术编号:13462949 阅读:225 留言:0更新日期:2016-08-04 15:39
本发明专利技术涉及一种基于声纹识别帮助失聪患者判断声音类别的方法,其包括如下步骤:步骤1、对每个模板声音进行特征矢量提取,以得到每个模板声音对应的模板声音特征矢量;步骤2、对环境声音进行特征矢量提取,以得到环境声音的环境声音特征矢量;步骤3、将环境声音特征矢量与模板声音特征矢量库内的模板声音特征矢量通过DTW动态时间规整方法进行一一比对,以得到若干声音比对欧式距离;步骤4、确定上述声音比对欧式距离中的最小声音比对欧式距离以及与最小声音比对欧式距离对应的模板声音,则环境声音的类别为与最小声音比对欧式距离对应的模板声音。本发明专利技术能有效识别声音的类别,有助于失聪患者对语音识别的能力,适应范围广,安全可靠。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及一种,其包括如下步骤:步骤1、对每个模板声音进行特征矢量提取,以得到每个模板声音对应的模板声音特征矢量;步骤2、对环境声音进行特征矢量提取,以得到环境声音的环境声音特征矢量;步骤3、将环境声音特征矢量与模板声音特征矢量库内的模板声音特征矢量通过DTW动态时间规整方法进行一一比对,以得到若干声音比对欧式距离;步骤4、确定上述声音比对欧式距离中的最小声音比对欧式距离以及与最小声音比对欧式距离对应的模板声音,则环境声音的类别为与最小声音比对欧式距离对应的模板声音。本专利技术能有效识别声音的类别,有助于失聪患者对语音识别的能力,适应范围广,安全可靠。【专利说明】
本专利技术设及一种方法,尤其是一种基于声纹识别帮助失聪患者判断声音类别的方 法,属于声纹识别的

技术介绍
声纹识别(VoicePrint Reco即ition,VR),即说话人识别(Speaker Reco即ition SR),属于生物特征识别技术的一种,是一项根据语音波形中反映声纹生理和行为的特征的 语音参数,自动识别声纹身份的技术。声纹识别是具有较好鲁棒性和自适应的声纹识别算 法的研究。与语音识别不同的是,声纹识别利用语音信号中的声纹声音本身的特征,而不考 虑语音中的字词意思,它强调声纹的个性;而语音识别的目的是识别出语音信号的内容,并 不考虑声纹是谁,强调声纹的共性。 对有听力障碍的患者来说,提高听力能力的传统方法是通过助听器来帮助患者听 清声音,具体方法是通过拾音器获得外部声音,再通过声音放大器把获得的声音放大,进而 让患者听到声音。由于失聪患者对声音大小已经不再敏感,失去了判断声音大小的能力,因 此通过助听器等传统方法放大声音已经不适用了,对运类患者来说不能通过传统意义上的 方法进行治疗。
技术实现思路
本专利技术的目的是克服现有技术中存在的不足,提供一种基于声纹识别帮助失聪患 者判断声音类别的方法,其操作方便,能有效识别声音的类别,有助于失聪患者对语音识别 的能力,适应范围广,安全可靠。 按照本专利技术提供的技术方案,一种基于声纹识别帮助失聪患者判断声音类别的方 法,所述判断声音类别的方法包括如下步骤: 步骤1、提供若干所需的模板声音,并对每个模板声音进行特征矢量提取,W得到 每个模板声音对应的模板声音特征矢量,所有模板声音的模板声音特征矢量构成模板声音 特征矢量库; 步骤2、采集环境声音,并对所述环境声音进行特征矢量提取,W得到环境声音的 环境声音特征矢量;[000引步骤3、将环境声音特征矢量与模板声音特征矢量库内的模板声音特征矢量通过 DTW动态时间规整方法进行一一比对,W得到若干声音比对欧式距离; 步骤4、确定上述声音比对欧式距离中的最小声音比对欧式距离W及与最小声音 比对欧式距离对应的模板声音,则环境声音的类别为与最小声音比对欧式距离对应的模板 声音。 所述模板声音包括室内声音W及室外声音,所述室内声音包括哭声、嘟嘟声、扫靑 扫地声、咬咬作响的口声、关口声、Π 铃声、脚步声、吹风声、敲口声、铃声、水声或哨声; 所述室外声音包括飞机声、掌声、鸟声、汽车卿趴声、拥挤声、狗或猫叫声、发动机 启动声、尖叫声、雷声、火车的运动声或风吹声。 所述步骤1中,对每个模板声音进行特征矢量提取,W得到每个模板声音对应模板 声音特征矢量的过程包括如下步骤: 步骤1.1、对模板声音进行分帖,并对分帖后的模板声音进行预加重处理; 步骤1.2、对上述预加重的模板声音进行加窗,并对加窗后的模板声音进行端点检 测; 步骤1.3、对上述端点检测后的模板声音进行傅立叶变换,W得到模板声音的线性 频谱; 步骤1.4、对得到的线性频谱通过Mel频率滤波器组,W得到Mel频谱,对所述Mel频 谱通过对数能量处理,W得到对数频谱; 步骤1.5、将得到的对数频谱经过DCT变换到倒频谱域,W得到MFCC特征参数,并将 MFCC特征参数W及所述MFCC特征参数的一阶差分作为特征参数,W提取得到模板声音的模 板声音特征矢量。[001引对模板声音进行分帖时,使用的分帖帖长为30ms,帖移为10ms。对模板声音采用化mming窗进行力幡处理,采用双Π 限比较法进行端点检测。 本专利技术优点:对模板声音进行特征矢量提取,W得到每个模板声音对应的模板声 音特征矢量,对环境声音进行特征矢量提取,W得到环境声音的环境声音特征矢量;将环境 声音特征矢量与模板声音特征矢量库内的模板声音特征矢量通过DTW动态时间规整方法进 行一一比对,W得到若干声音比对欧式距离,确定上述声音比对欧式距离中的最小声音比 对欧式距离W及与最小声音比对欧式距离对应的模板声音,贝环境声音的类别为与最小声 音比对欧式距离对应的模板声音,能有效识别声音的类别,有助于失聪患者对语音识别的 能力,适应范围广,安全可靠。【附图说明】 图1为本专利技术的数据流图。 图2为本专利技术得到MFCC特征参数的流程图。【具体实施方式】 下面结合具体附图和实施例对本专利技术作进一步说明。 如图1所示:为了能有效识别声音的类别,有助于失聪患者对语音识别的能力,本 专利技术判断声音类别的方法包括如下步骤: 步骤1、提供若干所需的模板声音,并对每个模板声音进行特征矢量提取,W得到 每个模板声音对应的模板声音特征矢量,所有模板声音的模板声音特征矢量构成模板声音 特征矢量库; 具体地,所述模板声音包括室内声音W及室外声音,所述室内声音包括哭声、嘟嘟 声、扫靑扫地声、咬咬作响的口声、关口声、Π 铃声、脚步声、吹风声、敲口声、铃声、水声或哨 声;所述室外声音包括飞机声、掌声、鸟声、汽车卿趴声、拥挤声、狗或猫叫声、发动机启动 声、尖叫声、雷声、火车的运动声或风吹声。具体实施时,模板声音还可W为其他形式的声音 类型,具体为本
人员所熟知,此处不再寶述。 如图2所示,对每个模板声音进行特征矢量提取时,先对模板声音进行预处理,并 对预处理后进行特征矢量的提取,W得到每个模板声音对应模板声音特征矢量,具体过程 包括如下步骤: 步骤1.1、对模板声音进行分帖,并对分帖后的模板声音进行预加重处理; 本专利技术实施例中,分帖的目的是将连续语音信号划分为段,W便于进行后续的处 理;由于人耳所听到的声音在20~30ms内是稳定的,即在20~30ms的时间内,声音的变化不 大且比较有规律,故设定帖的长度为20ms左右。同时,帖与帖之间需保证一定的重叠(即帖 移),W减小由于强行划分导致信息损失的可能。本专利技术实施例中,使用的分帖帖长为30ms, 帖移为10ms。 本专利技术实施例中,经过预加重处理W提高信号的高频部分的幅度,采用一阶数字 滤波器进行预加重,预加重系数为0.97。 步骤1.2、对上述预加重的模板声音进行加窗,并对加窗后的模板声音进行端点检 测; 为了平滑信号W减少每帖信号两端的预检测误差,避免频谱出现"破碎"的现象, 采用加窗处理。每帖用窗函数相乘W减少帖起始和结束处的信号的不连续性。在语音信号 的时域分析来说,窗函数很重要,虽然矩形窗平滑比较好,但容易使波形细节丢失,并且产 生泄露现象,本专利技术实施例中,采用Hamming窗函数,具体地 其中,N为对模板声音进行采样量化的采样点数,η为关于采样点数N的变量,W(n) 为窗函数。 端点检测是声纹识别中的本文档来自技高网
...

【技术保护点】
一种基于声纹识别帮助失聪患者判断声音类别的方法,其特征是,所述判断声音类别的方法包括如下步骤:步骤1、提供若干所需的模板声音,并对每个模板声音进行特征矢量提取,以得到每个模板声音对应的模板声音特征矢量,所有模板声音的模板声音特征矢量构成模板声音特征矢量库;步骤2、采集环境声音,并对所述环境声音进行特征矢量提取,以得到环境声音的环境声音特征矢量;步骤3、将环境声音特征矢量与模板声音特征矢量库内的模板声音特征矢量通过DTW动态时间规整方法进行一一比对,以得到若干声音比对欧式距离;步骤4、确定上述声音比对欧式距离中的最小声音比对欧式距离以及与最小声音比对欧式距离对应的模板声音,则环境声音的类别为与最小声音比对欧式距离对应的模板声音。

【技术特征摘要】

【专利技术属性】
技术研发人员:钦赛勇
申请(专利权)人:无锡吾芯互联科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1