一种基于语音包络特征的标志音识别方法及装置制造方法及图纸

技术编号:5966553 阅读:267 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于语音包络特征的标志音识别方法及装置,涉及语音质量测试技术。本发明专利技术方法包括:从衰减样本中记录任一语音数据段,且该语音数据段的采样点数与标志音样本的采样点数相同,再从语音数据段的所有采样点中抽取包络特征采样点,若根据所抽取的包络特征采样点判断语音数据段中相邻包络特征采样点的间距与源音样本中标志音的相应的相邻包络特征采样点的间距相等,则判断语音数据段即为标志音。本发明专利技术技术方案解决了由于引入同频噪声导致标志音误判的问题。

【技术实现步骤摘要】

本专利技术涉及无线(有线)通信领域的语音质量测试技术,具体涉及一种基于语音 包络特征的标志音识别方法及装置。
技术介绍
无线(有线)网络中语音质量测试都是通过对发送端发送的源音样本和接收端接 到的衰减样本的比对来实现的。为了能客观地评估出网络的语音质量,需要源音样本与采 集到的衰减样本准确对齐。通常,发送端在发送正式的源音样本前,会发送一段特征明显的 语音数据来作为标志音,并在经过一段由发送端和接收端共同约定的时间后发送源音样本 数据。接收端在识别出标志音后,等待相应时间,开始记录衰减样本。以此来实现源音样本 和衰减样本的对齐。在实际的测试过程中,发送端一般采用具有特殊频率的单音信号作为标志音。接 收端在收到语音数据后,通过数据进行快速傅里叶变换(Fast FourierTransform, FFT)及 滤波操作,来判断接收到的语音数据是否为标志音。在单纯的通信环境中,接收端通过FFT 和滤波操作,能够滤除大部分的外界干扰。但是,在实际生活中网络环境复杂多变,往往存 在着各种各样的干扰和噪声。测试过程中,一旦引入了与单音信号同频的噪声,则该噪声无 法被滤除,接收端必然会发生对标志音误判,导致测试结果出现异常。其次,单音信号所采用的频率通常超出了人耳可以听到的频率范围,测试人员没 有主观感受。当出现样本对齐误差时,测试人员无法通过人工的方式去排查误差出现的原 因。即便单音信号采用的频率在人耳可以听到的范围之内,它所发出的声音也是刺耳的尖 啸声,极大的影响测试人员的听觉感受。
技术实现思路
本专利技术所要解决的技术问题是,提供一种基于语音包络特征的标志音识别方法及 装置,从而避免对标志音的误判。为了解决上述问题,本专利技术公开了一种基于语音包络特征的标志音识别方法,包 括从衰减样本中记录任一语音数据段,且该语音数据段的采样点数与标志音样本的 采样点数相同,再从所述语音数据段的所有采样点中抽取包络特征采样点,若根据所抽取 的包络特征采样点判断所述语音数据段中相邻包络特征采样点的间距与源音样本中标志 音的相应的相邻包络特征采样点的间距相等,则判断所述语音数据段即为标志音,其中,包 络特征采样点包括包络上的波峰采样点和波谷采样点,相邻包络特征采样点为包络上相邻 的波峰采样点,或者为包络上相邻的波谷采样点,或者为包络上相邻的波峰采样点和波谷 采样点。进一步地,上述方法中,当所述语音数据段具有如下任一包络外形特征时,判断所 述语音数据段中相邻包络特征采样点的间距与源音样本中标志音的相应的相邻包络特征采样点的间距相等包络外形特征一,所述语音数据段的包络上相邻两波峰采样点的间距,与源音样 本中标志音的包络上相邻两波峰采样点的间距相等;或者,所述语音数据段的包络上相邻两波谷采样点的间距,与源音样本中标志音 的包络上相邻两波谷采样点的间距相等;包络外形特征二,源音样本中标志音的包络上相应的波峰采样点与其相邻的波谷 采样点的X轴坐标点的连线与X轴夹角的正切值与所述语音数据段的包络上波峰采样点与 其相邻波谷采样点的X轴坐标点的连线与X轴夹角的正切值的比值为第一比值,源音样本 中标志音的包络上相应的波峰采样点的振幅与所述语音数据段的包络上波峰采样点的振 幅的比值为第二比值,其中,所述第一比值与所述第二比值相等。其中,将从所述语音数据段中抽取的波峰和波谷采样点按照如下公式计算,当函 数S(DDXi,Doxi)计算结果为1时,判断所述语音数据段具有包络外形特征一 S(DomDoxi)=ifDDXi — Doxi^OXietc<a上式中,Dm表示从所述语音数据段中抽取的包络上相邻两波峰或者相邻两波谷 采样点的间距;Doxi表示源音样本中标志的包络上相邻两波峰或者相邻两波谷采样点的间距;a表示相邻两波峰或者相邻两波谷采样点的间距的误差门限值。优选地,对所述函数S(DDXi,Drai)进一步计算,当满足如下公式要求时,才判断所述 语音数据段具有包络外形特征一n-1^Ls (dDX1^dOXI)->bn-l式中,η为所述语音数据段包络上波峰或者波谷采样点的个数,b为相邻两波峰或 者相邻两波谷采样点的间距的有效率门限值。将从所述语音数据段中抽取的波峰和波谷采样点按照如下公式计算,当函数 C(tgdi,tgoi)计算结果为1时,判断所述语音数据段具有包络外形特征二 8权利要求1.一种基于语音包络特征的标志音识别方法,其特征在于,该方法包括从衰减样本中记录任一语音数据段,且该语音数据段的采样点数与标志音样本的采样 点数相同,再从所述语音数据段的所有采样点中抽取包络特征采样点,若根据所抽取的包 络特征采样点判断所述语音数据段中相邻包络特征采样点的间距与源音样本中标志音的 相应的相邻包络特征采样点的间距相等,则判断所述语音数据段为标志音,其中,包络特征 采样点包括包络上的波峰采样点和波谷采样点,相邻包络特征采样点为包络上相邻的波峰 采样点,或者为包络上相邻的波谷采样点,或者为包络上相邻的波峰采样点和波谷采样点。2.如权利要求1所述的方法,其特征在于,当所述语音数据段具有如下任一包络外形特征时,判断所述语音数据段中相邻包络特 征采样点的间距与源音样本中标志音的相应的相邻包络特征采样点的间距相等包络外形特征一,所述语音数据段的包络上相邻两波峰采样点的间距,与源音样本中 标志音的包络上相邻两波峰采样点的间距相等;或者,所述语音数据段的包络上相邻两波谷采样点的间距,与源音样本中标志音的包 络上相邻两波谷采样点的间距相等;包络外形特征二,源音样本中标志音的包络上相应的波峰采样点与其相邻的波谷采样 点的X轴坐标点的连线与X轴夹角的正切值与所述语音数据段的包络上波峰采样点与其相 邻波谷采样点的X轴坐标点的连线与X轴夹角的正切值的比值为第一比值,源音样本中标 志音的包络上相应的波峰采样点的振幅与所述语音数据段的包络上波峰采样点的振幅的 比值为第二比值,其中,所述第一比值与所述第二比值相等。3.如权利要求2所述的方法,其特征在于,将从所述语音数据段中抽取的波峰和波谷采样点按照如下公式计算,当函数S(DDXi, Doxi)计算结果为1时,判断所述语音数据段具有包络外形特征一4.如权利要求3所述的方法,其特征在于,对所述函数S(DDXi,Doxi)进一步计算,当满足如下公式要求时,才判断所述语音数据段 具有包络外形特征一5.如权利要求2所述的方法,其特征在于,将从所述语音数据段中抽取的波峰和波谷采样点按照如下公式计算,当函数C(tgdi, tgoi)计算结果为1时,判断所述语音数据段具有包络外形特征二 6.如权利要求5所述的方法,其特征在于,对所述函数C(tgdi,tgoi)进一步计算,当满足如下公式要求时,才判断所述语音数据段具有包络外形特征二式中,η为所述语音数据段包络上波峰或者波谷采样点的个数,d为正切值有效率门限值。7.如权利要求1至6任一项所述的方法,其特征在于,从衰减样本中的有效音频数据中记录任一语音数据段,其中,确定衰减样本中的有效 音频数据的过程如下;当所述衰减样本一段音频数据的采样点数达到事先设定的数据有效门限Vt,且所述采 样点中连续的无效采样点的个数小于事先设定的数据失效门限It,则确定该段音频数据为 有效音频数据,所述采样点的振幅的绝对本文档来自技高网...

【技术保护点】
1.一种基于语音包络特征的标志音识别方法,其特征在于,该方法包括:从衰减样本中记录任一语音数据段,且该语音数据段的采样点数与标志音样本的采样点数相同,再从所述语音数据段的所有采样点中抽取包络特征采样点,若根据所抽取的包络特征采样点判断所述语音数据段中相邻包络特征采样点的间距与源音样本中标志音的相应的相邻包络特征采样点的间距相等,则判断所述语音数据段为标志音,其中,包络特征采样点包括包络上的波峰采样点和波谷采样点,相邻包络特征采样点为包络上相邻的波峰采样点,或者为包络上相邻的波谷采样点,或者为包络上相邻的波峰采样点和波谷采样点。

【技术特征摘要】

【专利技术属性】
技术研发人员:韩治陆上义朱振明
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利