有声无声判定装置和有声无声判定方法制造方法及图纸

技术编号:3046294 阅读:173 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种有声无声判定装置和有声无声判定方法,其中有声无声判定装置10具有:自相关计算部11,计算输入信号的自相关值;延迟计算部12,计算算出的自相关值为最大的延迟;杂音判定部13,基于算出的延迟判定输入信号是否为杂音;杂音推定部14,根据输入信号推定杂音;有声无声判定部15,基于杂音判定部13的判定结果和杂音推定部14推定的杂音以及输入信号判定输入信号有声或无声;有声区间检测部16,基于有声无声判定部15的判定结果对有声区间的持续时间进行计时。杂音推定部14在有声区间的持续时间为一定时间以上时,改变杂音推定方法,使得容易将输入信号判定为有声。

【技术实现步骤摘要】

本专利技术涉及。
技术介绍
在便携电话和因特网电话中,以消减发送功率和有效利用传送频带为目的的所谓间歇发送的技术得到利用。所谓间歇发送是指这样的技术在有声音的有声区间内发送对声音编码后的信息,另一方面,在没有声音的无声区间内发送比声音信息少的信息量的信息,或者停止发送信息。为了进行这种间歇发送,利用有声无声判定装置,判定输入信号在包含声音的有声区间还是在不需要发送信息的无声区间。例如,下述非专利文献1中记载的有声无声判定装置用规定的杂音推定方法从输入信号中推定背景杂音,用推定的背景杂音和输入信号之比(S/N比)来判定是有声区间还是无声区间。非专利文献13GPP TS 26.094 V3.0.0(http://www.3gpp.org/ftp/Specs/html-info/26094.htm)
技术实现思路
但是,在上述现有的有声无声判定装置中,有以下问题。即,通常,由于杂音性质随时间变化等原因,随着时间的推移,杂音推定精度下降。杂音推定精度的下降在有声区间长时间持续时尤其显著。上述现有的有声无声判定装置持续使用这种精度低下的推定背景杂音进行有声无声判定,因此,随着时间的推移(尤其在有声区间长时间继续时),有声无声判定精度下降。结果,就有这样的问题在上述现有的有声无声判定装置中,随着时间的推移(尤其在有声区间长时间继续时),错误地将有声区间判定为无声区间的频率变高。因此,本专利技术旨在解决上述问题,提供一种无论时间如何推移都能正确地判定有声区间的。为了解决上述课题,本专利技术的有声无声判定装置,其特征在于,具有有声无声判定单元,根据规定的判定条件来判定输入信号是否有声;计时单元,基于上述有声无声判定单元的判定结果,对有声区间的持续时间进行计时,其中上述有声无声判定单元在由上述计时单元计时的上述有声区间的持续时间为一定时间以上时,缓和上述判定条件,以使得易于将上述输入信号判定为有声。为了解决上述课题,本专利技术的有声无声判定方法,根据规定的判定条件来判定输入信号是否有声,其特征在于,在判定为有声区间的时间在一定时间以上时,缓和上述判定条件,以使得易于将上述输入信号判定为有声。在判定为有声区间的时间在一定时间以上时,通过缓和判定输入信号是否为有声的判定条件,即使随着时间的推移杂音推定精度下降,也能降低错误地将有声区间判断为无声区间的频率。本专利技术的有声无声判定装置的特征在于,上述有声无声判定单元基于利用规定的杂音推定方法推定的杂音来判定上述输入信号是否有声,当由上述计时单元计时的上述有声区间的持续时间为一定时间以上时,改变上述杂音推定方法,以使得易于将上述输入信号判定为有声。有声区间的持续时间为一定时间以上时,通过改变杂音推定方法以便容易判定为有声,即使随着时间的推移,杂音推定精度下降,也能降低错误地将有声区间判断为无声区间的频率。这时,根据随时间变化的杂音的性质,可以提高杂音的推定精度。本专利技术的通过缓和在判定为有声区间的时间为一定时间以上时判定输入信号是否为有声的判定条件,即使随着时间的推移杂音推定精度下降,也能降低错误地将有声区间判断为无声区间的频率。结果,无论时间如何推移,都能正确地判定有声区间。附图说明图1是根据本专利技术实施方式的有声无声判定装置的构成图;图2是根据本专利技术实施方式的有声无声判定装置的操作流程图。具体实施例方式参考附图说明根据本专利技术实施方式的有声无声判定装置。首先,说明根据本实施方式的有声无声判定装置的构成。图1是根据本实施方式的有声无声判定装置的构成图。根据本实施方式的有声无声判定装置10物理上作为计算机系统来构成,具备CPU(中央处理器)、存储器、鼠标或键盘等输入装置、显示器等显示装置、硬盘等存储装置、通过无线和外部设备进行数据通信的无线通信单元等。在功能上,如图1所示,有声无声判定装置10具有自相关计算部11,延迟计算部12,杂音判定部13,杂音推定部14,有声无声判定部15,有声区间检测部16(计时装置)。以下,这里,由自相关计算部11,延迟计算部12,杂音判定部13,杂音推定部14和有声无声判定部15构成有声无声判定单元。详细说明有声无声判定装置10的各构成要素。自相关计算部11计算输入信号的自相关值。具体地说,有声无声判定装置10根据以下的式(1)算出输入信号x(t)的自相关值c(t)。c(t)=Σn=0N-1x(n)x(n-t)Σn=0N-1x2(n)Σn=0N-1x2(n-t)---(1)]]>这里,x(n)(n=0,1,...,N)是在经过一定时间(例如20msec)后每隔一定时间间隔(例如1/8000sec)对x(t)采样得到的第n个值。对于自相关值c(t),也是作为在一定时间(例如18msec)后每隔一定时间间隔(例如1/8000sec)的离散值而得到。此外,自相关计算部11不一定严密地按上述式(1)算出自相关值。例如,自相关计算部11也可以基于广泛用于声音编码过程中的带听觉加权的输入信号而算出自相关值。延迟计算部12算出使由自相关计算部11计算的自相关值为最大的延迟。具体地说,延迟计算部12扫描预定的延迟观测区间(例如AMR时为18~143)内的自相关值,算出自相关值为最大的延迟。杂音判定部13基于延迟计算部12算出的延迟来判定输入信号是否为杂音。例如,杂音判定部13利用延迟计算部12算出的延迟t_max的时间变动t_max(t)(1≤t≤T)判定输入信号是否为杂音。这里,t是表示时刻的从属变量。具体地说,在满足式(2)所示条件的状态持续一定时间的情况下(如果定性地说,是延迟变动小的状态持续一定时间时),杂音判定部13判定输入信号不是杂音。相反,在满足式(2)所示条件的状态不持续一定时间的情况下,杂音判定部13判定输入信号是杂音。|t_max(t)-t_max(t-1)|≤d …(2)此外,式(2)中,d是预定的阈值。这里,杂音判定部13也可以用上述过程以外的过程判定输入信号是否为杂音。杂音推定部14从输入信号中推定杂音。具体地说,杂音推定部14例如根据下述式(3),推定杂音。noisem+1(n)=(1-α)·noisem(n)+α·inputm-1(n) …(3)这里,noise是推定杂音,input是输入信号,n是表示频带的指数,m是表示时刻(帧)的指数,α是系数。即,noisem(n)表示第n个频带内时刻(帧)m的推定杂音。这里,杂音推定部14根据杂音判定部13的判定结果来改变上述式(3)的系数α。即,杂音判定部13判定输入信号不是杂音时,杂音推定部14使上述式(3)的系数α为0或者接近0的值α1,以便不增大推定杂音功率。另一方面,杂音判定部13判定输入信号为杂音时,杂音推定部14使上述式(3)的系数α为1或者接近1的值α2(α2>α1),以便使推定杂音接近输入信号。此外,杂音推定部14也可以用上述过程以外的过程从输入信号中推定杂音。有声无声判定部15基于杂音判定部13的判定结果和输入信号以及杂音推定部14推定的杂音,判定输入信号有声或无声。具体地说,例如,有声无声判定部15根据杂音推定部14推定的杂音和输入信号计算出S/N比(更准确地说是各频带的S/N比的累计值或平均值)。有声无声判定部本文档来自技高网...

【技术保护点】
一种有声无声判定装置,其特征在于,具有:有声无声判定单元,根据规定的判定条件来判定输入信号是否有声;计时单元,基于上述有声无声判定单元的判定结果,对有声区间的持续时间进行计时,其中上述有声无声判定单元在由上述计时单元 计时的上述有声区间的持续时间为一定时间以上时,缓和上述判定条件,以使得易于将上述输入信号判定为有声。

【技术特征摘要】
JP 2004-1-28 2004-0203511.一种有声无声判定装置,其特征在于,具有有声无声判定单元,根据规定的判定条件来判定输入信号是否有声;计时单元,基于上述有声无声判定单元的判定结果,对有声区间的持续时间进行计时,其中上述有声无声判定单元在由上述计时单元计时的上述有声区间的持续时间为一定时间以上时,缓和上述判定条件,以使得易于将上述输入信号判定为有声。2.根据...

【专利技术属性】
技术研发人员:仲信彦大矢智之
申请(专利权)人:株式会社NTT都科摩
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1