有声无声判定装置和有声无声判定方法制造方法及图纸

技术编号:3046331 阅读:175 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种有声无声判定装置和有声无声判定方法,其中有声无声判定装置1包括:计算输入信号的自相关值的自相关计算部11;延迟计算部12,计算自相关计算部11算出的自相关值为极大的多个延迟;杂音判定部13,基于延迟计算部12算出的多个延迟判定输入信号是否为杂音;有声无声判定部14,基于杂音判定部13的判定结果和输入信号判定输入信号有声或无声。

【技术实现步骤摘要】

本专利技术涉及。
技术介绍
在便携电话和因特网电话中,以消减发送功率和有效利用传送频带为目的的所谓间歇发送的技术得到利用。所谓间歇发送是指这样的技术在有声音的有声区间内发送对声音编码后的信息,另一方面,在没有声音的无声区间内发送比声音信息少的信息量的信息,或者停止发送信息。为了进行这种间歇发送,利用有声无声判定装置,判定输入信号在包含声音的有声区间还是在不需要发送信息的无声区间。例如,下述专利文献1中记载的有声无声判定装置利用声音信号是有周期性的特性,利用输入信号的自相关值判定是有声区间还是无声区间。具体地说,有声无声判定装置算出输入信号的自相关值为最大的延迟,算出的延迟如果和声音信号的周期一致,则判定为有声区间,如果不一致,则判定为无声区间。下述非专利文献1中记载的有声无声判定装置根据输入信号推定背景杂音,用推定的背景杂音和输入信号的比(S/N比)判定是有声区间还是无声区间。更具体地说,有声无声判定装置算出输入信号的自相关值为最大的延迟以及带加权的输入信号的自相关值为最大的延迟,基于这些延迟的持续性(即延迟变动小的状态是否持续一定时间),一边改变背景杂音的推定方法,一边推定背景杂音,如果推定的背景杂音和输入信号的S/N比大于等于阈值(根据推定的背景杂音来决定),则判定为有声区间,如果比阈值小,则判定为无声区间。专利文献1特开2002-162982号公报非专利文献13GPP TS 26.094 V3.0.0(http//www.3gpp.org/ftp/Specs/html-info/26094.htm)
技术实现思路
但是,在上述现有的有声无声判定装置中,有以下问题。即,上述技术的有声无声判定装置用最大自相关值或自相关值为最大的延迟来判定有声区间或无声区间。因此,对于非周期分量多的信号和多个不同周期分量混杂的输入信号,不能精确地判定有声区间或无声区间。因此,本专利技术要解决上述问题,提供一种有声无声判定装置和有声无声判定,即使对于非周期分量多的信号和多个不同周期分量混合的输入信号,也能精确地判定有声区间或无声区间。为了解决上述课题,本专利技术的有声无声判定装置,其特征在于,包括自相关计算单元,计算输入信号的自相关值;延迟计算单元,计算使上述自相关计算单元计算出的上述自相关值为极大的多个延迟;性质判定单元,基于由上述延迟计算单元计算出的上述多个延迟来判定上述输入信号的性质;以及有声无声判定单元,基于上述性质判定单元的判定结果,判定上述输入信号有声还是无声。为了解决上述课题,本专利技术的有声无声判定方法,其特征在于,包括以下步骤自相关计算步骤,算出输入信号的自相关值;延迟计算步骤,计算使在上述自相关计算步骤中计算出的上述自相关值为极大的多个延迟;性质判定步骤,基于在上述延迟计算步骤中计算出的上述多个延迟来判定上述输入信号的性质;以及有声无声判定步骤,基于上述性质判定步骤中的判定结果,判定上述输入信号有声还是无声。算出输入信号的自相关值为极大的多个延迟,基于这些多个延迟判定输入信号有声或无声,从而能考虑输入信号中包含的多个周期分量并判定有声或无声。在本专利技术的有声无声判定装置中,上述有声无声判定装置的特征在于基于上述性质判定装置的判定结果和上述输入信号判定上述输入信号有声或无声。同样地,在本专利技术的有声无声判定方法中,上述有声无声判定步骤的特征在于基于上述性质判定步骤中的判定结果和上述输入信号判定上述输入信号有声或无声。在性质判定装置或性质判定步骤中,除了判定结果外,还利用输入信号判定有声或无声,从而,能嵌入更细致的判定过程。即,例如,在性质判定装置或性质判定步骤中,判定为杂音的,还可以基于输入信号的历史判定为有声。在本专利技术的有声无声判定装置中,还具有杂音推定单元,根据上述输入信号来推定杂音;其中上述有声无声判定单元基于上述性质判定单元的判定结果、上述输入信号以及上述杂音推定单元推定的杂音来判定上述输入信号有声或无声。除了性质判定装置的判定结果以外,还利用输入信号和杂音信号判定有声或无声,从而,能基于S/N比判定有声无声。在本专利技术的有声无声判定装置中,上述杂音推定装置基于上述有声无声判定装置的判定结果改变杂音的推定方法。通过基于有声无声判定装置的判定结果改变杂音的推定方法,能嵌入更细致的杂音推定过程。即,例如,在有声无声判定装置持续判定为有声时,则通过积极地降低由杂音推定装置推定的杂音电平,相对于杂音,强调信号分量。在本专利技术的有声无声判定装置中,上述延迟计算装置的特征在于,按照自相关值从大到小的顺序算出上述多个延迟。通过按自相关值从大到小的顺序算出上述多个延迟,可以很容易地算出上述多个延迟。在本专利技术的有声无声判定装置中,上述延迟计算装置的特征在于,将延迟观测区间分割为多个区间,计算出在上述多个区间中的每个区间中自相关值为最大的延迟。同样地,在本专利技术的有声无声判定方法中,上述延迟计算步骤的特征在于,将延迟观测区间分割为多个区间,在上述多个区间中的每个区间中算出自相关值为最大的延迟。将延迟观测区间分割为多个区间,算出每个区间内自相关值为最大的延迟,从而,可以不偏向于例如依存于声带固有频率及其整数倍波的延迟,一一算出依存于输入信号中包含的种种周期分量的延迟。在本专利技术的有声无声判定装置中,上述多个区间将上述延迟观测区间的起点作为min_t,用2i-1·min_t~2i·min_t(i是自然数)来表示。通过进行这种区间分割,对于具有周期性的信号,能更有效地检测出与其2倍周期对应的延迟,能精确度更高地进行有声无声判定。本专利技术的算出输入信号的自相关值为极大的多个延迟,基于这些多个延迟判定输入信号是有声还是无声。因此,能考虑输入信号中包含的多个周期分量地判定有声或无声。结果,即使对于非周期分量多的信号和多个不同周期分量混合的输入信号,也能精确地判定有声区间或无声区间。附图说明图1是根据第一实施方式的有声无声判定装置的结构图;图2示出了延迟计算的具体例;图3是根据第一实施方式的有声无声判定装置的操作流程图;图4是根据第二实施方式的有声无声判定装置的结构图;图5是根据第二实施方式的有声无声判定装置的操作流程图;图6是根据第三实施方式的有声无声判定装置的结构图;图7示出了延迟计算的具体例。具体实施例方式第一实施方式参考附图说明根据本专利技术第一实施方式的有声无声判定装置。首先,说明根据本实施方式的有声无声判定装置的结构。图1是根据本实施方式的有声无声判定装置的结构图。根据本实施方式的有声无声判定装置1物理上作为计算机系统来构成,具备CPU(中央处理器)、存储器、鼠标或键盘等输入装置、显示器等显示装置、硬盘等存储装置、通过无线和外部设备进行数据通信的无线通信单元等。在功能上,如图1所示,有声无声判定装置1具有自相关计算部11(自相关计算单元),延迟计算部12(延迟计算单元),杂音判定部13(性质判定单元),有声无声判定部14(有声无声判定单元)。以下,详细说明有声无声判定装置1的各构成要素。自相关计算部11计算输入信号的自相关值。具体地说,有声无声判定装置1根据以下的式(1)算出输入信号x(t)的自相关值c(t)。c(t)=Σn=0N-1x(n)x(n-t)Σn=0N-1x2(n)&Sigm本文档来自技高网...

【技术保护点】
一种有声无声判定装置,其特征在于,包括:自相关计算单元,计算输入信号的自相关值;延迟计算单元,计算使上述自相关计算单元计算出的上述自相关值为极大的多个延迟;性质判定单元,基于由上述延迟计算单元计算出的上述多个延迟来判 定上述输入信号的性质;以及有声无声判定单元,基于上述性质判定单元的判定结果,判定上述输入信号有声还是无声。

【技术特征摘要】
JP 2003-12-25 2003-4309731.一种有声无声判定装置,其特征在于,包括自相关计算单元,计算输入信号的自相关值;延迟计算单元,计算使上述自相关计算单元计算出的上述自相关值为极大的多个延迟;性质判定单元,基于由上述延迟计算单元计算出的上述多个延迟来判定上述输入信号的性质;以及有声无声判定单元,基于上述性质判定单元的判定结果,判定上述输入信号有声还是无声。2.根据权利要求1所述的有声无声判定装置,其特征在于,上述有声无声判定单元基于上述性质判定单元的判定结果和上述输入信号来判定上述输入信号有声还是无声。3.根据权利要求1所述的有声无声判定装置,其特征在于,还具有杂音推定单元,根据上述输入信号来推定杂音;其中上述有声无声判定单元基于上述性质判定单元的判定结果、上述输入信号以及上述杂音推定单元推定的杂音来判定上述输入信号有声或无声。4.根据权利要求3所述的有声无声判定装置,其特...

【专利技术属性】
技术研发人员:仲信彦大矢智之
申请(专利权)人:株式会社NTT都科摩
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1