当前位置: 首页 > 专利查询>索尼公司专利>正文

语音处理装置、方法和程序制造方法及图纸

技术编号:8981125 阅读:155 留言:0更新日期:2013-07-31 23:12
本发明专利技术提供了一种语音处理装置、方法和程序。该语音处理装置包括:特征量计算部分,从输入语音信号的目标帧中提取特征量;声压估计候选点更新部分,使输入语音信号的多个帧的每个成为声压估计候选点,保持每个声压估计候选点的特征量,并且基于声压估计候选点的特征量和目标帧的特征量,来更新声压估计候选点;声压估计部分,基于声压估计候选点的特征量,计算输入语音信号的估计声压;增益计算部分,基于估计声压,计算应用于输入语音信号的增益;以及增益应用部分,基于增益,执行输入语音信号的增益调节。

【技术实现步骤摘要】

本专利技术涉及语音处理装置、方法和程序,并且更具体地,涉及可以更容易得到合适水平的语音的语音处理装置、方法和程序。
技术介绍
在通过使用诸如IC (集成电路)记录器的记录装置来记录对话、音乐演奏等的情况下,重要的是正确地设置记录灵敏度,使得以合适等级的水平记录所采集语音的输入语音信号。例如,在相对大的会议室中进行的会议中记录对话的情况下,如果记录装置的记录灵敏度被设置得低,则将存在以下情况:语音将被以低水平记录,以致于远处发言者的谈话将很难能够被听到。另一方面,在麦克风靠近某人的嘴部并且他们的口述被保留作为备忘录的情况下,如果记录装置的记录灵敏度被设置得高,则将输入超过可以被记录的上限水平的信号。在这种情况下,将在被记录的语音中出现声音的失真,并且这种失真将变成刺耳的噪声。这样,为了避免以不合适的水平记录语音,通常,记录装置中设置的记录灵敏度被粗略分成3级水平,并且使用自动地将信号水平保持在恒定水平的信号处理技术。这种信号处理技术被称为ALC (自动水平控制)和AGC (自动增益控制)。例如,如图1中所示,记录装置中的记录灵敏度被分成高、中和低三级,并且针对这各个记录灵敏度,将+3本文档来自技高网...

【技术保护点】
一种语音处理装置,包括:特征量计算部分,从输入语音信号的目标帧中提取特征量;声压估计候选点更新部分,使输入语音信号的多个帧的每个成为声压估计候选点,保持每个声压估计候选点的特征量,并且基于声压估计候选点的特征量和目标帧的特征量,来更新声压估计候选点;声压估计部分,基于声压估计候选点的特征量,计算输入语音信号的估计声压;增益计算部分,基于估计声压,计算应用于输入语音信号的增益;以及增益应用部分,基于增益,执行输入语音信号的增益调节。

【技术特征摘要】
2012.01.25 JP 2012-0128641.一种语音处理装置,包括: 特征量计算部分,从输入语音信号的目标帧中提取特征量; 声压估计候选点更新部分,使输入语音信号的多个帧的每个成为声压估计候选点,保持每个声压估计候选点的特征量,并且基于声压估计候选点的特征量和目标帧的特征量,来更新声压估计候选点; 声压估计部分,基于声压估计候选点的特征量,计算输入语音信号的估计声压; 增益计算部分,基于估计声压,计算应用于输入语音信号的增益;以及 增益应用部分,基于增益,执行输入语音信号的增益调节。2.根据权利要求1所述的语音处理装置, 其中,特征量计算部分计算至少目标帧中的输入语音信号的声压水平作为特征量,并且 其中,当目标帧的声压水平大于作为声压估计候选点的特征量的声压水平的最小值时,声压估计候选点更新部分丢弃具有最小值的声压估计候选点并且使目标帧成为新的声压估计候选点。3.根据权利要求2所述的语音处理装置, 其中,特征量计算部分计算表示至少目标帧中出现突发噪声的可能性的突发噪声信息作为特征量,并且 其中,当基于突发 噪声信息目标帧是包括突发噪声的部分时,声压估计候选点更新部分不使目标帧成为声压估计候选点。4.根据权利要求2所述的语音处理装置, 其中,当相邻声压估计候选点之间的帧间隔的最短帧间隔小于预定阈值时,声压估计候选点更新部分丢弃具有最短帧间隔的相邻声压估计候选点中的具有小声压水平的声压估计候选点,并且使目标帧成为新的声压估计候选点。5.根据权利要求4所述的语音处理装置, 其中,以使预定阈值随着时间的过去而增大的方式,确定预定阈值。6.根据权利要求2所述的语音处理装置, 其中,特征量计算部分计算至少从声压估计候选点直至目标帧的过去的帧的数量作为特征量,并且 其...

【专利技术属性】
技术研发人员:本间弘幸知念彻
申请(专利权)人:索尼公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1