Speech processing apparatus and speech processing method. The speech processing apparatus includes: a receiving unit for receiving remote signal and near end signal, remote signal includes at least one non speech segment between speech segments multiple speech segments and a plurality of speech segments in the near end signal including noise; detection unit for detecting remote signal in non speech segment length and speech segment length; computing unit for calculating the noise characteristics contained in the proximal end of environmental noise in the signal value; the control unit, used to control the non speech segment length non speech segment length and noise characteristics based on the value of the non speech segment length is equal to or greater than the first threshold value; and an output unit for outputting a signal output. The signal including non speech segment multiple speech segments and control.
【技术实现步骤摘要】
语音处理设备及语音处理方法相关申请的交叉引用本申请基于并且要求于2012年12月12日提交的在先日本专利申请第2012-270916号的优先权,其全部内容通过引用合并于此。
本文讨论的实施方式涉及例如一种配置为对输入信号进行控制的语音处理设备、语音处理方法以及语音处理程序。
技术介绍
一种已知的方法是对给定作为输入信号的语音信号进行控制以使得语音信号易于听到。例如,对于老年人,由于听力等随着衰老下降,语音识别能力可能降低。因此,当讲话者使用便携式通信终端等在双向语音通信中以高语速讲话时,对于老年人来说往往变得难以听到语音。应对上述情况的一个最简单的方式是讲话者“缓慢”并且“清晰”地说话,例如,如以下文献中所公开的:TomonoMiki等人,“DevelopmentofRadioandTelevisionReceiverwithSpeechRateConversionTechnology”,CASE#10-03,InstituteofInnovationResearch,HitotsubashiUniversity,2010年4月。换句话说,讲话者逐字地缓慢说话并且在各字之间和各短语之间有清晰的停顿是有效的。然而,在双向语音通信中,难以要求通常说话快的讲话者有意“缓慢”并且“清晰”地说话。鉴于上述情况,例如,日本专利第4460580号公开了一种检测并扩展所接收到的语音信号的语音段以提高其可听度而且缩短非语音段以减小由语音段的扩展引起的延迟的技术。更具体地,当给定输入信号时,检测所给定的输入信号中的语音段即活动话音段和非语音段即非话音段,并且周期性地重复包含在 ...
【技术保护点】
一种语音处理设备,包括:接收单元,用于接收远端信号以及近端信号,所述远端信号包括多个语音段以及所述多个语音段中的语音段之间的至少一个非语音段,所述近端信号包括环境噪声;检测单元,用于检测所述远端信号中的非语音段长度和语音段长度;计算单元,用于计算包含在所述近端信号中的环境噪声的噪声特征值;控制单元,用于基于所述非语音段长度和所述噪声特征值来控制所述非语音段长度,使得所述非语音段长度等于或大于第一阈值;以及输出单元,用于输出输出信号,所述输出信号包括所述多个语音段和所控制的非语音段。
【技术特征摘要】
2012.12.12 JP 2012-2709161.一种语音处理设备,包括:接收单元,用于接收远端信号以及近端信号,所述远端信号包括多个语音段以及所述多个语音段中的语音段之间的至少一个非语音段,所述近端信号包括环境噪声;检测单元,用于检测所述远端信号中的非语音段长度和语音段长度;计算单元,用于计算包含在所述近端信号中的环境噪声的噪声特征值;控制单元,用于基于所述非语音段长度和所述噪声特征值来控制所述非语音段长度,使得所述非语音段长度等于或大于第一阈值;以及输出单元,用于输出输出信号,所述输出信号包括所述多个语音段和所控制的非语音段。2.根据权利要求1所述的设备,其中,所述控制单元进行控制以使得在所述非语音段长度小于所述第一阈值的情况下,根据所述噪声特征值的大小来扩展所述非语音段长度。3.根据权利要求1所述的设备,其中,所述控制单元进行控制以使得在所述非语音段长度等于或大于所述第一阈值的情况下,根据所述噪声特征值的大小来减小所述非语音段长度。4.根据权利要求2所述的设备,其中,所述控制单元基于通过所述接收单元接收到的所述远端信号的接收量与通过所述输出单元输出的所述输出信号的输出量之差来控制所述非语音段长度的扩展比或减小比。5.根据权利要求1所述的设备,其中,所述控制单元根据所述噪声特征值的大小来扩展所述语音段长度。6.根据权利要求1所述的设备,其中,所述计算单元基于所...
【专利技术属性】
技术研发人员:铃木政直,大谷猛,外川太郎,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:日本,JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。