声音信号处理方法及声音信号处理装置制造方法及图纸

技术编号:33079980 阅读:20 留言:0更新日期:2022-04-15 10:30
本发明专利技术提供一种无论是远处的说话者的语音还是近处的说话者的语音都能够以适当的电平取得的声音信号处理方法及声音信号处理装置。声音信号处理方法将与说话者的语音相关的声音信号输入,取得说话者图像,根据所述说话者图像而对所述说话者的位置信息进行推定,与推定的所述位置信息相对应地生成用于对所述语音的衰减进行补偿的校正滤波器,对所述声音信号实施所述校正滤波器涉及的滤波处理,将实施了所述滤波处理后的声音信号输出。施了所述滤波处理后的声音信号输出。施了所述滤波处理后的声音信号输出。

【技术实现步骤摘要】
声音信号处理方法及声音信号处理装置


[0001]本专利技术的一个实施方式涉及一种基于音源的位置而对由传声器取得的声音信号进行处理的声音信号处理方法及声音信号处理装置。

技术介绍

[0002]在专利文献1公开了如下声音处理系统,即,根据由照相机拍摄到的影像而对说话者的位置信息进行检测,基于检测到的位置信息,进行将说话者的语音增强的处理。
[0003]专利文献1:日本特开2012-29209号公报
[0004]专利文献1的声音处理系统没有考虑远处的说话者的语音的衰减,因此,专利文献1的声音处理系统无法以适当的电平取得远处的说话者的语音。

技术实现思路

[0005]因此,本专利技术的一个实施方式的目的在于,提供一种无论是远处的说话者的语音还是近处的说话者的语音都能够以适当的电平取得的声音信号处理方法及声音信号处理装置。
[0006]声音信号处理方法将与说话者的语音相关的声音信号输入,取得说话者图像,根据所述说话者图像而对所述说话者的位置信息进行推定,与推定的所述位置信息相对应地生成用于对所述语音的衰减进行补偿的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种声音信号处理方法,将与说话者的语音相关的声音信号输入,取得说话者图像,根据所述说话者图像而对所述说话者的位置信息进行推定,与推定的所述位置信息相对应地生成用于对所述语音的衰减进行补偿的校正滤波器,对所述声音信号实施所述校正滤波器涉及的滤波处理,将实施了所述滤波处理后的声音信号输出。2.根据权利要求1所述的声音信号处理方法,其中,所述位置信息包含与所述说话者的距离,所述校正滤波器包含对与所述距离相对应地衰减的电平进行补偿的处理。3.根据权利要求1或2所述的声音信号处理方法,其中,所述校正滤波器包含增益校正。4.根据权利要求1至3中任一项所述的声音信号处理方法,其中,取得余响特性,与取得的所述余响特性相对应地生成所述校正滤波器。5.根据权利要求1至4中任一项所述的声音信号处理方法,其中,所述校正滤波器包含波束成形,所述声音信号处理方法取得余响特性,与取得的所述余响特性相对应地对所述波束成形的指向性进行变更。6.根据权利要求1至5中任一项所述的声音信号处理方法,其中,进行所述说话者图像的分帧处理,将所述分帧处理的结果反映至所述校正滤波器。7.根据权利要求1至6中任一项所述的声音信号处理方法,其中,对特定对象进行识别,生成与所述特定对象的识别结果相对应的所述校正滤波器。8.根据权利要求1至7中任一项所述的声音信号处理方法,其中,所述位置信息包含与所述说话者的距离,所述校正滤波器包含有在所述距离为规定值以上的情况下将对应的说话者的语音切断的处理。9.根据权利要求1至8中任一项所述的声音信号处理方法,其中,根据所述说话者图像而对所述说话者的姿态信息进行推定,基于所述姿态信息而生成所述校正滤波器,所述位置信息的推定速度快于所述姿态信息的推定速度,所述校正滤波器是在推定出所述位置信息时及推定出所述姿态信息时的各自的定时生成的。10.一种声音信号处理装置,其具有:声音信号输入部,其将与说话者的语音相关的声音信号输入;图像取得部,其取得说话者图像;位置推定部,其根据所述说话者图像...

【专利技术属性】
技术研发人员:鹈饲训史田中良
申请(专利权)人:雅马哈株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1