声音信号处理设备、声音信号处理方法和程序技术

技术编号：7611693 阅读：179 留言：0更新日期：2012-07-25 23:19

本发明专利技术公开了声音信号处理设备、声音信号处理方法和程序。该声音信号处理设备包括方向估计单元和方向跟踪单元，该方向估计单元针对以预定时间单位划分的每个块检测指示声音信号的声源方向的一个或多个方向点，该方向跟踪单元将多个块之间彼此连接方向点并且检测其中声音活动的片段。方向估计单元包括：生成死角形成滤波器和指向性束形成滤波器的空间滤波器生成单元、生成作为方向和增益之间的对应关系数据的死角形成模式的死角形成模式生成单元、生成作为方向和增益之间的对应关系数据的指向性束形成模式的指向性束形成模式生成单元、以及检测指示声音方向并包含死角形成模式中的局部最小部和指向性束形成模式中的局部最大部的方向点的方向点检测单元。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及声音信号处理设备、声音信号处理方法和程序，更具体而言，涉及能够执行伴随有声源方向估计的语音片段(speech section)检测处理的声音信号处理设备、声音信号处理方法和程序。
技术介绍
下文中，作为根据现有技术的技术，将首先整体上对语音片段检测进行说明，随后对利用声源方向估计来处理语音片段检测的方法进行说明。语音片段检测(SD :语音检测)指在经由包括在例如声音信号处理设备中的麦克风输入的声音信号中切割出其中人说话的片段的处理。语音片段检测(SD)也被称为 VAD (话音活动性检测)。在说明书中，从声音信号中切割出人的说话片段的处理将被称为“语音片段检测” 或者简称为“片段检测”。另外，“片段”并不限于语音的片段，而是可以表示其中给定的声源持续活动(持续生成声音)的片段。语音片段检测有时与语音识别、声源提取等一起使用。然而，在任何一种情况下，在片段检测中都需要高精度。例如，由于在许多声音识别装置中执行诸如对通过片段检测切割出的片段的匹配之类的处理，因此片段检测的精度对语音识别的精度有很大的影响。即，当在实际说话的片段和通过片段检测器检测出的片段之间存在差异时，该差异可能导致错误的识别。另一方面，在声源提取中，有时使用片段检测。例如，当期望从话音和噪声彼此混合的信号中提取出清楚的话音时，或者当期望在两个或更多个人同时说话的环境中提取出一个人的话音时，有必要根据提取声源的方法将输入信号划分为其中仅噪声被生成的片段和其中话音和噪声两者都被生成的片段。因此，为了将输入信号划分为这些片段，使用了片段检测。通过在仅有目标话音单独存在时提取声源，片...

【技术保护点】

【技术特征摘要】
...

【专利技术属性】
技术研发人员：广江厚夫，
申请(专利权)人：索尼公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人