语音信号处理方法、装置及车机系统制造方法及图纸

技术编号：39055311 阅读：15 留言：0更新日期：2023-10-12 19:48

本发明专利技术公开一种语音信号处理方法，应用于车机系统，其包括：获取车机系统所处的车载模式，并根据车机系统所处的车载模式通过前端信号处理引擎获取目标语音信号，其中，目标语音信号包括用于语音识别的第一目标语音信号和用于语音活动检测的第二目标语音信号；对第二目标语音信号进行语音活动检测，同时将第一目标语音信号缓存；根据对第二目标语音信号的语音活动检测结果和缓存的第一目标语音信号，确定出用于语音识别的最终语音信号输出。本发明专利技术实施例的方法通过基于车载模式的目标语音信号筛选和基于vad引擎的语音信号处理，实现了对非目标音区的音频信号的双重抑制，提高了对非目标音区的音频的抑制效果和语音唤醒识别的准确率。的准确率。的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
语音信号处理方法、装置及车机系统

[0001]本专利技术涉及智能语音
，尤其涉及一种语音信号处理方法、语音信号处理装置及包含其的车机系统、电子设备和存储介质。

技术介绍

[0002]为了提升智能座舱的人机交互体验，保障汽车驾驶的安全性，目前的车机系统均是通过双音区定向拾音的方式来获取用户语音指令的。双音区定向拾音的方式主要是通过将座舱分为左侧和右侧，即主驾和副驾，两个区域，并通过在两个区域分别设置的麦克风进行定向拾音，由此以实现对特定方向的声音及音频的锁定和对其他区域的声音的抑制，提升语音识别和唤醒的成功率。示例性地，在这种双音区定向拾音的方式下，如果通过主驾所在区域的麦克风拾取到“打开车窗”的语音指令，就会响应该语音指令将主驾的车窗打开，而如果通过副驾所在区域的麦克风拾取到“打开车窗”的语音指令，则会响应该语音指令将副驾的车窗打开。但这种双音区定向拾音的方式由于仅将座舱分为左右侧，因而对于主驾后排声音和副驾后排声音是无法进行准确区分的，这样就容易导致语音指令的误识别，影响用户体验和驾驶安全。此外，这种双音区定向拾音的方式，过于依赖信号处理算法的鲁棒性，当信号处理算法对于非目标音区抑制过多时，对目标音区的人声同样会有一定程度的抑制效果，无法达到有效平衡。目前通常的方案都是通过算法调参重训算法资源，来尽可能实现对非目标音区和目标音区的抑制效果的平衡。但是算法调整周期很长，并且无法有效解决声音残留过多的问题，如异侧(即非目标音区)声音过大导致的声音残留通常会对指令下达侧(即目标音区)的声音造成干扰，引起误识别，从而...

【技术保护点】

【技术特征摘要】
1.语音信号处理方法，应用于车机系统，其特征在于，包括：获取所述车机系统所处的车载模式，并根据车机系统所处的车载模式通过前端信号处理引擎获取目标语音信号，其中，所述目标语音信号包括用于语音识别的第一目标语音信号和用于语音活动检测的第二目标语音信号；根据第二目标语音信号进行语音活动检测，同时将第一目标语音信号缓存；根据对第二目标语音信号的语音活动检测结果和缓存的第一目标语音信号，确定出用于语音识别的最终语音信号输出。2.根据权利要求1所述的方法，其特征在于，所述车载模式包括定位模式，其中，在车载模式为定位模式时，通过前端信号处理引擎获取目标语音信号包括：根据唤醒定位信息，在唤醒定位信息为主驾时，通过前端信号处理引擎获取第一主驾识别音频作为第一目标语音信号，并获取主驾vad检测音频作为第二目标语音信号；在唤醒定位信息为副驾时，通过前端信号处理引擎获取第一副驾识别音频作为第一目标语音信号，并获取副驾vad检测音频作为第二目标语音信号。3.根据权利要求2所述的方法，其特征在于，所述车载模式还包括全车模式，在车载模式为全车模式时，通过前端信号处理引擎获取目标语音信号包括：通过前端信号处理引擎获取第二主驾识别音频和第二副驾识别音频，并对第二主驾识别音频和第二副驾识别音频进行合并，得到合并音频信号；将合并音频信号作为第一目标语音信号，同时复制所述合并音频信号以形成第二目标语音信号。4.根据权利要求2所述的方法，其特征在于，所述车载模式还包括主驾模式，在车载模式为主驾模式时，通过前端信号处理引擎获取目标语音信号包括：通过前端信号处理引擎获取第一主驾识别音频作为第一目标语音信号，并获取主驾vad检测音频作为第二目标语音信号。5.根据权利要求1所述的方法，其特征在于，所述根据对第二目标语音信号的语音活动检测结果和缓存的第一目标语音信号，确定出用于语音识别的最终语音信号输出，包括：在语音活动检测结果为第二目标语音信号触发了VAD.BEGIN时，从缓存中获取与...

【专利技术属性】
技术研发人员：吴化，邓建凯，邵雅婷，
申请(专利权)人：思必驰科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人