一种面向智能车机抗副驾干扰的语音识别方法技术

技术编号：39185443 阅读：41 留言：0更新日期：2023-10-27 08:33

本发明专利技术涉及一种面向智能车机抗副驾干扰的语音识别方法，包括以下步骤：步骤一、将N个麦克风传感器以固定间距d沿水平方向均匀排列在车机中央底部或顶部，N为大于等于2的整数，以此构成多通道语音采集设备；步骤二、将采集到的多通道音频数据经傅里叶变换后逐帧输入训练好的二分类DOA模型，输出结果为“1”或“0”。该面向智能车机抗副驾干扰的语音识别方法，根据主副驾相对车机的大致方位固定，但主驾的精确导向矢量很难获得的实际情况，通过二分类模型分别获得主副驾MASK进而计算出主驾的精确导向矢量，解决基于MASK的波束形成方法很难区分两个人声的问题，从而改善在智能车机这种特定场景下的语音交互问题。定场景下的语音交互问题。定场景下的语音交互问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向智能车机抗副驾干扰的语音识别方法

[0001]本专利技术涉及智能车机
，具体为一种面向智能车机抗副驾干扰的语音识别方法。

技术介绍

[0002]近年来，随着人工智能技术的飞速发展，相关的应用场景也在不断被丰富，其中，新能源汽车的普及，促使汽车行业加速变革，自动驾驶、语音控制等全新体验使得人工智能技术的落地有了完美的载体，语音识别作为智能交互入口，使得驾驶员可以通过语音指令直接操控车机，不仅提升了驾驶体验同时也保障了驾驶安全，当下，消费者为体验智能化和便捷性而选购高端智能电动汽车已成为趋势。
[0003]随着短视频、直播等互动行业兴起，越来越多的类人声干扰使得智能车机无法判断是否主驾司机在下达指令，小则影响驾驶体验，大则影响安全驾驶，除此以外，对主驾司机进行声纹注册也可以解决上述问题，但是声纹模型普遍复杂，注册繁琐，主副驾人同性别时很难准确区分，如何简单有效的对抗副驾干扰仍然是需要解决的问题。

技术实现思路

[0004]针对现有技术的不足，本专利技术提供了一种面向智能车机抗副驾干扰的语音识别方法，具备提升主驾指令识别的准确度和改善在智能车机这种特定场景下的语音交互问题等优点，解决了类人声干扰使得智能车机无法判断是否主驾司机在下达指令，小则影响驾驶体验，大则影响安全驾驶的问题。
[0005]为实现上述目的，本专利技术提供如下技术方案：一种面向智能车机抗副驾干扰的语音识别方法，包括以下步骤：
[0006]步骤一、将N个麦克风传感器以固定间距d沿水平方向均匀排列在车机中央

【技术保护点】

【技术特征摘要】
1.一种面向智能车机抗副驾干扰的语音识别方法，其特征在于：包括以下步骤：步骤一、将N个麦克风传感器以固定间距d沿水平方向均匀排列在车机中央底部或顶部，N为大于等于2的整数，以此构成多通道语音采集设备；步骤二、将采集到的多通道音频数据经傅里叶变换后逐帧输入训练好的二分类DOA模型，输出结果为“1”或“0”；步骤三、当输出结果为“0”时，获得副驾MASK并实时更新来自副驾的信号协方差矩阵，当输出结果为“1”时，获得主驾MASK，通过输入信号协方差矩阵减去副驾信号协方差矩阵，估计出主驾信号协方差矩阵；步骤四、将步骤三中所述主驾信号协方差矩阵进行特征值分解，选择主特征值作为主驾导向矢量的估计；步骤五、通过估计的主驾导向矢量与当前更新的副驾信号协方差矩阵来计算波束形成滤波器权重；步骤六、完成波束形成后，将改善了副驾干扰后的语音用于智能车机语音识别模块来处理主驾相应指令。2.根据权利要求1所述的一种面向智能车机抗副驾干扰的语音识别方法，其特征在于：所述步骤二中二分类DOA模型模块包括判断当前是否有语音，当判断有语音输入时，给出主驾(“1”)或副驾(“0”)的分类结果。3.根据权利要求2所述的一种面向智能车机抗副驾干扰的语音识别方法，其特征在于：所述二分类DOA模型基于输入的多通道...

【专利技术属性】
技术研发人员：明杨，赵亚丽，缪炜，
申请(专利权)人：上海互问信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人