面向多乘员座区的车载无麦KTV分区拾音与混音方法技术

技术编号：46567537 阅读：1 留言：0更新日期：2025-10-10 21:16

本发明专利技术涉及语音数据处理技术领域，更进一步地，涉及面向多乘员座区的车载无麦KTV分区拾音与混音方法，该方法包括如下步骤：步骤1：控制触发麦克风阵列进入分区拾音模式，同时将分区拾音流与伴奏信号按上行通路发送至音频通路管理器；步骤2：在音频通路管理器接收分区拾音流与伴奏信号后，执行座区多重影分离与共振门控流程，以伴奏相位锚定将各座区重建结果与节拍骨架对齐，得到座区对齐干声流，将每一座区的座区对齐干声流与伴奏信号进行空间混响与人声优化后，得到处理后的音频信号。本发明专利技术解决了现有无麦KTV在多声源情况下分区不清、音质失真和同步困难等问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于语音数据处理，具体涉及面向多乘员座区的车载无麦ktv分区拾音与混音方法。

技术介绍

1、随着智能网联汽车的发展，车内娱乐系统逐渐成为汽车重要的增值功能之一。传统的车载娱乐多以收音机、光盘播放和蓝牙音乐播放为主，而近年来，伴随移动互联网与智能语音技术的普及，车内用户对多样化娱乐方式的需求日益提升。在此背景下，车载ktv功能逐渐进入产业视野，成为车企和音频技术厂商的重要探索方向。现有的车载ktv大多依赖麦克风拾音与音响系统播放，用户通过无线麦克风或有线麦克风进行歌唱，再由系统进行混响和伴奏合成，形成近似于ktv环境的体验。

2、然而，这类基于物理麦克风的传统方案在实际使用中存在诸多局限。首先，麦克风设备需要用户手持或安装，存在使用不便、车内空间占用和额外硬件成本等问题；其次，麦克风在车内空间受限的环境下极易引入回声和啸叫，特别是在音响与麦克风距离较近时，回声消除难度显著增加，导致歌唱体验下降；再次，多乘员场景下若仅提供一支或两支麦克风，将使得乘客间的互动性不足，无法满足多座区同时合唱、分角色演唱或多人互动的需求。</p>

3、为解本文档来自技高网...

【技术保护点】

1.面向多乘员座区的车载无麦KTV分区拾音与混音方法，其特征在于，该方法包括如下步骤：

2.如权利要求1所述的面向多乘员座区的车载无麦KTV分区拾音与混音方法，其特征在于，步骤1中接收用于触发分区拾音模式的控制指令后，加载麦克风阵列的几何参数与座区指向参数集，设置采样率为48000赫兹、量化位深为24位、帧长为20毫秒、帧移为10毫秒，并以麦克风阵列主时钟为基准建立统一时标；采用采样率微调重采样方式将伴奏信号与麦克风阵列采集信号的采样频率偏差控制在±50百万分之一以内，使二者在统一时标下可比对；为降低总体时延，设置分区拾音模式的上行通路目标端到端延时预算不

【技术特征摘要】

1.面向多乘员座区的车载无麦ktv分区拾音与混音方法，其特征在于，该方法包括如下步骤：

2.如权利要求1所述的面向多乘员座区的车载无麦ktv分区拾音与混音方法，其特征在于，步骤1中接收用于触发分区拾音模式的控制指令后，加载麦克风阵列的几何参数与座区指向参数集，设置采样率为48000赫兹、量化位深为24位、帧长为20毫秒、帧移为10毫秒，并以麦克风阵列主时钟为基准建立统一时标；采用采样率微调重采样方式将伴奏信号与麦克风阵列采集信号的采样频率偏差控制在±50百万分之一以内，使二者在统一时标下可比对；为降低总体时延，设置分区拾音模式的上行通路目标端到端延时预算不超过80毫秒。

3.如权利要求2所述的面向多乘员座区的车载无麦ktv分区拾音与混音方法，其特征在于，通过如下过程构建座区参考坐标与确定车内固定声路：以车辆几何中心为原点，前向为x轴正向，左侧为y轴正向，上方为z轴正向，构建座区参考坐标；以每个座区头枕中心为基准，沿x轴前移70毫米、沿z轴下移120毫米、y轴坐标位于座位中心线，得到口部参考点坐标；将驾驶位、前排乘客位、后排左位、后排中位、后排右位依次标识为座区一至座区五；记录麦克风阵列中每一个阵列拾音单元的三维坐标；将从每一座区的口部参考点至每一个阵列拾音单元的直接传播路径以及在反射面上产生的反射路径定义为车内固定声路。

4.如权利要求3所述的面向多乘员座区的车载无麦ktv分区拾音与混音方法，其特征在于，步骤2中，读取座区参考坐标、各座区口部参考点坐标、各阵列拾音单元三维坐标与空间指向方向，确定前挡风玻璃、后挡风玻璃、左侧窗、右侧窗、仪表板、车门内饰板、车顶内衬和地板为反射面，确定座椅靠背、头枕、仪表台主体、中控通道和后备箱隔断为不可穿越体；对每一座区与每一阵列拾音单元枚举直接传播路径、一次反射路径与二次反射路径，沿路径按10毫米间隔采样，若任一采样点落入不可穿越体外包围边界内则剔除该路径；对保留路径按几何长度由短至长赋予到达先后索引并记录路径类型与反射面序列，同时以声速343米每秒与采样率48000赫兹换算对齐延时并四舍五入为整数采样点。

5.如权利要求4所述的面向多乘员座区的车载无麦ktv分区拾音与混音方法，其特征在于，步骤2中，依据车内固定声路生成座区声场拓扑图的过程包括：对保留路径执行座区穿越检测，非本座区外包围边界采用各向扩展50毫米，若发生至少1次穿越则标记泄露风险等级为高；计算路径对非本座区口部参考点的最小距离，若小于等于0.25米标记为高，若位于0.25米至0.40米标记为中；计算路径入射方向与阵列拾音单元空间指向方向夹角，非本座区路径若小于等于25度标记泄露风险等级为高，若位于25度至50度标记泄露风险等级为中；二次反射路径额外标记泄露风险等级为中；以口部参考点与阵列拾音单元为节点，以保留路径为边，附加到达先后索引、路径类型、反射面序列、延时采样点与泄露风险等级的属性；在每一座区子图内分层组织，先按到达先后索引排序，再按路径类型排序为直接传播优先于一次反射、一次反射优先于二次反射，同类型内按泄露风险等级由低至高排序，得到座区声场拓扑图。

6.如权利要求5所述的面向多乘员...

【专利技术属性】
技术研发人员：李楠，
申请(专利权)人：上海大音信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人