语音界面和声乐娱乐系统技术方案

技术编号:18446936 阅读:18 留言:0更新日期:2018-07-14 11:12
一种系统和方法,其通过捕获包含回声的一个或多个麦克风信号并通过合成器将一个或多个麦克风信号分解成多个信号路径来增强口头言语并提供娱乐,该合成器对捕获的一个或多个麦克风信号中的一些添加或进行非线性修改。该系统和方法并估计来自一个或多个麦克风中的每一个的多个回声路径。该系统和方法通过从捕获的一个或多个麦克风信号中减去多个回声路径中的每一个的回声贡献来响应于估计的多个回声路径来处理捕获的麦克风信号。该系统和方法还提供信号分离和后处理功能,以呈现语音识别游戏应用。

【技术实现步骤摘要】
语音界面和声乐娱乐系统优先权声明本申请要求于2017年1月4日提交的标题为“VoiceInterfaceandVocalEntertainmentSystem”的美国临时专利申请No.62/442,284的优先权,该申请以引用方式并入本文中。
本公开涉及处理音频信号,并且具体涉及语音界面和声乐娱乐系统。
技术介绍
为了增加安全性,驾驶员必须保持清醒和警觉。被动娱乐会使驾驶员保持舒适,但也会导致疲劳和无聊,这可能导致注意力不集中。诸如歌唱和互动音频游戏的主动娱乐会使驾驶员在驾驶时保持清醒、娱乐性、并更能参与。附图说明参考以下附图和描述可以更好地理解本专利技术。附图中的部件不一定按比例绘制,而是着重于说明本专利技术的原理。此外,在附图中,在不同视图中,相同的附图标记表示相应的部分。图1是车辆内的音频路径的俯视图。图2是包括语音加强通信系统的车辆的俯视示意图。图3是执行合成去相关的车内娱乐通信系统的侧视示意图。图4是执行合成去相关的第二车内娱乐通信系统的方框图。图5是执行合成去相关的车内娱乐通信过程。图6是执行合成去相关的第三车内娱乐通信系统的方框图。图7是执行多区域消除的车内娱乐通信系统的侧视示意图。图8是执行多区域消除的第二车内娱乐通信系统的方框图。图9是执行多区域消除的车内娱乐通信过程。图10是执行多区域消除的第三车内娱乐通信系统的方框图。图11是执行合成去相关的第三车内娱乐通信系统的方框图。具体实施方式现代车辆使用全部同时运行的多个声学和音频信号处理系统。这些技术大部分都是针对减少车辆车厢内噪音或适应噪音条件。声学系统通过捕获讲话者的声音,放大(加强)声音,然后在收听者附近的前部扬声器或后部扬声器(例如,前部换能器或后部换能器)中播放,来适应噪音条件。由于大多数驾驶员和乘客都不想被束缚在车辆上,所以许多车辆使用远场麦克风来捕获声音并将该声音转变成电信号。当远场麦克风有效地记录感兴趣的讲话者的言语时,他们还捕获不期望的声音,诸如噪音、来自其他车内讲话者的语音以及由车辆扬声器产生的其它音频声音(诸如音乐、韵律、提示等)。车辆车厢的小尺寸以及驾驶员和乘客与远场麦克风的物理接近还导致声学耦合。扬声器与麦克风之间的反馈和回声路径会导致振鸣和不受控制的声学反馈。如图1中所示,存在来自很多来源的噪音。图1的声学处理系统允许即使在嘈杂的条件下也可以在车辆后方听到驾驶员的语音。当发生这种情况时,声音可以通过直接路径和加强路径以不同的等待时间或延迟流动以使收听者同时感知到声音。由于伴随车内环境的反馈和回声,在音频处理器上执行回声和反馈消除,然后进行放大。这里,自适应滤波器建模由音频处理器执行的扬声器到麦克风的脉冲响应,以消除回声和反馈。当在麦克风处接收到的信号是去相关的或统计独立且不同时,可能发生反馈消除和回声消除。在图2中,音频处理系统是车辆200的一部分,并提供娱乐以及回声和反馈消除。在其它系统中,它是机动车辆的附件或部件,并且在其它系统中是可以被划分成多个区域的房间中使用的音频系统的一部分。在图2的车辆200中,驾驶员和一个或多个副驾驶员(未示出)的麦克风信号被麦克风202A和202B捕获,然后通过扬声器204C和204D在车辆200的后部区域206B中处理和播放。这些扬声器被提供有前到后加强信号208C和208D。同样,如果在车辆200中后排乘客正在交流,一个或多个后部麦克风信号可以被麦克风202C和202D捕获,并且随后通过扬声器204A和204B被处理并转换成车辆200的前部区域206A中的可听见的声音。这些扬声器被提供有前到后加强信号208A和208B。在图2中,为了后部区域206B中的乘客的利益,加强了驾驶员和副驾驶员(未示出)的语音。这被称为前到后加强。而且,如果后排乘客在场,则为了前部区域206A中的驾驶员(在此示为Shree,closetlounge歌手)的利益,将加强后排乘客的语音。这被称为后到前加强。在前到后和后到前加强中,如果声音反射不受限制,则当麦克风接收到加强信号时,声音反射将被进一步处理。在前到后处理中,例如,当加强信号208C和/或208D从后部扬声器204C和/或204D中播放出来并且被前区麦克风202A和/或202B获取时,处理回声。如果信号不受限制,则回声将通过扬声器204C和/或204D被重新处理和呈现。在这种情况下,回声自身反馈,并且如果不被检查,则会导致振铃或振鸣。图3是以前到后加强操作的声学处理系统的另一示意图,其可以进一步扩展到区域到区域加强,其中所述区域包括左前(或驾驶员区域或区域1),右前(副驾驶员区域或区域2),左后(驾驶员后方的乘客区域或区域3)和右后(副驾驶员后面的乘客区域或区域4)。图3的声学处理系统包括前部/驾驶员麦克风302、两个前门扬声器304A和304B以及两个后部扬声器306A和306B。车辆200内的声学处理系统还包括将数字数据转变成模拟信号的数模转换器或DAC308、将连续变化的模拟信号转换成数字数据的模数转换器或ADC310、可以是重塑声音的实时合成器的一个或多个合成器312、回声和反馈消除模块314、后处理器316和信号加法器电路320L和320R。在双向操作中,在后部区域206B中使用一个或多个后部麦克风(未示出),其允许系统在存在后排乘客的情况下使用以前到后加强来加强驾驶员语音的过程在前部扬声器204A和204B上处理和呈现后排乘客的加强信号。在其它替代配置中,娱乐信号和加强信号可以由附加扬声器(例如,高音扩音器或低音扩音器)来呈现。并且,在其它替代系统中,被示出为双声道源的立体声信息娱乐源318可以包括一个或多个声道。例如,车辆内的一些系统处理六个声道,诸如杜比5.1环绕声中使用的六个声道。在图3的声学处理系统中,系统建模从J个扬声器到M个麦克风的信号路径。系统通过从扬声器j到麦克风m的脉冲响应来估计路径,其为h_j,m[n]。脉冲响应由声学处理器执行的反馈和回声消除模块进行估计。这里,“n”是样本索引。在反馈和回声消除模块中,存在J*M个回声路径,因此在图3的示例车辆200中,前到后加强中存在四个期望的信号路径,从左前(FL-驾驶员)扬声器开始到前部麦克风(h_1[n]),从右前(FR-副驾驶员)扬声器到前部麦克风(h_2[n]),从左后(RL-驾驶员后方的乘客)扬声器到前部麦克风(h_3[n]),以及从右后(RR-副驾驶员后方的乘客)扬声器到前部麦克风(h_4[n])。在这种由单一声道传送加强信号并且信息娱乐包括立体声音乐的前到后加强中,四个扬声器信号x_1[n],...,x_4[n]可以表示为:x_1[n]=FL=左音乐x_2[n]=FR=右音乐x_3[n]=RL=左音乐+加强信号x_4[n]=RR=右音乐+加强信号并且前部麦克风处的回声可以表示为:E[n]=x_1[n]*h_1[n]+x_2[n]*h_2[n]+x_3[n]*h_3[n]+x_4[n]*h_4[n]其中‘*’表示时域中的卷积。在图3中,回声和反馈消除估计脉冲响应路径{h_j[n];j=1,...,J}给定参考信道{x_j[n]];j=1,...,J}和麦克风信号Y[n],然后从麦克风信号Y[n]中减去回声E[n]。在图3中,诸如实时声音合成器的合成本文档来自技高网...

【技术保护点】
1.一种消除车辆中的多区域干扰的方法,包括:捕获包含与期望的讲话者相关联的信号的一个或多个复合麦克风信号;捕获包含与一个或多个不期望的讲话者相关联的信号的一个或多个不期望的麦克风信号;通过将一个或多个自适应滤波器与所述一个或多个不期望的讲话者中的每一个相关联并且将所述一个或多个自适应滤波器中的每一个与由所述不期望的讲话者中的一个发出的所述一个或多个不期望的麦克风信号中的每一个进行卷积来分解所述不期望的麦克风信号,以针对所述一个或多个不期望的讲话者中的每一个呈现分开的模型;基于所述分解来估计所述一个或多个不期望的讲话者中的每一个的所述一个或多个不期望的麦克风信号;以及通过从所述复合麦克风信号中减去所述一个或多个不期望的讲话者中的每一个的所述一个或多个不期望的麦克风信号的所述估计来响应于所述估计的一个或多个不期望的麦克风信号处理所述一个或多个复合麦克风信号,以呈现期望的讲话者信号。

【技术特征摘要】
2017.01.04 US 62/442,2841.一种消除车辆中的多区域干扰的方法,包括:捕获包含与期望的讲话者相关联的信号的一个或多个复合麦克风信号;捕获包含与一个或多个不期望的讲话者相关联的信号的一个或多个不期望的麦克风信号;通过将一个或多个自适应滤波器与所述一个或多个不期望的讲话者中的每一个相关联并且将所述一个或多个自适应滤波器中的每一个与由所述不期望的讲话者中的一个发出的所述一个或多个不期望的麦克风信号中的每一个进行卷积来分解所述不期望的麦克风信号,以针对所述一个或多个不期望的讲话者中的每一个呈现分开的模型;基于所述分解来估计所述一个或多个不期望的讲话者中的每一个的所述一个或多个不期望的麦克风信号;以及通过从所述复合麦克风信号中减去所述一个或多个不期望的讲话者中的每一个的所述一个或多个不期望的麦克风信号的所述估计来响应于所述估计的一个或多个不期望的麦克风信号处理所述一个或多个复合麦克风信号,以呈现期望的讲话者信号。2.根据权利要求1所述的方法,其中所述不期望的麦克风信号包括语音。3.根据权利要求1所述的方法,其中所述期望的讲话者信号进一步由馈送娱乐后处理器的自动语音识别引擎处理。4.根据权利要求1所述的方法,其中所述期望的讲话者信号通过检测所述麦克风信号的强度大于所述不期望的麦克风信号的电平之上的预定阈值来识别。5.根据权利要求1所述的方法,其中所述一个或多个不期望的麦克风信号包括所述期望的讲话者信号的延迟部分。6.根据权利要求1所述的方法,其中所述一个或多个不期望的麦克风信号包括所述期望的讲话者信号的衰减部分。7.根据权利要求1所述的方法,其中所述期望的讲话者信号包括通过测量相干性来识别的多个信号。8.一种用机器可执行指令编码的非暂时性机器可读介质,其中所述机器可执行指令的执行用于:捕获包含与期望的讲话者相关联的信号的一个或多个复合麦克风信号;捕获包含与一个或多个不期望的讲话者相关联的信号的一个或多个不期望的麦克风信号;通过将一个或多个自适应滤波器与所述一个或多个不期望的讲话者中的每一个相关联并且将所述一个或多个自适应滤波器中的每一个与由所述不期望的讲话者中的一个发出的所述一个或多个不期望的麦克风信号中的每一个进行卷积来分解所述不期望的麦克风信号,以针对所述一个或多个不期望的讲话者中的每一个呈现分开的模型;基于所述分解来估计所述一个或多个不期望的讲话者中的每一个的所述一个或多个不期望的麦克风信号;以及通过从所述复合麦克风信号中减去所述一个或多个不期望的讲话者中的每一个的所述一个或多个不期望的麦克风信号的所述估计来响应于所述估...

【专利技术属性】
技术研发人员:施瑞亚斯·阿南丹·帕拉杰佩菲利普·阿兰·赫瑟林顿伦纳德·查尔斯·莱顿
申请(专利权)人:二二三六零零八安大略有限公司黑莓有限公司
类型:发明
国别省市:加拿大,CA

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1