双耳对话增强制造技术

技术编号：19248556 阅读：29 留言：0更新日期：2018-10-24 10:16

本发明专利技术揭示一种用于增强音频内容的对话的方法，其包括：提供音频成分的第一音频信号呈现；提供第二音频信号呈现；接收一组对话估计参数，所述对话估计参数经配置以实现从所述第一音频信号呈现估计对话成分；将所述组对话估计参数应用于所述第一音频信号呈现，以形成所述对话成分的对话呈现；及组合所述对话呈现与所述第二音频信号呈现以形成在第二音频再现系统上再现的对话增强音频信号呈现，其中所述第一音频信号呈现及所述第二音频信号呈现中的至少一者是双耳音频信号呈现。

Binaural conversation enhancement

The invention discloses a method for enhancing the audio content of the dialogue includes providing a first audio signal audio components present; 2 audio signal is present; receiving a set of parameters estimation of the dialogue, the dialogue is configured to realize parameter estimation from the first audio signal is estimated by the dialogue component; Dialogue is applied to parameter estimation of the first audio signal is presented, to form the dialogue component of dialogue; and combined the dialogue presentation and the second audio signal to form in the second audio reproduction system reproduces dialogue enhanced audio signals, wherein the first audio signal and the second presentation Two at least one of the audio signal presentation is the presentation of the binaural audio signal.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】双耳对话增强相关申请案的交叉参考本申请案主张2016年1月29日申请的第62/288,590号美国临时专利申请案及2016年1月29日申请的第16153468.0号欧洲专利申请案的优先权，所述两个申请案的全部内容以引用方式并入本文中。
本专利技术涉及音频信号处理的领域，且揭示用于有效地估计尤其是具有空间化成分的音频信号(有时称为沉浸式音频内容)的对话成分的方法及系统。
技术介绍
贯穿说明书对
技术介绍
的任何论述决不应被视为承认此项技术是众所周知的或形成所属领域中的公知常识的部分。传统上，以基于声道的格式(即，为整个内容生态系统中的内容设想一个特定目标回放系统)执行音频的内容创建、编码、分配及再现。此类目标回放系统音频格式的实例是单声道、立体声、5.1、7.1及类似者，并且我们将这些格式称为原始内容的不同呈现。上述呈现通常通过扬声器回放，但明显例外是通常也直接通过耳机回放的立体声呈现。一个特定呈现是通常针对在耳机上回放的双耳呈现。双耳呈现的独特之处在于其是双声道信号，其中每一信号分别表示在左耳膜及右耳膜处或附近感知的内容。双耳呈现可直接通过扬声器回放，但优选地双耳呈现使用串扰消除技术经转换成适于通过扬声器回放的呈现。上文已介绍不同音频再现系统，如同呈不同配置(例如立体声、5.1及7.1)的扬声器及耳机。从上述实例可理解，原始内容的呈现具有自然的、指定的、相关联的音频再现系统，但当然可在不同音频再现系统上回放。如果将在与指定回放系统不同的回放系统上再现内容，那么可应用向下混合或向上混合过程。例如，可通过采用特定向下混合等式而在立体声回放系统上再现5.1内容。另一...

【技术保护点】
1.一种用于增强具有一或多个音频成分的音频内容的对话的方法，其中每一成分与空间位置相关联，所述方法包括：提供希望在第一音频再现系统上再现的所述音频成分的第一音频信号呈现；提供希望在第二音频再现系统上再现的所述音频成分的第二音频信号呈现；接收一组对话估计参数，所述对话估计参数经配置以实现从所述第一音频信号呈现估计对话成分；将所述组对话估计参数应用于所述第一音频信号呈现，以形成所述对话成分的对话呈现；及组合所述对话呈现与所述第二音频信号呈现以形成在所述第二音频再现系统上再现的对话增强音频信号呈现；其中所述第一音频信号呈现及所述第二音频信号呈现中的至少一者是双耳音频信号呈现。

【技术特征摘要】
【国外来华专利技术】2016.01.29 EP 16153468.0;2016.01.29 US 62/288,5901.一种用于增强具有一或多个音频成分的音频内容的对话的方法，其中每一成分与空间位置相关联，所述方法包括：提供希望在第一音频再现系统上再现的所述音频成分的第一音频信号呈现；提供希望在第二音频再现系统上再现的所述音频成分的第二音频信号呈现；接收一组对话估计参数，所述对话估计参数经配置以实现从所述第一音频信号呈现估计对话成分；将所述组对话估计参数应用于所述第一音频信号呈现，以形成所述对话成分的对话呈现；及组合所述对话呈现与所述第二音频信号呈现以形成在所述第二音频再现系统上再现的对话增强音频信号呈现；其中所述第一音频信号呈现及所述第二音频信号呈现中的至少一者是双耳音频信号呈现。2.根据权利要求1所述的方法，其中所述第一音频信号呈现及所述第二音频信号呈现两者是双耳音频信号呈现。3.根据权利要求1所述的方法，其中仅所述第一音频信号呈现及所述第二音频信号呈现中的一者是双耳音频信号呈现。4.根据权利要求3所述的方法，其中所述第一音频信号呈现及所述第二音频信号呈现中的另一者是立体声或环绕声音频信号呈现。5.根据权利要求3或4所述的方法，其进一步包括：接收一组对话变换参数且在应用所述组对话估计参数之前或之后应用所述组对话变换参数，以形成对应于所述第二音频信号呈现的经变换对话呈现。6.根据权利要求3或4所述的方法，其中所述对话估计参数还经配置以执行呈现变换，使得所述对话呈现对应于所述第二音频信号呈现。7.根据权利要求2所述的方法，其中提供所述第一音频信号呈现包含接收初始音频信号呈现及一组呈现变换参数，且将所述组呈现变换参数应用于所述初始音频信号呈现。8.根据前述权利要求中任一权利要求所述的方法，其进一步包括：接收一组呈现变换参数，所述呈现变换参数经配置以实现将所述第一音频信号呈现变换成所述第二音频信号呈现；及将所述组呈现变换参数应用于所述第一音频信号呈现以形成所述第二音频信号呈现。9.根据权利要求8所述的方法，其进一步包括在应用所述组对话估计参数之前或之后应用所述组呈现变换参数，以形成对应于所述第二音频信号呈现的经变换对话呈现。10.根据权利要求8所述的方法，其中组合所述对话呈现与所述第二音频信号呈现的步骤包含形成所述对话呈现及所述第一音频信号呈现的和且将所述组呈现变换参数应用于所述和。11.根据前述权利要求中任一权利要求所述的方法，其中从编码器接收所述第一音频信号呈现。12.根据前述权利要求中任一权利要求所述的方法，其进一步包括将级别修改因子G应用于所述对话呈现。13.根据权利要求12所述的方法，其中当G小于给定阈值时应用第一处理，且当G大于所述阈值时应用第二处理。14.根据权利要求13所述的方法，其中所述阈值等于零，其中G<0表示对话减弱且G>0表示对话增强。15.根据权利要求13或14所述的方法，其中所述第一处理包括形成所述对话呈现及所述第一音频信号呈现的和且将一组呈现变换参数应用于所述和。16.根据权利要求13到15中的任一权利要求所述的方法，其中所述第二处理包括在应用所述组对话估计参数之前或之后应用一组呈现变换参数，以形成对应于所述第二音频信号呈现的经变换对话呈现。17.一种用于增强具有一或多个音频成分的音频内容的对话的方法，其中每一成分与空间位置相关联，所述方法包括：接收希望在第一音频再现系统上再现的所述音频成分的第一音频信号呈现；接收一组呈现变换参数，所述呈现变换参数经配置以实现将所述第一音频信号呈现变换成希望在第二音频再现系统上再现的第二音频信号呈现；接收一组对话估计参数，其经配置以实现从所述第一音频信号呈现估计对话成分；将所述组呈现变换参数应用于所述第一音频信号呈现以形成第二音频信号呈现；将所述组对话估计参数应用于所述第一音频信号呈现以形成所述对话成分的对话呈现；及组合所述对话呈现与所述第二音频信号呈现以形成在所述第二音频再现系统上再现的对话增强音频信号呈现；其中仅所述第一音频信号呈现及所述第二音频信号呈现中的一者是双耳音频信号呈现。18.根据权利要求17所述的方法，其中组合所述对话呈现与所述第二音频信号呈现的步骤包含形成所述对话呈现及所述第一音频信号呈现的和且将所述组呈现变换参数应用于所述和。19.根据权利要求17所述的方法，其中所述对话估计参数还经配置以执行呈现变换，使得所述对话呈现对应于所述第二音频信号呈现。20.根据权利要求17所述的方法，其进一步包括在应用所述组对话估计参数之前或之后应用所述组呈现变换参数，以形成对应于所述第二音频信号呈现的经变换对话呈现。21.根据权利要求17所述的方法，其中所述对话呈现是单声道呈现，且所述方法进一步包括：接收与所述对话成分相关的位置数据，在与所述第二音频信号呈现组合之前使用所述位置数据来渲染所述单声道对话呈现。22.根据权利要求21所述的方法，其中所述渲染包含：基于所述位置数据从库选择头部相关传递函数HRTF，及将所述选定HRTF应用于所述单声道对话呈现。23.根据权利要求21所述的方法，其中所述渲染包含振幅平移。24.一种用于增强具有一或多个音频成分的音频内容的对话的方法，其中每一成分与空间位置相关联，所述方法包括：接收希望在第一音频再现系统上再现的所述音频成分的第一音频信号呈现；接收一组呈现变换参数，所述呈现变换参数经配置以实现将所述第一音频信号呈现变换成希望在第二音频再现系统上再现的所述第二音频信号呈现；接收一组对话估计参数，所述对话估计参数经配置以实现从所述第二音频信号呈现估计对话成分；将所述组呈现变换参数应用于所述第一音频信号呈现以形成第二音频信号呈现；将所述组对话估计参数应用于所述第二音频信号呈现以形成所述对话成分的对话呈现；及对所述对话呈现与所述第二音频信号呈现求和以形成在所述第二音频再现系统上再现的对话增强音频信号呈现；其中仅所述第一...

【专利技术属性】
技术研发人员：L·J·萨穆埃尔松，D·J·布里巴尔特，D·M·库珀，J·科庞，
申请(专利权)人：杜比实验室特许公司，杜比国际公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人