多流音频译码制造技术

技术编号:24043991 阅读:46 留言:0更新日期:2020-05-07 04:21
本发明专利技术公开一种方法,其包含在音频编码器处接收音频数据的多个流,其中N为所接收多个流的数目。所述方法包含确定所述多个流中的每一流的相似性值,以及将所述多个流中的每一流的所述相似性值与阈值进行比较。所述方法还包含基于所述比较识别所述多个流中的N个当中待编码的L(L<N)个流。所述方法包含编码所述经识别的L个流以产生经编码位流。

Multi stream audio decoding

【技术实现步骤摘要】
【国外来华专利技术】多流音频译码相关申请案的交叉参考本申请案主张2018年9月26日申请的名称为“多流音频译码(MULTI-STREAMAUDIOCODING)”的美国专利申请案第16/143,150号及2017年10月3日申请的名称为“多流音频译码(MULTI_STREAMAUDIOCODING)”的美国临时申请案第62/567,663号的优先权,所述申请案以其全文引用的方式并入本文中。
本专利技术大体上涉及多音频信号的编码。
技术介绍
技术的进步已产生较小且功率较大的计算装置。举例来说,多种便携式个人计算装置(包含例如移动及智能型电话的无线电话、平板计算机及膝上型计算机)体积小、重量轻且易于由用户携带。此些装置可经由无线网络传达语音及数据包。另外,许多此类装置并入额外功能,例如数字静态摄影机、数字摄像机、数字记录器及音频文件播放机。而且,此类装置可处理可执行指令,所述指令包含可用以存取因特网的软件应用,例如网页浏览器应用。因而,此些装置可包含显著计算能力。计算装置可包含或可耦合到多个麦克风以接收音频信号。音频信号可根据特定音频格式经处理成音频数据流,例如双信道立体声格式、例如5.1或7.1格式的多信道格式、基于场景的音频格式或一或多个其它格式。音频数据流可由经设计以根据音频格式编码及解码音频数据流的编码器(例如编码器/解码器(codec))编码。由于针对特定应用提供各种益处的多种音频格式为可用的,因此此类计算装置的制造商可针对计算装置的增强型操作选择特定音频格式。然而,使用不同音频格式的装置之间的通信可由于音频格式之间缺少互操作性而受限。另外,在使用兼容音频格式的装置之间的网络上传送的经编码音频数据的质量可归因于网络的有限传输带宽而降低。举例来说,音频数据可能必须在符合可用传输带宽的次优化位速率下编码,从而导致在接收装置处在播放期间精确地再生音频信号的能力降低。
技术实现思路
在特定实施方案中,一种装置包含音频处理器,所述音频处理器经配置以基于所接收的音频信号产生音频数据的多个流,其中N为音频数据的多个流的数目。装置亦包含音频编码器,所述音频编码器经配置以确定多个流中的每一流的相似性值;将多个流中的每一流的相似性值与阈值进行比较;基于所述比较,识别多个流中的N个当中待编码的L个流,其中L小于N;及编码经识别的L个流以产生经编码位流。在另一特定实施方案中,一种方法包含:在音频编码器处接收音频数据的多个流,其中N为所接收多个流的数目;及确定多个流中的每一流的相似性值。所述方法包含将多个流中的每一流的相似性值与阈值进行比较,及基于所述比较识别多个流中的N个中待编码的L个流,其中L小于N。所述方法亦包含编码经识别的L个流以产生经编码位流。在另一特定实施方案中,一种设备包含用于接收音频数据的多个流(其中N为所接收多个流的数目)且用于确定多个流中的每一流的相似性值的装置。所述设备包含用于将多个流中的每一流的相似性值与阈值进行比较且用于基于所述比较识别多个流中的N个中待编码的L个流(其中L小于N)的装置。所述设备亦包含用于编码经识别的L个流以产生经编码位流的装置。在另一特定实施方案中,一种非暂时性计算机可读媒体包含指令,所述指令在由处理器内的处理器执行时使得所述处理器执行包含在音频编码器处接收音频数据的多个流的操作。所述操作亦包含:接收音频数据的多个流,其中N为所接收多个流的数目;及确定多个流中的每一流的相似性值。所述操作包含将多个流中的每一流的相似性值与阈值进行比较,以及基于所述比较识别多个流中的N个当中待编码的L个流,其中L小于N。所述操作亦包含编码经识别的L个流以产生经编码位流。本专利技术的其它实施、优势及特征将在审阅整个申请案之后变得显而易见,所述申请案包含以下部分:图式简单说明、实施方式及权利要求书。附图说明图1为包含可操作以执行多个流编码的沉浸式语音与音频服务(IVAS)编解码器的系统的特定说明性实例的框图。图2为包含图1的编解码器的系统的另一特定实例的框图。图3为可包含于图1的IVAS编解码器中的组件的框图。图4为说明可通过图1的IVAS编解码器产生的输出位流帧格式的实例的图式。图5为多流编码的方法的特定实例的流程图。图6为可操作以执行多流编码的移动装置的特定说明性实例的框图。图7为可操作以执行多流编码的基站的特定实例的框图。具体实施方式下文参考图式描述本专利技术的特定方面。在本说明书中,共同特征通过共同附图标号指示。如本文中所使用,各种术语仅仅用于描述特定实施的目的,且并不打算限制实施。举例来说,除非上下文另外明确指示,否则单数形式“一(a/an)”及“所述”打算同样包含复数形式。可进一步理解,术语“包括(comprises/comprising)”可与“包含(includes/including)”互换地使用。另外,应理解,术语“其中(wherein)”可与“在……的情况下(where)”互换地使用。如本文中所使用,用以修饰元件(例如,结构、组件、操作等)的序数术语(例如,“第一”、“第二”、“第三”等)本身不指示元件关于另一元件的任何优先级或次序,而是仅将元件与具有相同名称的另一元件区别开(除非使用序数术语)。如本文中所使用,术语“集”指特定元件中的一或多者,且术语“多个”指特定元件中的多个(例如,两个或大于两个)。在本专利技术中,例如“确定”、“计算”、“移位”、“调整”等的术语可用于描述如何执行一或多个操作。应注意,此类术语不应解释为限制性的且其它技术可用以执行类似操作。另外,如本文中所提及,“产生”、“计算”、“使用”、“选择”、“存取”及“确定”可互换地使用。举例来说,“产生”、“计算”或“确定”参数(或信号)可指积极地产生、计算或确定参数(或信号),或可指使用、选择或存取已(例如)由另一组件或装置产生的参数(或信号)。本专利技术公开可操作以编码及解码多个音频信号的系统及装置。装置可包含经配置以编码多个音频信号的编码器。多个音频信号可使用多个记录装置(例如,多个麦克风)同时及时地检索。在一些实例中,多个音频信号(或多信道音频)可通过多路复用同时或非同时记录的若干音频信道来合成(例如,人工地)产生。作为说明性实例,音频信道的并行记录或多路复用可产生2信道配置(即,立体声:左及右)、5.1信道配置(左、右、中央、左环绕、右环绕及低频重音(LFE)信道)、7.1信道配置、7.1+4信道配置、22.2信道配置或N信道配置。图1描绘包含装置101的系统100的实例,所述装置具有耦合到前端音频处理器104的多个麦克风130。前端音频处理器104耦合到编解码器102,例如沉浸式语音与音频服务(IVAS)编解码器102。IVAS编解码器102经配置以产生包含经由多个音频流从前端音频处理器104接收的经编码数据的位流126。IVAS编解码器102包含流优先级模块110,所述流优先级模块经配置以确定所接收音频流中的一些或所有的优先级配置且基于所确定优先级(例如,在感知上更重要、对场景而言更本文档来自技高网
...

【技术保护点】
1.一种方法,其包括:/n在音频编码器处接收音频数据的多个流,其中N为所述所接收多个流的数目;/n确定对应于所述所接收多个流当中的多个流的多个相似性值;/n将所述多个相似性值中的每一者与阈值进行比较;/n基于所述比较识别所述所接收多个流中的N个当中待编码的L个流,其中L小于N;及/n编码经识别的L个流以产生经编码位流。/n

【技术特征摘要】
【国外来华专利技术】20171003 US 62/567,663;20180926 US 16/143,1501.一种方法,其包括:
在音频编码器处接收音频数据的多个流,其中N为所述所接收多个流的数目;
确定对应于所述所接收多个流当中的多个流的多个相似性值;
将所述多个相似性值中的每一者与阈值进行比较;
基于所述比较识别所述所接收多个流中的N个当中待编码的L个流,其中L小于N;及
编码经识别的L个流以产生经编码位流。


2.根据权利要求1所述的方法,其中确定所述多个相似性值包括基于第一特定流的第一帧的第一信号特性来确定所述所接收多个流中的第一特定流的第一相似性值。


3.根据权利要求2所述的方法,其中确定所述第一特定流的所述第一相似性值包括将所述第一特定流的所述第一帧的所述第一信号特性与所述第一特定流的至少一个先前帧的第二信号特性进行比较。


4.根据权利要求3所述的方法,其中所述第一及所述第二信号特性包括自适应码簿增益、静止电平、非静止电平、发声因数、音调变化、信号能量、语音内容的检测、噪声底限电平、信噪比、稀疏性电平及频谱倾斜中的至少一者。


5.根据权利要求2所述的方法,其中确定所述第一特定流的所述第一相似性值包括将所述第一特定流的所述第一帧的所述第一信号特性与第二特定流的第二帧的第二信号特性进行比较,其中所述第二特定流不同于所述第一特定流。


6.根据权利要求5所述的方法,其中所述第一及所述第二信号特性对应于指示仰角值及方位角值中的至少一者的空间元数据。


7.根据权利要求2所述的方法,其中所述经编码位流包含指示对应所述第一特定流的空间数据的元数据。


8.根据权利要求1所述的方法,其中基于所述比较识别所述所接收多个流中的所述N个当中待编码的L个流包括:
响应于所述第一特定流的第一相似性值不满足所述阈值的确定,识别不经编码的第一特定流;及
响应于所述第二特定流的第二相似性值满足所述阈值的确定,识别待编码的第二特定流。


9.根据权利要求1所述的方法,其中识别所述所接收多个流中的所述N个当中待编码的L个流包括:
组合所述所接收多个流中的所述N个当中的多个流以产生经组合流;及
将第一相似性值指派到所述经组合流。


10.根据权利要求1所述的方法,其进一步包括在编码所述经识别的L个流之前,将优先级值指派到所述所接收多个流的一部分且基于经指派到所述所接收多个流的所述部分的所述优先级值确定置换序列。


11.一种装置,其包括:
音频处理器,其经配置以基于所接收音频信号产生音频数据的多个流,其中N为所述音频数据的多个流的数目;及
音频编码器,其经配置以:
确定对应于所述多个流当中的多个流的多个相似性值;
将所述多个相似性值中的每一者与阈值进行比较;
基于所述比较识别所述多个流中的所述N个当中待编码的L个流,其中L小于N;及
编码所述经识别的L个流以产生经编码位流。


12.根据权利要求11所述的装置,其进一步包括传输器,所述传输器经配置以经由无线网络将所述经编码位流传输到音频解码器,其中所述经编码位流包含第一特定流的第一相似性值。


13.根据权利要求12所述的装置,其进一步包括:
接收器,其经配置以从无线网络接收所述经编码位流;及
音频解码器,其经配置以:
确定来自所述经编码位流的第一特定流的第一相似性值;
将所述第一特定流的所述第一相似性值与第一阈值进行比较;及
在所述音频解码器处,基于所述比较执行错误隐蔽以产生对应于所述第一特定流的经解码音频样本。


14.根据权利要求11所述的装置,其中所述音频编码器经配置以通过将所述第一特定流的第一帧的第一信号特性与所述第一特定流的至少一个先前帧的第二信号特性进行比较来确定所述第一特定流的所述第一相似性值。


15.根据权利要求...

【专利技术属性】
技术研发人员:V·阿提V·S·C·S·奇比亚姆
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1