编码器选择制造技术

技术编号:16673278 阅读:52 留言:0更新日期:2017-11-30 17:27
一种装置包含第一分类器及耦合到所述第一分类器的第二分类器。所述第一分类器经配置以输出指示音频帧分类为语音帧或非语音帧的分类的第一决策数据,所述第一决策数据是基于与所述音频帧为所述语音帧的第一似然性相关联的第一概率数据且基于与所述音频帧为所述非语音帧的第二似然性相关联的第二概率数据而确定。所述第二分类器经配置以基于所述第一概率数据、所述第二概率数据及所述第一决策数据而输出第二决策数据,所述第二决策数据包含对可用于编码所述音频帧的多个编码器中的特定编码器的选择的指示。

【技术实现步骤摘要】
【国外来华专利技术】编码器选择相关申请案的交叉引用本申请案要求2016年3月29日申请的题为“编码器选择(ENCODERSELECTION)”的美国专利申请案第15/083,867号及2015年4月5日申请的题为“编码器选择(ENCODERSELECTION)”的美国临时专利申请案第62/143,155号的权利,所述美国申请案的全文明确地以引用的方式并入本文中。
本专利技术大体上涉及对编码器的选择。
技术介绍
通过数字技术进行音频记录及发射是广泛应用的。举例来说,可在远程及数字无线电电话应用中发射音频。例如无线电话的装置可发送及接收表示人类话音(例如,语音)及非语音(例如,音乐或其它声音)的信号。在一些装置中,多种译码技术是可用的。举例来说,装置的音频译码器-解码器(CODEC)可使用切换译码方法来编码多种内容。为进行说明,装置可包含例如代数码激励线性预测(algebraiccode-excitedlinearprediction;ACELP)编码器的语音编码器,及例如变换译码激励(transformcodedexcitation;TCX)编码器(例如,变换域编码器)的非语音编码器。语音编码器可专门用于编码语音内容,且例如音乐编码器的非语音编码器可专门用于编码非作用中及音乐内容。应注意,如本文中所使用,“编码器”可指切换式编码器的编码模式中的一个。举例来说,ACELP编码器及TCX编码器可为切换式编码器内的两个单独编码模式。装置可使用多个方法中的一个来将音频帧分类及选择编码器。举例来说,音频帧可被分类为语音帧或非语音帧(例如,音乐帧)。如果音频帧被分类为语音帧,那么装置可选择语音编码器来编码音频帧。替代地,如果音频帧被分类为非语音帧(例如,音乐帧),那么装置可选择非语音编码器来编码音频帧。可由装置用以将音频帧分类的第一种方法可包含基于语音特性的高斯混合模型(GMM)。举例来说,GMM可使用音频帧的语音特性(例如,音调、频谱形状、相关性度量等)来确定音频帧更可能为语音帧还是更可能为非语音帧。GMM可专门用于识别语音帧,但可能无法还起作用以识别非语音帧(例如,音乐帧)。第二种方法可包含开放回路分类器。开放回路分类器可预测哪个编码器(例如,语音编码器或非语音编码器)更适合于编码音频帧。术语“开放回路”用以表示并未在预测选择哪个编码器之前显式地编码音频帧。开放回路分类器可专门用于识别非语音帧,但可能无法还起作用以识别语音帧。可由装置用以将音频帧分类的第三种方法可包含基于模型的分类器及开放回路分类器。基于模型的分类器可将决策输出到开放回路分类器,所述开放回路分类器可使用所述决策来将音频帧分类。装置可以逐个帧为基础而分析传入的音频信号,且可决定使用语音编码器还是非语音编码器(例如,音乐编码器)来编码特定音频帧。如果特定音频帧经错误分类(例如,被不当地分类为语音帧或非语音帧),那么可能产生伪讯、不良信号质量或其组合。
技术实现思路
在特定方面中,一种装置包含第一分类器及耦合到所述第一分类器的第二分类器。所述第一分类器经配置以确定第一决策数据,所述第一决策数据指示音频帧分类为语音帧或非语音帧的分类。所述第一决策数据是基于与所述音频帧为所述语音帧的第一似然性相关联的第一概率数据且基于与所述音频帧为所述非语音帧的第二似然性相关联的第二概率数据而确定。所述第二分类器经配置以基于所述第一概率数据、所述第二概率数据及所述第一决策数据而确定第二决策数据。所述第二决策数据包含对可用于编码所述音频帧的多个编码器中的特定编码器的选择的指示。在另一特定方面中,一种方法包含:在第二分类器处从第一分类器接收第一概率数据及第二概率数据。所述第一概率数据与音频帧为语音帧的第一似然性相关联,且所述第二概率数据与所述音频帧为非语音帧的第二似然性相关联。所述方法还包含在所述第二分类器处从所述第一分类器接收第一决策数据。所述第一决策数据基于所述第一概率数据及所述第二概率数据。所述第一决策数据指示所述音频帧分类为所述语音帧或所述非语音帧的分类。所述方法进一步包含在所述第二分类器处基于所述第一概率数据、所述第二概率数据及所述第一决策数据而确定第二决策数据。所述第二决策数据指示对用以编码所述音频帧的多个编码器中的特定编码器的选择。在另一特定方面中,一种设备包含用于确定与音频帧为语音帧的第一似然性相关联的第一概率数据的装置及用于确定与所述音频帧为非语音帧的第二似然性相关联的第二概率数据的装置。所述设备还包含用于基于所述第一概率数据及所述第二概率数据而确定第一决策数据的装置。所述第一决策数据包含所述音频帧分类为所述语音帧或所述非语音帧的分类的第一指示。所述设备进一步包含用于基于所述第一概率数据、所述第二概率数据及所述第一决策数据而确定第二决策数据的装置。所述第二决策数据包含对用以编码所述音频帧的编码器的选择的第二指示。在另一特定方面中,一种计算机可读存储装置,其存储指令,所述指令在通过处理器执行时使所述处理器执行包含以下各项的操作:确定与音频帧为语音帧的第一似然性相关联的第一概率数据;及确定与所述音频帧为非语音帧的第二似然性相关联的第二概率数据。所述操作还包含:基于所述第一概率数据及所述第二概率数据而确定第一决策数据。所述第一决策数据指示所述音频帧分类为所述语音帧或所述非语音帧的分类。所述操作进一步包含基于所述第一概率数据、所述第二概率数据及所述第一决策数据而确定第二决策数据。所述第二决策数据指示对用以编码所述音频帧的编码器的选择。在另一特定方面中,一种方法包含:在第二分类器处从第一分类器接收第一概率数据及第一决策数据。所述第一概率数据与音频帧为语音帧的第一似然性相关联。所述第一决策数据指示所述音频帧分类为所述语音帧或非语音帧的分类。所述方法还包含:在所述第二分类器处确定是否满足与所述音频帧相关联的条件集合。所述条件集合中的第一条件是基于所述第一概率数据,且所述条件集合中的第二条件是基于所述第一决策数据。所述方法进一步包含:响应于确定是否满足所述条件集合,选择调整参数的值以使选择偏向多个编码器中的第一编码器。本专利技术的其它方面、优点及特征将在审阅申请案之后变得显而易见,所述申请案包含以下部分:[图式简单说明]、[实施方式]及[权利要求书]。附图说明图1为可操作以选择编码器的系统的特定说明性方面的框图;图2为图1的系统的选择器的特定说明性方面的框图;图3为图1的系统的第一分类器的特定说明性方面的框图;图4为图1的系统的第二分类器的特定说明性方面的框图;图5为说明选择编码器的方法的流程图;图6为说明选择调整参数的值以使选择偏向特定编码器的方法的流程图;图7为可操作以选择编码器的装置的特定说明性方面的框图;及图8为可操作以选择编码器的基站的特定说明性方面的框图。具体实施方式下文参看图式描述本专利技术的特定方面。在描述中,共同特征通过共同参考编号指示。如本文中所使用,仅出于描述特定实施方案的目的而使用各种术语,且所述术语并不打算为限制性的。举例来说,除非上下文另外清晰地指示,否则单数形式“一(a/an)”及“所述”打算还包含复数形式。可进一步理解,术语“包括(comprise及comprising)”可与“包含(includes或including)”互换使用。另外,应理解,术语“其中”可本文档来自技高网
...
编码器选择

【技术保护点】
一种装置,其包括:第一分类器,其经配置以输出指示音频帧分类为语音帧或非语音帧的分类的第一决策数据,所述第一决策数据是基于与所述音频帧为所述语音帧的第一似然性相关联的第一概率数据且基于与所述音频帧为所述非语音帧的第二似然性相关联的第二概率数据而确定;及第二分类器,其耦合到所述第一分类器,所述第二分类器经配置以基于所述第一概率数据、所述第二概率数据及所述第一决策数据而输出第二决策数据,所述第二决策数据包含对可用于编码所述音频帧的多个编码器中的特定编码器的选择的指示。

【技术特征摘要】
【国外来华专利技术】2015.04.05 US 62/143,155;2016.03.29 US 15/083,8671.一种装置,其包括:第一分类器,其经配置以输出指示音频帧分类为语音帧或非语音帧的分类的第一决策数据,所述第一决策数据是基于与所述音频帧为所述语音帧的第一似然性相关联的第一概率数据且基于与所述音频帧为所述非语音帧的第二似然性相关联的第二概率数据而确定;及第二分类器,其耦合到所述第一分类器,所述第二分类器经配置以基于所述第一概率数据、所述第二概率数据及所述第一决策数据而输出第二决策数据,所述第二决策数据包含对可用于编码所述音频帧的多个编码器中的特定编码器的选择的指示。2.根据权利要求1所述的装置,其中所述多个编码器包含第一编码器及第二编码器,且所述装置进一步包括经配置以基于所述第二决策数据而选择所述第一编码器或所述第二编码器的切换器。3.根据权利要求2所述的装置,其中所述第一编码器包括语音编码器,且其中所述第二编码器包括非语音编码器。4.根据权利要求3所述的装置,其中所述第二编码器包括音乐编码器。5.根据权利要求3所述的装置,其中所述第一编码器包括代数码激励线性预测ACELP编码器,且其中所述第二编码器包括变换译码激励TCX编码器。6.根据权利要求1所述的装置,其中所述第一分类器包括高斯混合模型模块,且其中所述第二分类器包括开放回路分类器。7.根据权利要求1所述的装置,其中所述第一分类器包含状态机,所述状态机经配置以接收所述第一概率数据及所述第二概率数据且基于所述第一概率数据及所述第二概率数据而产生所述第一决策数据。8.根据权利要求1所述的装置,其中所述第二分类器包含经配置以基于所述第一概率数据、所述第二概率数据及所述第一决策数据而产生调整参数的调整参数产生器,且其中所述第二分类器经配置以进一步基于所述调整参数的值而输出所述第二决策数据。9.根据权利要求1所述的装置,其进一步包括经配置而以多个编码模式操作的切换式编码器,其中所述多个编码器对应于所述切换式编码器的所述多个编码模式。10.根据权利要求1所述的装置,其进一步包括所述多个编码器,其中所述第一分类器、所述第二分类器及所述多个编码器经集成到移动通信装置或基站中。11.根据权利要求1所述的装置,其进一步包括:接收器,其经配置以接收包含所述音频帧的音频信号;解调器,其耦合到所述接收器,所述解调器经配置以解调制所述音频信号;处理器,其耦合到所述解调器;及多个解码器。12.根据权利要求11所述的装置,其中所述接收器、所述解调器、所述处理器及所述多个解码器经集成到移动通信装置中。13.根据权利要求11所述的装置,其中所述接收器、所述解调器、所述处理器及所述多个解码器经集成到基站中。14.一种选择编码器的方法,所述方法包括:在第二分类器处从第一分类器接收第一概率数据及第二概率数据,所述第一概率数据与音频帧为语音帧的第一似然性相关联,且所述第二概率数据与所述音频帧为非语音帧的第二似然性相关联;在所述第二分类器处从所述第一分类器接收第一决策数据,所述第一决策数据指示所述音频帧分类为所述语音帧或所述非语音帧的分类;及在所述第二分类器处基于所述第一概率数据、所述第二概率数据及所述第一决策数据而确定第二决策数据,所述第二决策数据指示对用以编码所述音频帧的多个编码器中的特定编码器的选择。15.根据权利要求14所述的方法,其中所述第一决策数据是在所述第二分类器处从所述第一分类器的状态机接收。16.根据权利要求14所述的方法,其进一步包括将来自所述第二分类器的输出的所述第二决策数据提供到经配置以选择所述多个编码器中的所述特定编码器的切换器,其中使用所述特定编码器来编码所述音频帧。17.根据权利要求14所述的方法,其中所述多个编码器包含第一编码器及第二编码器,其中所述第一编码器包括语音编码器,且其中所述第二编码器包括非语音编码器。18.根据权利要求14所述的方法,其进一步包括:确定与所述多个编码器中的第一编码器相关联的第一估计译码增益值;及确定与所述多个编码器中的第二编码器相关联的第二估计译码增益值。19.根据权利要求18所述的方法,其进一步包括选择调整参数的值,所述值是基于所述第一概率数据、所述第二概率数据、长期状态数据或所述第一决策数据中的至少一个而选择,其中所述第二决策数据是进一步基于所述调整参数的所述值而确定。20.根据权利要求19所述的方法,其进一步包括基于所述调整参数的所述值而调整所述第一估计译码增益值,其中对所述特定编码器的所述选择是基于所述经调整的第一估计译码增益值及所述第二估计译码增益值。21.根据权利要求20所述的方法,其中所述调整参数的所述值经选择以使所述选择偏向与语音相关联的所述第一编码器或与非语音相关联的所述第二编码器。22.根据权利要求14所述的方法,其进一步包括:确定是否满足与音频帧相关联的条件集合;及响应于满足所述条件集合,选择调整参数的值以使所述选择偏向与语音相关联的第一编码器。23.根据权利要求22所述的方法,其进一步包括确定所述音频帧是否与12,800赫兹的采样率相关联,其中至少部分响应于确定所述音频帧与12,800赫兹的所述采样率相关联而确定满足所述条件集合。24.根据权利要求22所述的方法,其进一步包括确定所述第一决策数据是否指示所述音频帧被分类为所述语音帧,其中至少部分响应于确定所述第一决策数据指示所述音频帧被分类为所述语音帧而确定满足所述条件集合。25.根据权利要求22所述的方法,其进一步包括确定与正用以编码所述音频帧的所述第一编码器相关联的第一估计译码增益值是否大于或等于第一值,所述第一值相关联于第二估计译码增益值与第二值之间的差,其中至少部分响应于确定所述第一估计译码增益值大于或等于所述第一值而确定满足所述条件集合。26.根据权利要求22所述的方法,其进一步包括:确定最近分类的帧是否被分类为包含语音内容;及确定通过所述第一概率数据指示的第一概率值是否大于通过所述第二概率数据指示的第二概率值,其中至少部分响应于确定所述最近分类的帧被分类为包含所述语音内容且响应于确定所述第一概率值大于所述第二概率值而确定满足所述条件集合。27.根据权利要求22所述的方法,其进一步包括:确定对应于数个最近分类的帧的每一帧是否被分类为包含语音内容;及确定通过所述第一概率数据指示的第一概率值是否大于或等于第三值,所述第三值相关联于通过所述第二概率数据指示的第二概率值与第四值之间的差,其中至少部...

【专利技术属性】
技术研发人员:芬卡特拉曼·S·阿提文卡塔·萨伯拉曼亚姆·强卓·赛克哈尔·奇比亚姆维韦克·拉金德朗苏巴辛格哈·夏敏达·苏巴辛格哈
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1