编码器选择制造技术

技术编号：16673278 阅读：52 留言：0更新日期：2017-11-30 17:27

一种装置包含第一分类器及耦合到所述第一分类器的第二分类器。所述第一分类器经配置以输出指示音频帧分类为语音帧或非语音帧的分类的第一决策数据，所述第一决策数据是基于与所述音频帧为所述语音帧的第一似然性相关联的第一概率数据且基于与所述音频帧为所述非语音帧的第二似然性相关联的第二概率数据而确定。所述第二分类器经配置以基于所述第一概率数据、所述第二概率数据及所述第一决策数据而输出第二决策数据，所述第二决策数据包含对可用于编码所述音频帧的多个编码器中的特定编码器的选择的指示。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】编码器选择相关申请案的交叉引用本申请案要求2016年3月29日申请的题为“编码器选择(ENCODERSELECTION)”的美国专利申请案第15/083,867号及2015年4月5日申请的题为“编码器选择(ENCODERSELECTION)”的美国临时专利申请案第62/143,155号的权利，所述美国申请案的全文明确地以引用的方式并入本文中。
本专利技术大体上涉及对编码器的选择。
技术介绍
通过数字技术进行音频记录及发射是广泛应用的。举例来说，可在远程及数字无线电电话应用中发射音频。例如无线电话的装置可发送及接收表示人类话音(例如，语音)及非语音(例如，音乐或其它声音)的信号。在一些装置中，多种译码技术是可用的。举例来说，装置的音频译码器-解码器(CODEC)可使用切换译码方法来编码多种内容。为进行说明，装置可包含例如代数码激励线性预测(algebraiccode-excitedlinearprediction；ACELP)编码器的语音编码器，及例如变换译码激励(transformcodedexcitation；TCX)编码器(例如，变换域编码器)的非语音编码器。语音编码器可专门用于编码语音内容，且例如音乐编码器的非语音编码器可专门用于编码非作用中及音乐内容。应注意，如本文中所使用，“编码器”可指切换式编码器的编码模式中的一个。举例来说，ACELP编码器及TCX编码器可为切换式编码器内的两个单独编码模式。装置可使用多个方法中的一个来将音频帧分类及选择编码器。举例来说，音频帧可被分类为语音帧或非语音帧(例如，音乐帧)。如果音频帧被分类为语音帧，那么装置可选择...
编码器选择

【技术保护点】
一种装置，其包括：第一分类器，其经配置以输出指示音频帧分类为语音帧或非语音帧的分类的第一决策数据，所述第一决策数据是基于与所述音频帧为所述语音帧的第一似然性相关联的第一概率数据且基于与所述音频帧为所述非语音帧的第二似然性相关联的第二概率数据而确定；及第二分类器，其耦合到所述第一分类器，所述第二分类器经配置以基于所述第一概率数据、所述第二概率数据及所述第一决策数据而输出第二决策数据，所述第二决策数据包含对可用于编码所述音频帧的多个编码器中的特定编码器的选择的指示。

【技术特征摘要】
【国外来华专利技术】2015.04.05 US 62/143,155;2016.03.29 US 15/083,8671.一种装置，其包括：第一分类器，其经配置以输出指示音频帧分类为语音帧或非语音帧的分类的第一决策数据，所述第一决策数据是基于与所述音频帧为所述语音帧的第一似然性相关联的第一概率数据且基于与所述音频帧为所述非语音帧的第二似然性相关联的第二概率数据而确定；及第二分类器，其耦合到所述第一分类器，所述第二分类器经配置以基于所述第一概率数据、所述第二概率数据及所述第一决策数据而输出第二决策数据，所述第二决策数据包含对可用于编码所述音频帧的多个编码器中的特定编码器的选择的指示。2.根据权利要求1所述的装置，其中所述多个编码器包含第一编码器及第二编码器，且所述装置进一步包括经配置以基于所述第二决策数据而选择所述第一编码器或所述第二编码器的切换器。3.根据权利要求2所述的装置，其中所述第一编码器包括语音编码器，且其中所述第二编码器包括非语音编码器。4.根据权利要求3所述的装置，其中所述第二编码器包括音乐编码器。5.根据权利要求3所述的装置，其中所述第一编码器包括代数码激励线性预测ACELP编码器，且其中所述第二编码器包括变换译码激励TCX编码器。6.根据权利要求1所述的装置，其中所述第一分类器包括高斯混合模型模块，且其中所述第二分类器包括开放回路分类器。7.根据权利要求1所述的装置，其中所述第一分类器包含状态机，所述状态机经配置以接收所述第一概率数据及所述第二概率数据且基于所述第一概率数据及所述第二概率数据而产生所述第一决策数据。8.根据权利要求1所述的装置，其中所述第二分类器包含经配置以基于所述第一概率数据、所述第二概率数据及所述第一决策数据而产生调整参数的调整参数产生器，且其中所述第二分类器经配置以进一步基于所述调整参数的值而输出所述第二决策数据。9.根据权利要求1所述的装置，其进一步包括经配置而以多个编码模式操作的切换式编码器，其中所述多个编码器对应于所述切换式编码器的所述多个编码模式。10.根据权利要求1所述的装置，其进一步包括所述多个编码器，其中所述第一分类器、所述第二分类器及所述多个编码器经集成到移动通信装置或基站中。11.根据权利要求1所述的装置，其进一步包括：接收器，其经配置以接收包含所述音频帧的音频信号；解调器，其耦合到所述接收器，所述解调器经配置以解调制所述音频信号；处理器，其耦合到所述解调器；及多个解码器。12.根据权利要求11所述的装置，其中所述接收器、所述解调器、所述处理器及所述多个解码器经集成到移动通信装置中。13.根据权利要求11所述的装置，其中所述接收器、所述解调器、所述处理器及所述多个解码器经集成到基站中。14.一种选择编码器的方法，所述方法包括：在第二分类器处从第一分类器接收第一概率数据及第二概率数据，所述第一概率数据与音频帧为语音帧的第一似然性相关联，且所述第二概率数据与所述音频帧为非语音帧的第二似然性相关联；在所述第二分类器处从所述第一分类器接收第一决策数据，所述第一决策数据指示所述音频帧分类为所述语音帧或所述非语音帧的分类；及在所述第二分类器处基于所述第一概率数据、所述第二概率数据及所述第一决策数据而确定第二决策数据，所述第二决策数据指示对用以编码所述音频帧的多个编码器中的特定编码器的选择。15.根据权利要求14所述的方法，其中所述第一决策数据是在所述第二分类器处从所述第一分类器的状态机接收。16.根据权利要求14所述的方法，其进一步包括将来自所述第二分类器的输出的所述第二决策数据提供到经配置以选择所述多个编码器中的所述特定编码器的切换器，其中使用所述特定编码器来编码所述音频帧。17.根据权利要求14所述的方法，其中所述多个编码器包含第一编码器及第二编码器，其中所述第一编码器包括语音编码器，且其中所述第二编码器包括非语音编码器。18.根据权利要求14所述的方法，其进一步包括：确定与所述多个编码器中的第一编码器相关联的第一估计译码增益值；及确定与所述多个编码器中的第二编码器相关联的第二估计译码增益值。19.根据权利要求18所述的方法，其进一步包括选择调整参数的值，所述值是基于所述第一概率数据、所述第二概率数据、长期状态数据或所述第一决策数据中的至少一个而选择，其中所述第二决策数据是进一步基于所述调整参数的所述值而确定。20.根据权利要求19所述的方法，其进一步包括基于所述调整参数的所述值而调整所述第一估计译码增益值，其中对所述特定编码器的所述选择是基于所述经调整的第一估计译码增益值及所述第二估计译码增益值。21.根据权利要求20所述的方法，其中所述调整参数的所述值经选择以使所述选择偏向与语音相关联的所述第一编码器或与非语音相关联的所述第二编码器。22.根据权利要求14所述的方法，其进一步包括：确定是否满足与音频帧相关联的条件集合；及响应于满足所述条件集合，选择调整参数的值以使所述选择偏向与语音相关联的第一编码器。23.根据权利要求22所述的方法，其进一步包括确定所述音频帧是否与12,800赫兹的采样率相关联，其中至少部分响应于确定所述音频帧与12,800赫兹的所述采样率相关联而确定满足所述条件集合。24.根据权利要求22所述的方法，其进一步包括确定所述第一决策数据是否指示所述音频帧被分类为所述语音帧，其中至少部分响应于确定所述第一决策数据指示所述音频帧被分类为所述语音帧而确定满足所述条件集合。25.根据权利要求22所述的方法，其进一步包括确定与正用以编码所述音频帧的所述第一编码器相关联的第一估计译码增益值是否大于或等于第一值，所述第一值相关联于第二估计译码增益值与第二值之间的差，其中至少部分响应于确定所述第一估计译码增益值大于或等于所述第一值而确定满足所述条件集合。26.根据权利要求22所述的方法，其进一步包括：确定最近分类的帧是否被分类为包含语音内容；及确定通过所述第一概率数据指示的第一概率值是否大于通过所述第二概率数据指示的第二概率值，其中至少部分响应于确定所述最近分类的帧被分类为包含所述语音内容且响应于确定所述第一概率值大于所述第二概率值而确定满足所述条件集合。27.根据权利要求22所述的方法，其进一步包括：确定对应于数个最近分类的帧的每一帧是否被分类为包含语音内容；及确定通过所述第一概率数据指示的第一概率值是否大于或等于第三值，所述第三值相关联于通过所述第二概率数据指示的第二概率值与第四值之间的差，其中至少部...

【专利技术属性】
技术研发人员：芬卡特拉曼·S·阿提，文卡塔·萨伯拉曼亚姆·强卓·赛克哈尔·奇比亚姆，维韦克·拉金德朗，苏巴辛格哈·夏敏达·苏巴辛格哈，
申请(专利权)人：高通股份有限公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人