一种音频分类方法及装置制造方法及图纸

技术编号:13404133 阅读:27 留言:0更新日期:2016-07-25 01:19
本发明专利技术实施例提供一种音频分类方法及装置。其中,方法包括:根据收集的训练数据,基于深度神经网络训练得到音频分类模型;对音频数据提取音频特征;将所述音频特征输入所述音频分类模型,输出得到所述音频数据的分类结果;所述分类结果包括:录音音频、语音搜歌音频和哼唱音频。本发明专利技术实施例可以解决现有技术中对哼唱音频和语音搜歌音频之间的分类正确率较低的问题,提高音频分类的准确率,进而可以提高搜索歌曲的准确率。

【技术实现步骤摘要】

本专利技术实施例涉及音频
,尤其涉及一种音频分类方法及装置
技术介绍
近年来,随着智能电视技术的迅速发展,可以通过智能电视实现越来越多的功能,例如,可以通过智能电视实现搜索歌曲的功能。在具体应用中,智能电视可以支持如下三种方式的搜索歌曲功能:第一种,接收用户的语音搜歌音频,例如该语音搜歌音频可以为接收到的用户说的一段话:“搜索歌曲《青花瓷》”,则智能电视在与语音搜歌音频对应的搜索引擎中进行搜索;第二种,接收用户输入的一段录音音频,例如录制的一段背景音乐,则智能电视在与录音音频对应的搜索引擎中进行搜索;第三种,接收用户输入的一段哼唱音频,例如用户自己哼唱的一段喜欢的音乐,则智能电视在与哼唱音频对应的搜索引擎中进行搜索。可以看出,智能电视在搜索歌曲之前,首先需要对接收到的音频数据进行分类,以确定该音频数据属于语音搜歌音频、录音音频、还是哼唱音频等,然后才能在与音频数据类型对应的搜索引擎中进行搜索,以及将搜索结果返回给用户。然而,由于语音搜歌音频和哼唱音频通常即为相似,现有的音频数据分类方法,对语音搜歌音频和哼唱音频分类的准确率较低。
技术实现思路
本专利技术实施例提供一种音频分类方法及装置,用以解决现有技术中音频分类的准确率较低的问题。本专利技术实施例提供一种音频分类方法,包括:根据收集的训练数据,基于深度神经网络训练得到音频分类模型;对音频数据提取音频特征;将所述音频特征输入所述音频分类模型,输出得到所述音频数据的分类结果;所述分类结果包括:录音音频、语音搜歌音频和哼唱音频。本专利技术实施例还提供一种音频分类装置,包括:训练模块,用于根据收集的训练数据,基于深度神经网络训练得到音频分类模型;第一提取模块,用于对音频数据提取音频特征;输出模块,用于将所述音频特征输入所述音频分类模型,输出得到所述音频数据的分类结果;所述分类结果包括:录音音频、语音搜歌音频和哼唱音频。本专利技术实施例提供一种音频分类方法及装置,本专利技术实施例能够根据训练数据得到基于深度神经网络的音频分类模型,并对音频数据提取音频特征,以及通过所述音频分类模型以及所述音频特征对所述音频数据进行分类。由于深度神经网络能够较好的模拟人类的思考能力,因此,通过基于深度神经网络的音频分类模型能够很好的区分音频数据,尤其对于有效时长较短的哼唱音频与语音搜歌音频的区分准确率较高,因此,本专利技术实施例可以解决现有技术中对哼唱音频和语音搜歌音频之间的分类正确率较低的问题,提高音频分类的准确率,进而可以提高搜索歌曲的准确率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出了本专利技术的一种音频分类方法实施例一的步骤流程图;图2示出了本专利技术的一种音频分类方法实施例二的步骤流程图;图3示出了本专利技术的一种音频分类方法实施例三的步骤流程图;图4示出了本专利技术的一种多层深度神经网络模型的示意图;图5示出了本专利技术的一种音频分类方法实施例四的步骤流程图;图6示出了本专利技术的一种音频分类方法实施例五的步骤流程图;图7示出了本专利技术的一种音频分类装置实施例的结构框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。方法实施例一参照图1,示出了本专利技术的一种音频分类方法实施例一的步骤流程图,具体可以包括:步骤101、根据收集的训练数据,基于深度神经网络训练得到音频分类模型;步骤102、对音频数据提取音频特征;步骤103、将所述音频特征输入所述音频分类模型,输出得到所述音频数据的分类结果;所述分类结果包括:录音音频、语音搜歌音频和哼唱音频。本专利技术实施例可用于通过智能终端对音频数据进行分类。具体地,首先可以在智能终端根据收集到的训练数据训练得到基于深度神经网络的音频分类模型,然后对需要进行分类的音频数据提取音频特征,最后将提取的音频特征输入预置的分类模型,通过所述分类模型对音频特征进行分析处理,即可输出得到所述音频数据对应的分类结果。例如,输出的分类结果具体可以包括:录音音频、语音搜歌音频、哼唱音频等。其中,所述智能终端具体可以包括智能手机、平板电脑、智能电视等各种形式的终端设备,本专利技术实施例对于智能终端的具体形式不加以限制。为便于描述,本专利技术实施例均以智能电视为例进行说明,其它应用场景相互参照即可。所述预置的分类模型为根据收集的不同类型音频的训练数据训练得到。在本专利技术实施例中,使用基于DNN(DeepNeuralNetworks,深度神经网络)的分类模型作为预置的音频分类模型。需要说明的是,神经网络是一种模拟人脑的神经网络,可以理解的,人脑的认知过程是一个深度多层复杂的过程,每深入一层就多一层抽象。而基于DNN的深度学习算法,使得至少具有7层的神经网络的训练成为可能,由于DNN能够较好地模拟人脑神经元多层深度传递的过程,因而在解决一些复杂问题的时候有着非常明显的突破性的表现。在本专利技术的一种应用实施例中,所述方法还可以包括如下步骤:在与所述分类结果对应的搜索引擎中搜索得到所述音频数据的相关资源。在得到所述音频数据对应的分类结果后,可以将所述音频数据输入到与所述分类结果对应的搜索引擎,例如,在确定所述音频数据对应的分类结果为录音音频时,可以在音乐录音识别引擎中搜索所述音频数据;在确定所述音频数据对应的分类结果为语音搜歌音频时,可以在语音搜歌引擎中搜索所述音频数据;在确定所述音频数据对应的分类结果为哼唱音频时,可以在哼唱搜歌引擎中搜索所述音频数据等,以及向用户返回期望的搜索结果。这样,在实际应用中,就可以通过在智能终端设置一个录音按钮来实现多种音频类型的歌曲搜索功能。例如,在点击该录音按钮后,可以录入用于搜索的音频数据,如用户说的一段语音搜歌音频、或者用户录制的一段录音音频、或者用户哼唱的一段哼唱音频等,对录入的音频数据提取音频特征并且输入预置的本文档来自技高网...

【技术保护点】
一种音频分类方法,其特征在于,所述方法包括:根据收集的训练数据,基于深度神经网络训练得到音频分类模型;对音频数据提取音频特征;将所述音频特征输入所述音频分类模型,输出得到所述音频数据的分类结果;所述分类结果包括:录音音频、语音搜歌音频和哼唱音频。

【技术特征摘要】
1.一种音频分类方法,其特征在于,所述方法包括:
根据收集的训练数据,基于深度神经网络训练得到音频分类模型;
对音频数据提取音频特征;
将所述音频特征输入所述音频分类模型,输出得到所述音频数据的分类
结果;所述分类结果包括:录音音频、语音搜歌音频和哼唱音频。
2.根据权利要求1所述的方法,其特征在于,所述音频分类模型包括
至少一个分类子模型,且所述分类子模型与所述分类结果具有对应关系;
所述将所述音频特征输入所述音频分类模型,输出得到所述音频数据的分类
结果的步骤,包括:
将所述音频特征输入所述音频分类模型;
根据所述分类子模型计算得到所述音频特征的概率值;
将概率值最大的分类子模型对应的分类结果作为所述音频数据的分类结
果进行输出。
3.根据权利要求2所述的方法,其特征在于,所述将概率值最大的分类
子模型对应的分类结果作为所述音频数据的分类结果进行输出的步骤包括:
在所述音频数据的有效时长大于预设的有效时长门限时,将概率值最
大的分类子模型对应的分类结果作为所述音频数据的分类结果进行输出;
在所述音频数据对应的有效时长小于或等于预设的有效时长门限时,执
行以下步骤:
若哼唱音频对应的后验概率值大于预设的哼唱音频门限,则确定所述音
频数据为哼唱音频,若否,则确定所述音频数据为录音音频或者语音搜歌音
频。
4.根据权利要求1所述的方法,其特征在于,所述根据收集的训练数据,
基于深度神经网络训练得到音频分类模型的步骤,包括:
收集训练数据;其中,所述训练数据包括:录音音频、语音搜歌音频和

\t哼唱音频;
对所述训练数据提取音频特征;
根据提取的音频特征,基于深度神经网络训练得到音频分类模型。
5.根据权利要求4所述的方法,其特征在于,所述训练数据还包括:噪
声音频和静音音频。
6.根据权利要求1至5任一所述的方法,其特征在于,所述音频特征包
括:梅尔倒谱系数特征和基频特征;通过如下步骤提取所述音频特征:
提取所述音频数据/训练数据对应的梅尔倒谱系数特征和基频特征;
对所述梅尔倒谱系数特征进行一阶差分和二阶差分计算,得到多维梅尔
倒谱系数特征;
对所述基频特征进行一阶差分和二阶差分计算,得到多维基频特征;
依据所述多维梅尔倒谱系数特征和多维基频特征,确定所述音频数据/训
练...

【专利技术属性】
技术研发人员:张利
申请(专利权)人:乐视控股北京有限公司乐视致新电子科技天津有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1