【技术实现步骤摘要】
一种音频分类方法、装置、电子设备及存储介质
本专利技术实施例涉及音频分类
,具体涉及一种音频分类方法、装置、电子设备及存储介质。
技术介绍
随着智能终端的广泛普及,例如,智能手机、平板电脑已经成为人们生活中的必需品。而且,随着生产智能手机的国内企业技术的不断成熟,现在的智能手机不仅物美价廉,智能手机的功能也越来越强大,从以前主要用于打电话和发短信,到现在还拥有播放音乐的功能,播放视频的功能,支付功能,拍照功能,阅读电子书的功能,上网功能。基于智能手机具有音乐播放器的功能,现在的智能手机上也有一些音频播放软件具有智能功能;向用户推送符合用户喜好类型的音频。首先,先要采集用户的历史收听音频数据,然后对采集到的音频数据进行分析,并根据分析结果将不同的音频分类至相应的类别中,例如,古典乐,流行音乐,或者摇滚音乐;最后,向用户推送与用户偏好度一致的相关联的音乐。但是,实际应用中,一些音频播放软件往往无法对大量的音频数据进行分类,更加无法实现对目标用户的精准推送。此外,对大量音频数据进行精准分析,并根据分析结果进行 ...
【技术保护点】
1.一种音频分类方法,其特征在于,包括:/n从音频频谱图中提取用于进行音频分类的音频特征;/n根据所述音频频谱图提取出的所述音频特征和音频类别标签作为训练数据,并基于卷积神经网络模型进行深度学习模型的模型训练,生成相应的训练模型;/n根据所述训练模型的各项参数计算音频各个特征的综合值;/n根据音频各个特征的综合值,将音频分类至相应的类别中。/n
【技术特征摘要】
1.一种音频分类方法,其特征在于,包括:
从音频频谱图中提取用于进行音频分类的音频特征;
根据所述音频频谱图提取出的所述音频特征和音频类别标签作为训练数据,并基于卷积神经网络模型进行深度学习模型的模型训练,生成相应的训练模型;
根据所述训练模型的各项参数计算音频各个特征的综合值;
根据音频各个特征的综合值,将音频分类至相应的类别中。
2.根据权利要求1所述的方法,其特征在于,所述从音频频谱图中提取用于进行音频分类的音频特征具体包括:
通过降维技术将音频特征向量映射到二维空间的平面图上。
3.根据权利要求2所述的方法,其特征在于,所述通过降维技术将音频特征向量映射到二维空间的平面图上具体包括:
通过离散傅里叶变换把音频信号转换到频域上,得到相应的频域信号;
根据相应的频域信号计算音频每个频率分量的幅值,得到相应的频率分量的幅值;
基于预设的幅值转换模型,根据相应的频率分量的幅值进行幅值转换,将音频特征向量映射到二维空间的平面图上。
4.根据权利要求1所述的方法,其特征在于,
采用Keras架构构建所述卷积神经网络模型;和/或,
采用TensorFlow架构构建所述卷积神经网络模型。
5.一种音频分类装置,其特征在于,包括:
提取模块,从音频频谱图中提取用于进行音频分类的音频特征;
训练模型生成模块,根据所述提取模块从所述音频频谱图提取出的所述音频特征和音频类别标签作为训练数据,并基于卷积神经...
【专利技术属性】
技术研发人员:李甫,
申请(专利权)人:量子云未来北京信息科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。