音频文件聚类方法及装置制造方法及图纸

技术编号:18426613 阅读:24 留言:0更新日期:2018-07-12 02:03
本公开是关于音频文件聚类方法及装置。该方法包括:获取多个音频文件;根据所述多个音频文件的特征,对所述多个音频文件进行聚类。该技术方案中,所有音频文件都可以按照特征进行聚类,这样,音频文件可以按特征进行分类存储,便于用户查找音频文件,提高用户体验。

Audio file clustering method and device

The present disclosure is a method and device for clustering audio files. The method comprises the following steps: acquiring a plurality of audio files, and clustering the plurality of audio files according to the characteristics of the plurality of audio files. In this scheme, all audio files can be clustered according to the features. In this way, the audio files can be classified and stored according to the characteristics to facilitate the user to find the audio files and improve the user experience.

【技术实现步骤摘要】
音频文件聚类方法及装置
本公开涉及计算机领域,尤其涉及音频文件聚类方法及装置。
技术介绍
目前,终端不仅仅可以作为一个娱乐通信的设备,还可以作为一个存储设备,特别是存储用户的照片。目前照片可以制作有声照片,即在拍摄照片的同时或者之后可以录制一段声音作为纪念,这样,该照片和声音作为一个整体文件存储,该文件只是会按照片的时间进行存储,用户只能手动为文件进行分类。
技术实现思路
本公开实施例提供音频文件聚类方法及装置。所述技术方案如下:根据本公开实施例的第一方面,提供一种音频文件聚类方法,包括:获取多个音频文件;根据所述多个音频文件的特征,对所述多个音频文件进行聚类。本公开的实施例提供的技术方案可以包括以下有益效果:所有音频文件都可以按照特征进行聚类,这样,音频文件可以按特征进行分类存储,便于用户查找音频文件,提高用户体验。在一个实施例中,所述根据所述多个音频文件的特征,对所述多个音频文件进行聚类包括:获取各音频文件的特征;对比所述各音频文件的特征,将具有相同预设特征的音频文件聚合在同一文件夹中。在一个实施例中,所述特征是频谱,所述对比所述各音频文件的特征,将具有相同预设特征的音频文件聚合在同一文件夹中包括:根据所述各音频文件的频谱,将所述各音频文件分类;将同一类型的音频文件聚合到同一文件夹中。在一个实施例中,所述特征是时长,所述对比各音频文件的特征,将具有相同预设特征的音频文件聚合在同一文件夹中包括:确定时长属于同一预设时长范围的音频文件为同一类型;将所述时长属于同一预设时长范围的音频文件聚合到同一文件夹中。在一个实施例中,所述方法还包括:对所述多个音频文件进行时域采样,得到采样结果;根据所述采样结果和预设神经网络,对所述多个音频文件进行分类;所述预设神经网络是根据音频文件样本训练得到的。在一个实施例中,从所述各音频文件的频谱中获取基频;根据所述基频,将所述各音频文件分为男性类和女性类;其中,所述男性类的音频文件包括基频在预设男性基频范围内的音频文件,所述女性类的音频文件包括基频在预设女性基频范围内的音频文件。在一个实施例中,所述特征是音频文件的频谱的谐波强度;所述根据所述音频文件的频谱,将音频文件分类包括:从所述各音频文件的频谱中获取谐波强度;根据频谱的谐波强度,将谐波强度在预设谐波强度范围内的频谱文件聚合到同一文件夹中。根据本公开实施例的第二方面,提供一种音频文件聚类装置,包括:获取模块,用于获取多个音频文件;聚类模块,用于根据所述多个音频文件的特征,对所述多个音频文件进行聚类。在一个实施例中,所述聚类模块包括:获取子模块,用于获取各音频文件的特征;对比子模块,用于对比所述各音频文件的特征,将具有相同预设特征的音频文件聚合在同一文件夹中。在一个实施例中,所述特征是频谱,所述对比子模块包括:分类单元,用于根据所述各音频文件的频谱,将所述各音频文件分类;第一设置单元,用于将同一类型的音频文件聚合到同一文件夹中。在一个实施例中,所述特征是时长,所述对比子模块包括:确定单元,用于确定时长属于同一预设时长范围的音频文件为同一类型;第二设置单元,用于将所述时长属于同一预设时长范围的音频文件聚合到同一文件夹中。在一个实施例中,所述装置还包括:采样模块,用于对所述多个音频文件进行时域采样,得到采样结果;处理模块,用于根据所述采样结果和预设神经网络,对所述多个音频文件进行分类;所述预设神经网络是根据音频文件样本训练得到的。在一个实施例中,所述特征是音频文件的频谱的基频;所述分类子模块包括:第一获取单元,用于从所述各音频文件的频谱中获取基频;分割单元,用于根据所述基频,将所述各音频文件分为男性类和女性类;其中,所述男性类的音频文件包括基频在预设男性基频范围内的音频文件,所述女性类的音频文件包括基频在预设女性基频范围内的音频文件。在一个实施例中,所述特征是音频文件的频谱的谐波强度;所述根据所述音频文件的频谱,将音频文件分类包括:第二获取单元,用于从所述各音频文件的频谱中获取谐波强度;划分单元,用于根据频谱的谐波强度,将谐波强度在预设谐波强度范围内的频谱文件聚合到同一文件夹中。根据本公开实施例的第三方面,提供一种音频分类装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:获取多个音频文件;根据所述多个音频文件的特征,对所述多个音频文件进行聚类。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。图1是根据一示例性实施例示出的音频文件聚类方法的流程图。图2是根据一示例性实施例示出的音频文件聚类方法的流程图。图3是根据一示例性实施例示出的音频文件聚类方法的流程图。图4是根据一示例性实施例示出的音频文件聚类方法的流程图。图5是根据一示例性实施例示出的音频文件聚类方法的流程图。图6是根据一示例性实施例示出的音频文件聚类方法的流程图。图7是根据一示例性实施例示出的音频文件聚类方法的流程图。图8是根据一示例性实施例示出的音频文件聚类装置的框图。图9是根据一示例性实施例示出的音频文件聚类装置的框图。图10是根据一示例性实施例示出的音频文件聚类装置的框图。图11是根据一示例性实施例示出的音频文件聚类装置的框图。图12是根据一示例性实施例示出的音频文件聚类装置的框图。图13是根据一示例性实施例示出的音频文件聚类装置的框图。图14是根据一示例性实施例示出的音频文件聚类装置的框图。图15是根据一示例性实施例示出的音频文件聚类装置的框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。图1是根据一示例性实施例示出的一种音频文件聚类方法的流程图,如图1所示,音频文件聚类方法用于音频分类装置中,该方法可以包括以下步骤101-102:在步骤101中,获取多个音频文件。这里,音频文件可以从存储音频文件的设备或装置获取。在步骤102中,根据多个音频文件的特征,对多个音频文件进行聚类。音频文件的特征可以包括音频文件的频谱、时长、基频及频谱的谐波强度等。时长是指音频文件的播放时长。这里,聚类是将物理或抽象对象的集合分成由类似的对象组成的多个类的过程。由聚类所生成的一类是一组数据对象的集合,这些数据对象与同一个类中的对象彼此相似,与其他类中的对象相异。本实施例中聚类为一类的音频文件具有相似或相同的特征。在一个实施例中,如图2所示,步骤102,即根据多个音频文件的特征,对多个音频文件进行聚类,可以包括:在步骤1021中,获取各音频文件的特征。从音频文件中获取所需特征。在步骤1022中,对比装置各音频文件的特征,将具有相同预设特征的音频文件聚合在同一文件夹中。以特征是时长为例,相同预设特征是预设时长范围。时长在预设时长范围的音频文件聚合在一个文件夹。这里的预设特征是用户设置的。在一个实施例中,当特征是频谱时,如图3所示,步骤1022本文档来自技高网...

【技术保护点】
1.一种音频文件聚类方法,其特征在于,包括:获取多个音频文件;根据所述多个音频文件的特征,对所述多个音频文件进行聚类。

【技术特征摘要】
1.一种音频文件聚类方法,其特征在于,包括:获取多个音频文件;根据所述多个音频文件的特征,对所述多个音频文件进行聚类。2.根据权利要求1所述的方法,其特征在于,所述根据所述多个音频文件的特征,对所述多个音频文件进行聚类包括:获取各音频文件的特征;对比所述各音频文件的特征,将具有相同预设特征的音频文件聚合在同一文件夹中。3.根据权利要求2所述的方法,其特征在于,所述特征是频谱,所述对比所述各音频文件的特征,将具有相同预设特征的音频文件聚合在同一文件夹中包括:根据所述各音频文件的频谱,将所述各音频文件分类;将同一类型的音频文件聚合到同一文件夹中。4.根据权利要求2所述的方法,其特征在于,所述特征是时长,所述对比各音频文件的特征,将具有相同预设特征的音频文件聚合在同一文件夹中包括:确定时长属于同一预设时长范围的音频文件为同一类型;将所述时长属于同一预设时长范围的音频文件聚合到同一文件夹中。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述多个音频文件进行时域采样,得到采样结果;根据所述采样结果和预设神经网络,对所述多个音频文件进行分类;所述预设神经网络是根据音频文件样本训练得到的。6.根据权利要求3所述的方法,其特征在于,所述特征是音频文件的频谱的基频;所述根据所述音频文件的频谱,将音频文件分类包括:从所述各音频文件的频谱中获取基频;根据所述基频,将所述各音频文件分为男性类和女性类;其中,所述男性类的音频文件包括基频在预设男性基频范围内的音频文件,所述女性类的音频文件包括基频在预设女性基频范围内的音频文件。7.根据权利要求3所述的方法,其特征在于,所述特征是音频文件的频谱的谐波强度;所述根据所述音频文件的频谱,将音频文件分类包括:从所述各音频文件的频谱中获取谐波强度;根据频谱的谐波强度,将谐波强度在预设谐波强度范围内的频谱文件聚合到同一文件夹中。8.一种音频文件聚类装置,其特征在于,包括:获取模块,用于获取多个音频文件;聚类模块,用于根据所述多个音频文件的特征,对所述多个音频文件进行聚类。9.根据权利要求8...

【专利技术属性】
技术研发人员:龙飞
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1