一种音频文件的处理方法及装置制造方法及图纸

技术编号:10509304 阅读:112 留言:0更新日期:2014-10-08 12:11
本发明专利技术实施例提供一种音频文件的处理方法及装置,其中的方法可包括:构建待处理的音频文件的特征参数序列;计算所述特征参数序列的统计特征值;根据所述特征参数序列的统计特征值,确定所述音频文件的类别。本发明专利技术可降低音频文件的处理成本,提高处理效率,提升智能性。

【技术实现步骤摘要】
一种音频文件的处理方法及装置
本专利技术涉及互联网
,具体涉及音频处理
,尤其一种音频文件的 处理方法及装置。
技术介绍
音频文件可以划分为音乐类别和语音类别,音乐类别的音频文件可指包含乐器音 的音频文件,例如:纯乐器所演奏的音乐、包含乐器音的歌曲等等;语音类别的音频文件可 指不包含乐器音的音频文件,例如:纯说话的声音、无乐器参与的清唱歌曲等等。传统的对 音频文件的处理方式通常为人工方式,即需要人工收听音频文件的内容,以确定音频文件 的类别;此种处理方式的人力资源成本较高、处理效率较低、智能性较低。
技术实现思路
本专利技术实施例提供一种音频文件的处理方法及装置,可降低音频文件的处理成 本,提高处理效率,提升智能性。 本专利技术第一方面提供一种音频文件的处理方法,可包括: 构建待处理的音频文件的特征参数序列; 计算所述特征参数序列的统计特征值; 根据所述特征参数序列的统计特征值,确定所述音频文件的类别。 本专利技术第二方面提供一种音频文件的处理装置,可包括: 构建待处理的音频文件的特征参数序列; 计算所述特征参数序列的统计特征值; 根据所述特征参数序列的统计特征值,确定所述音频文件的类别。 实施本专利技术实施例,具有如下有益效果: 本专利技术实施例通过构建待处理的音频文件的特征参数序列,计算特征参数序列的 统计特征值,从而可基于统计特征值确定音频文件的类别;由于基于音频文件的特征参数 自动进行音频文件的类别确定处理,避免了人工方式所带来的资源耗费,降低了音频文件 的处理成本,有效地提高了处理效率,提升了智能性。 【附图说明】 为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。 图1为本专利技术实施例提供的一种音频文件的处理方法的流程图; 图2为本专利技术实施例提供的另一种音频文件的处理方法的流程图; 图3为本专利技术实施例提供的又一种音频文件的处理方法的流程图; 图4为本专利技术实施例提供的又一种音频文件的处理方法的流程图; 图5为本专利技术实施例提供的又一种音频文件的处理方法的流程图; 图6为本专利技术实施例提供的一种音频文件的处理装置的结构示意图; 图7a为本专利技术实施例提供的构建模块的一个实施例的结构示意图; 图7b为本专利技术实施例提供的处理模块的一个实施例的结构示意图; 图8a为本专利技术实施例提供的构建模块的另一个实施例的结构示意图; 图8b为本专利技术实施例提供的处理模块的另一个实施例的结构示意图; 图9a为本专利技术实施例提供的构建模块的又一个实施例的结构示意图; 图9b为本专利技术实施例提供的处理模块的又一个实施例的结构示意图; 图10为本专利技术实施例提供的构建模块的又一个实施例的结构示意图。 【具体实施方式】 下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于 本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本专利技术保护的范围。 本专利技术实施例中,音频文件可以包括但不限于:歌曲、歌曲片段、清唱歌曲、清唱歌 曲片段、音乐、音乐片段、演奏乐、演奏乐片段、语音片段等文件。本专利技术实施例的音频文件 的处理方案可以应用于互联网领域的多个场景中,例如:可以应用于查询互联网音频库中 是否存在清唱文件的场景;或者,可以应用于对未知的音频文件进行分析,判断是否存在 假的音乐(即确定是否为语音类别的音频文件,或者确定既非语音类别又非音乐类别的音 频文件)的场景;或者,可结合即时通信应用,分析通过即时通信应用等提供的输入接口所 输入的音频文件的类别的场景,并可进一步应用地对识别到的音频文件进行乐曲匹配的人 机互动场景;或者,可应用于音频文件的分类搜索,以提升搜索的效率和匹配度的场景;或 者,可应用于对不同类别的音频文件进行不同的音效处理的场景,等等。 下面将结合附图1-附图5,对本专利技术实施例提供的音频文件的处理方法进行详细 介绍。 请参见图1,为本专利技术实施例提供的一种音频文件的处理方法的流程图;该方法 可包括以下步骤S101-步骤S103。 S101,构建待处理的音频文件的特征参数序列。 所述特征参数序列可包括但不限于:过零率序列、频谱质心序列和频率序列中的 至少一种。一个音频文件包括至少一帧音频帧信号,该音频文件可看作为由该至少一帧音 频帧信号组成的帧序列;所述音频文件中各帧音频帧信号的顺序,即指各帧音频帧信号在 所述音频文件的帧序列中的顺序。 其中,过零率指一帧音频帧信号中符号变化的比率。将一个音频文件包括的至少 -帧音频帧信号中的各音频帧信号的过零率,按照所述音频文件中所述至少一帧音频帧信 号的顺序进行排列,即构成所述音频文件的过零率序列。 其中,频谱质心指反映一帧音频帧信号的频率特性的一个特征量。将一个音频文 件包括的至少一帧音频帧信号中的各音频帧信号的频谱质心,按照所述音频文件中所述至 少一帧音频帧信号的顺序进行排列,即构成所述音频文件的频谱质心序列。 其中,本实施例的音频文件中每秒存在4次清浊音交替变换,因此可认为该音频 文件的清浊音交替的频率为4Hz,周期为ls/4=0. 25s。频率序列此处又可称为4Hz频率序 列,可反映音频文件中的清浊音交替变换情况。 S102,计算所述特征参数序列的统计特征值。 其中,所述特征参数序列的统计特征值可包括但不限于:均值和/或标准差。需要 说明的是,如果所述特征参数序列为过零率序列,本步骤计算所述过零率序列的标准差;如 果所述特征参数序列为频谱质心序列,本步骤计算所述频谱质心序列的均值;如果所述特 征参数序列为频率序列,本步骤计算所述频率序列的均值。当然,如果所述特征参数序列为 所述过零率序列、频谱质心序列和频率序列中的两种或多种组合,本步骤则分别计算各序 列相应的统计特征值。 S103,根据所述特征参数序列的统计特征值,确定所述音频文件的类别。 其中,所述音频文件的类别可包括音乐类别或语音类别;音乐类别的音频文件可 指包含乐器音的音频文件,可以包括但不限于:纯乐器所演奏的音乐、包含乐器音的歌曲等 等;语音类别的音频文件可指不包含乐器音的音频文件,可包括但不限于:纯说话的声音、 无乐器参与的清唱歌曲等等。特征参数序列的统计特征值,可在一定程度上反应音频文件 的类别特性,例如:由于语音类别的音频文件中清浊音的交替变化相对于音乐类别的音频 文件中清浊音的交替变化更为频繁,因此语音类别的音频文件中各帧音频帧信号的符号变 化的比率较大,而音乐类别的音频文件中各帧音频帧信号的符号变化的比率更小,本步骤 中,如果某音频文件的过零率序列的标准差较大,则可确定该音频文件的类别为语音类别, 反之,可确定该音频文件的类别为音乐类别;再如:由于音乐类别的音频文件中各帧音频 帧信号本文档来自技高网...

【技术保护点】
一种音频文件的处理方法,其特征在于,包括;构建待处理的音频文件的特征参数序列;计算所述特征参数序列的统计特征值;根据所述特征参数序列的统计特征值,确定所述音频文件的类别。

【技术特征摘要】
1. 一种音频文件的处理方法,其特征在于,包括; 构建待处理的音频文件的特征参数序列; 计算所述特征参数序列的统计特征值; 根据所述特征参数序列的统计特征值,确定所述音频文件的类别。2. 如权利要求1所述的方法,其特征在于,所述特征参数序列包括:过零率序列、频谱 质心序列和频率序列中的至少一种; 所述统计特征值包括:均值和/或标准差; 所述音频文件的类别包括:语音类别或音乐类别。3. 如权利要求2所述的方法,其特征在于,所述特征参数序列包括:过零率序列; 所述构建待处理的音频文件的特征参数序列,包括: 计算所述音频文件包含的每一帧音频帧信号的过零率; 按照所述音频文件中各帧音频帧信号的顺序,构建所述音频文件的过零率序列。4. 如权利要求3所述的方法,其特征在于,所述统计特征值为:标准差; 所述根据所述特征参数序列的统计特征值,确定所述音频文件的类别,包括: 判断所述过零率序列的标准差是否大于预设第一阈值; 如果所述过零率序列的标准差大于预设第一阈值,确定所述音频文件的类别为语音类 别; 如果所述过零率序列的标准差小于或等于预设第一阈值,确定所述音频文件的类别为 音乐类别。5. 如权利要求2所述的方法,其特征在于,所述特征参数序列包括:频谱质心序列; 所述构建待处理的音频文件的特征参数序列,包括: 计算所述音频文件包含的每一帧音频帧信号的频谱质心; 按照所述音频文件中各帧音频帧信号的顺序,构建所述音频文件的频谱质心序列。6. 如权利要求5所述的方法,其特征在于,所述统计特征值为:均值; 所述根据所述特征参数序列的统计特征值,确定所述音频文件的类别,包括: 判断所述频谱质心序列的均值是否小于预设第二阈值; 如果所述频谱质心序列的均值小于预设第二阈值,确定所述音频文件的类别为语音类 别; 如果所述频谱质心序列的均值大于或等于预设第二阈值,确定所述音频文件的类别为 音乐类别。7. 如权利要求2所述的方法,其特征在于,所述特征参数序列包括:频率序列; 所述构建待处理的音频文件的特征参数序列,包括: 计算所述音频文件包含的每一帧音频帧信号的过零率; 按照所述音频文件中各帧音频帧信号的顺序,构建所述音频文件的过零率序列; 根据预设的帧间隔,对所述过零率序列进行滑动运算,获得所述音频文件的频率序列。8. 如权利要求2所述的方法,其特征在于,所述特征参数序列包括:频率序列; 所述构建待处理的音频文件的特征参数序列,包括: 计算所述音频文件包含的每一帧音频帧信号的频谱质心; 按照所述音频文件中各帧音频帧信号的顺序,构建所述音频文件的频谱质心序列; 根据预设的帧间隔,对所述频谱质心序列进行滑动运算,获得所述音频文件的频率序 列。9. 如权利要求7或8所述的方法,其特征在于,所述统计特征值为:均值; 所述根据所述特征参数序列的统计特征值,确定所述音频文件的类别,包括: 判断所述频率序列的均值是否大于预设第三阈值; 如果所述频率序列的均值大于预设第三阈值,确定所述音频文件的类别为语音类别; 如果所述频率序列的均值小于或等于预设第三阈值,确定所述音频文件的类别为音乐 类别。10. -种音频文件的处理装置,其特征在于,包括: 构建模块,用...

【专利技术属性】
技术研发人员:赵伟峰
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1