音频数据处理方法及系统技术方案

技术编号:15705546 阅读:221 留言:0更新日期:2017-06-26 14:16
本发明专利技术提供了一种音频数据处理方法,由音频输入端执行,方法包括:歌曲的音频录制中获取输入的实时音频数据段;根据实时音频数据段定位歌曲对应的参考采样点,参考采样点是根据针对歌曲输入的所有原始音频数据选取得到的;读取参考采样点根据所有原始音频数据得到的平均能量值;通过实时音频数据段的能量值和平均能量值运算得到增益因子;按照增益因子对实时音频数据段进行增益处理,以得到完成能量调整的歌曲音频数据段。此外,还提供了一种音频数据处理系统。上述音频数据处理方法及系统能为音频的输入进行动态增益处理。

Audio data processing method and system

The present invention provides a method of processing audio data, execution by the audio input method includes: obtaining the real-time audio data input audio recording songs; according to the real-time audio data segment positioning songs corresponding reference sampling points, sampling reference point is based on all of the original audio data input by selecting needle song antiphonal singing; read reference sampling points according to the average energy of all the original audio data obtained to calculate the gain factor value; through the real-time audio data section of the energy value and the average value of energy; according to the gain factor gain processing of real-time audio data, in order to get the song audio segment to complete energy adjustment. In addition, an audio data processing system is also provided. The audio data processing method and system can perform dynamic gain processing for audio input.

【技术实现步骤摘要】
音频数据处理方法及系统
本专利技术涉及多媒体处理
,特别涉及一种音频数据处理方法及系统。
技术介绍
随着互联网应用中媒体应用的发展,媒体录制应用可包括但不限于:基于社交网络的音频录制应用等等,例如,该媒体录制应用可以是基于社交网络的K歌应用。在媒体录制应用的运行中,常会因为麦克风的音量大小不一或人声距离话筒的远近不一等问题导致输入的音频音量忽高忽低,进而在与伴奏混合后出现和音不和谐等音质的缺陷。现有的解决方案中,包括对录制人声所得到的音频数据进行离线处理,或者通过在线实时处理的方式对音频数据进行实时增益处理。一方面的,对于音频数据的离线处理,则是为整首,通过遍历和音后,根据和音中音频数据和伴奏的整体能量比值获取增益因子,从而实现音频数据的离线增益处理。但现有的录制过程大都具备实时耳返功能,即用户在录制的同时就能够听到返回的和音,这种情况下,离线处理方式就不再适用。另一方面的,通过在线处理的方式对录制的音频数据进行实时增益处理中,根据录制的一段人声所得到的音频数据计算实际能量值,然后根据该实际能量值与固定能量值之间的比值即可得到增益因子。但由于在计算增益因子时使用的是固定能量值,因而,使得录制得到的音频数据经音频增益处理后的输出能量值被固定于同一能量水平,无法适用于整个歌曲的能量变化。
技术实现思路
基于此,有必要提供一种音频数据处理方法,以解决现有技术中在线音频增益处理中输出的能量值被固定于同一能量水平的技术问题,本方法能够为音频的输入进行动态增益处理。此外,还有必要提供一种音频数据处理系统,以解决现有技术中在线音频增益处理中输出的能量值被固定于同一能量水平的技术问题,本方法能够为音频的输入进行动态增益处理。为解决上述技术问题,将采用如下技术方案:一种音频数据处理方法,所述方法包括:歌曲的音频录制中获取输入的实时音频数据段;根据所述实时音频数据段定位所述歌曲对应的参考采样点,所述参考采样点是根据针对所述歌曲输入的所有原始音频数据选取得到的;读取所述参考采样点根据所述所有原始音频数据得到的平均能量值;通过所述实时音频数据段的能量值和所述平均能量值运算得到增益因子;按照所述增益因子对所述实时音频数据段进行增益处理,以得到完成能量调整的歌曲音频数据段。一种音频数据处理系统,包括:音频数据获取模块,用于歌曲的音频录制中获取输入的实时音频数据段;采样点定位模块,用于根据所述实时音频数据段定位所述歌曲对应的参考采样点,以得到所述实时音频数据段对应的参考采样点,所述参考采样点是根据针对所述歌曲输入的所有原始音频数据选取得到的;能量读取模块,用于读取所述参考采样点根据所述所有原始音频数据得到的平均能量值;增益因子运算模块,用于通过所述实时音频数据段的能量值和所述平均能量值运算得到增益因子;能量调整模块,用于按照所述增益因子对所述实时音频数据段进行增益处理,以得到完成能量调整的歌曲音频数据段。由上述技术方案可知,所用户进行的歌曲录制中,针对录制的歌曲,将获取到输入的实时音频数据段,首先为此实时音频数据段定位其歌曲对应的参考采样点,并读取该参考采样点所对应的平均能量值,由实时音频数据段的能量值和平均能量值运算得到增益因子,通过运算得到的增益因子对歌曲录制中输入的实时音频数据段进行能量调整,并且在用户录制歌曲而输入下一实时音频数据段时,仍然会进行增益因子的动态运算,换而言之,在进行实时增益处理时,使用的平均能量值并不是一固定不变的,完成能量调整的歌曲音频数据段能够适用于整个歌曲的能量变化,从而达到对音频的输入进行动态增益处理的目的。附图说明图1是一个实施例中音频数据处理方法的流程图;图2是一个实施例中按照增益因子对实时音频数据段进行增益处理,以得到完成能量调整的歌曲音频数据段的步骤的流程图;图3是一个实施例中运算实时音频数据段的能量值与增益因子之间的乘积值,将乘积值置为输出能量值的步骤的流程图;图4是一个实施例中针对可供进行音频数据处理的多个歌曲,分别根据针对歌曲输入的所有原始音频数据进行采样点的选取,以得到歌曲对应的多个参考采样点的步骤的流程图;图5是一个实施例中根据预置的采样点在所有有效音频数据中的覆盖率从采样点中筛选得到歌曲对应的多个参考采样点的步骤的流程图;图6是一个实施例中读取参考采样点根据所有原始音频数据得到的平均能量值的步骤之前的步骤的流程图;图7是一个实施例中通过分别对每一原始音频数据进行的端点检测得到歌曲对应的所有有效音频数据的步骤的流程图;图8是一个实施例中四门限能量包络曲线和四门限参数示意图;图9是一个实施例中四门限检测状态跳转示意图;图10是一个实施例中音频数据处理系统的结构示意图;图11是一个实施例中能量调整模块的结构示意图;图12是一个实施例中能量计算单元的结构示意图;图13是一个实施例中采样点选取模块的结构示意图;图14是一个实施例中采样点筛选单元的结构示意图;图15是一个实施例中能量读取模块的结构示意图;图16是一个实施例中服务器结构示意图。具体实施方式体现本专利技术特征与优点的典型实施方式将在以下的说明中详细叙述。应理解的是本专利技术能够在不同的实施方式上具有各种的变化,其皆不脱离本专利技术的范围,且其中的说明及图示在本质上是当作说明之用,而非用以限制本专利技术。在一个实施例中,提供了一种音频数据处理方法,如图1所示,包括:步骤110,歌曲的音频录制中获取输入的实时音频数据段。歌曲的音频录制是任一运行的媒体录制应用所执行的,该媒体录制应用内置了各种歌曲信息以及每一歌曲信息所对应的伴奏数据,以为用户的音频录制提供可选取的歌曲,并且也可用以实现和声音效的伴奏数据的选取。例如,该媒体录制应用是基于社交网络,且具备歌曲音频录制以及和声音效功能的终端应用,任意用户都能够通过该媒体录制应用触发进行音频录制,采样此人声以得到相应的实时音频数据段。步骤130,根据实时音频数据段定位歌曲对应的参考采样点,参考采样点是根据针对歌曲输入的所有原始音频数据选取得到的。原始音频数据是指用户运行此媒体录制应用演唱歌曲的清唱数据,还可以是通过其它方式所搜集得到的演唱歌曲的清唱数据。因而,媒体录制应用中可供进行音频录制的歌曲均有对应的原始音频数据。另外,媒体录制应用的用户是在不断增长的,并且通过不断的数据积累,所得到的每一歌曲对应的所有原始音频数据将是海量用户输入的清唱数据。歌曲通常使用的是数字信号形式,即对歌曲的模拟信号根据预设的采样率进行采样后得到,例如,所使用的采样率可以是8K或16K。以针对该歌曲输入的所有原始音频数据为依据,从歌曲对应的采样点中选取若干采样点作为参考采样点。又实时音频数据段是随着用户所进行的歌曲演唱而不断获取得到的,因此,可根据实时音频数据段包含的时间信息获取其对应的参考采样点。在一个实施例中,歌曲对应的参考采样点可记为{k1,…,kN},其中,km表示歌曲对应的第km个参考采样点,km=1,…,N。步骤150,读取参考采样点根据所有原始音频数据得到的平均能量值。歌曲是通过节奏的快慢起伏、音量的高低强弱来表现不同的情感,因此,任意歌曲的演唱都会呈现出能量趋势的变化,即歌曲对应的采样点中,某些采样点的在原始音频数据中对应的能量值较低,而某些采样点在原始音频数据中对应的能量值较高。以歌曲的所有原始音频数本文档来自技高网...
音频数据处理方法及系统

【技术保护点】
一种音频数据处理方法,其特征在于,所述方法包括:歌曲的音频录制中获取输入的实时音频数据段;根据所述实时音频数据段定位所述歌曲对应的参考采样点,所述参考采样点是根据针对所述歌曲输入的所有原始音频数据选取得到的;读取所述参考采样点根据所述所有原始音频数据得到的平均能量值;通过所述实时音频数据段的能量值和所述平均能量值运算得到增益因子;按照所述增益因子对所述实时音频数据段进行增益处理,以得到完成能量调整的歌曲音频数据段。

【技术特征摘要】
1.一种音频数据处理方法,其特征在于,所述方法包括:歌曲的音频录制中获取输入的实时音频数据段;根据所述实时音频数据段定位所述歌曲对应的参考采样点,所述参考采样点是根据针对所述歌曲输入的所有原始音频数据选取得到的;读取所述参考采样点根据所述所有原始音频数据得到的平均能量值;通过所述实时音频数据段的能量值和所述平均能量值运算得到增益因子;按照所述增益因子对所述实时音频数据段进行增益处理,以得到完成能量调整的歌曲音频数据段。2.根据权利要求1所述的方法,其特征在于,所述按照所述增益因子对所述实时音频数据段进行增益处理,以得到完成能量调整的歌曲音频数据段的步骤包括:运算所述实时音频数据段的能量值与所述增益因子之间的乘积值,将所述乘积值置为输出能量值;按照所述输出能量值进行所述实时音频数据段的能量调整,以得到所述完成能量调整的歌曲音频数据段。3.根据权利要求2所述的方法,其特征在于,所述运算所述实时音频数据段的能量值与所述增益因子之间的乘积值,将所述乘积值置为输出能量值的步骤包括:平滑处理所述增益因子得到多个渐近增益因子;分别运算所述实时音频数据段的能量值与多个所述渐近增益因子之间的乘积值,以得到多个输出能量值,所述多个输出能量值分别与所述实时音频数据段对应的参考采样点以及所述参考采样点关联的多个采样点相对应。4.根据权利要求1所述的方法,其特征在于,由服务器执行,所述根据所述实时音频数据段定位所述歌曲对应的参考采样点,以得到所述实时音频数据段对应的参考采样点的步骤之前,所述方法还包括:针对可供进行音频数据处理的多个歌曲,分别根据针对歌曲输入的所有原始音频数据进行采样点的选取,以得到所述歌曲对应的多个参考采样点。5.根据权利要求4所述的方法,其特征在于,所述针对可供进行音频数据处理的多个歌曲,分别根据针对歌曲输入的所有原始音频数据进行采样点的选取,以得到所述歌曲对应的多个参考采样点的步骤包括:根据可供进行音频数据处理的多个歌曲,分别查找针对所述歌曲输入的所有原始音频数据;通过分别对每一原始音频数据进行的端点检测得到所述歌曲对应的所有有效音频数据;根据预置的采样点在所有有效音频数据中的覆盖率从所述采样点中筛选得到所述歌曲对应的多个参考采样点。6.据权利要求5所述的方法,其特征在于,所述根据预置的采样点在所有有效音频数据中的覆盖率从所述采样点中筛选得到所述歌曲对应的多个参考采样点的步骤包括:根据预置的采样点在有效音频数据中的覆盖率从所述采样点中筛选得到有效采样点;根据预置时间间隔从所述有效采样点中提取所述歌曲对应的多个参考采样点。7.根据权利要求6所述的方法,其特征在于,所述读取所述参考采样点根据所述所有原始音频数据得到的平均能量值的步骤之前,所述方法还包括:在所述歌曲对应的多个参考采样点为每一参考采样点查找关联的其它有效采样点;按照所述参考采样点和所述关联的其它有效采样点提取所述有效音频数据对应的能量值;运算所述能量值的平均值,以得到所述参考采样点在所述所有有效音频数据中的平均能量值。8.根据权利要求2所述的方法,其特征在于,所述按照所述增益因子对所述实时音频数据段进行增益处理,以得到完成能量调整的歌曲音频数据段的步骤之前,所述方法还包括:判断...

【专利技术属性】
技术研发人员:傅鸿城
申请(专利权)人:广州酷狗计算机科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1