音频数据处理方法及系统技术方案

技术编号：15705546 阅读：221 留言：0更新日期：2017-06-26 14:16

本发明专利技术提供了一种音频数据处理方法，由音频输入端执行，方法包括：歌曲的音频录制中获取输入的实时音频数据段；根据实时音频数据段定位歌曲对应的参考采样点，参考采样点是根据针对歌曲输入的所有原始音频数据选取得到的；读取参考采样点根据所有原始音频数据得到的平均能量值；通过实时音频数据段的能量值和平均能量值运算得到增益因子；按照增益因子对实时音频数据段进行增益处理，以得到完成能量调整的歌曲音频数据段。此外，还提供了一种音频数据处理系统。上述音频数据处理方法及系统能为音频的输入进行动态增益处理。

Audio data processing method and system

The present invention provides a method of processing audio data, execution by the audio input method includes: obtaining the real-time audio data input audio recording songs; according to the real-time audio data segment positioning songs corresponding reference sampling points, sampling reference point is based on all of the original audio data input by selecting needle song antiphonal singing; read reference sampling points according to the average energy of all the original audio data obtained to calculate the gain factor value; through the real-time audio data section of the energy value and the average value of energy; according to the gain factor gain processing of real-time audio data, in order to get the song audio segment to complete energy adjustment. In addition, an audio data processing system is also provided. The audio data processing method and system can perform dynamic gain processing for audio input.

全部详细技术资料下载

【技术实现步骤摘要】
音频数据处理方法及系统
本专利技术涉及多媒体处理
，特别涉及一种音频数据处理方法及系统。
技术介绍
随着互联网应用中媒体应用的发展，媒体录制应用可包括但不限于：基于社交网络的音频录制应用等等，例如，该媒体录制应用可以是基于社交网络的K歌应用。在媒体录制应用的运行中，常会因为麦克风的音量大小不一或人声距离话筒的远近不一等问题导致输入的音频音量忽高忽低，进而在与伴奏混合后出现和音不和谐等音质的缺陷。现有的解决方案中，包括对录制人声所得到的音频数据进行离线处理，或者通过在线实时处理的方式对音频数据进行实时增益处理。一方面的，对于音频数据的离线处理，则是为整首，通过遍历和音后，根据和音中音频数据和伴奏的整体能量比值获取增益因子，从而实现音频数据的离线增益处理。但现有的录制过程大都具备实时耳返功能，即用户在录制的同时就能够听到返回的和音，这种情况下，离线处理方式就不再适用。另一方面的，通过在线处理的方式对录制的音频数据进行实时增益处理中，根据录制的一段人声所得到的音频数据计算实际能量值，然后根据该实际能量值与固定能量值之间的比值即可得到增益因子。但由于在计算增益因子时使用的是固定能量值，因而，使得录制得到的音频数据经音频增益处理后的输出能量值被固定于同一能量水平，无法适用于整个歌曲的能量变化。
技术实现思路
基于此，有必要提供一种音频数据处理方法，以解决现有技术中在线音频增益处理中输出的能量值被固定于同一能量水平的技术问题，本方法能够为音频的输入进行动态增益处理。此外，还有必要提供一种音频数据处理系统，以解决现有技术中在线音频增益处理中输出的能量值被固定于同一能量...
音频数据处理方法及系统

【技术保护点】
一种音频数据处理方法，其特征在于，所述方法包括：歌曲的音频录制中获取输入的实时音频数据段；根据所述实时音频数据段定位所述歌曲对应的参考采样点，所述参考采样点是根据针对所述歌曲输入的所有原始音频数据选取得到的；读取所述参考采样点根据所述所有原始音频数据得到的平均能量值；通过所述实时音频数据段的能量值和所述平均能量值运算得到增益因子；按照所述增益因子对所述实时音频数据段进行增益处理，以得到完成能量调整的歌曲音频数据段。

【技术特征摘要】
1.一种音频数据处理方法，其特征在于，所述方法包括：歌曲的音频录制中获取输入的实时音频数据段；根据所述实时音频数据段定位所述歌曲对应的参考采样点，所述参考采样点是根据针对所述歌曲输入的所有原始音频数据选取得到的；读取所述参考采样点根据所述所有原始音频数据得到的平均能量值；通过所述实时音频数据段的能量值和所述平均能量值运算得到增益因子；按照所述增益因子对所述实时音频数据段进行增益处理，以得到完成能量调整的歌曲音频数据段。2.根据权利要求1所述的方法，其特征在于，所述按照所述增益因子对所述实时音频数据段进行增益处理，以得到完成能量调整的歌曲音频数据段的步骤包括：运算所述实时音频数据段的能量值与所述增益因子之间的乘积值，将所述乘积值置为输出能量值；按照所述输出能量值进行所述实时音频数据段的能量调整，以得到所述完成能量调整的歌曲音频数据段。3.根据权利要求2所述的方法，其特征在于，所述运算所述实时音频数据段的能量值与所述增益因子之间的乘积值，将所述乘积值置为输出能量值的步骤包括：平滑处理所述增益因子得到多个渐近增益因子；分别运算所述实时音频数据段的能量值与多个所述渐近增益因子之间的乘积值，以得到多个输出能量值，所述多个输出能量值分别与所述实时音频数据段对应的参考采样点以及所述参考采样点关联的多个采样点相对应。4.根据权利要求1所述的方法，其特征在于，由服务器执行，所述根据所述实时音频数据段定位所述歌曲对应的参考采样点，以得到所述实时音频数据段对应的参考采样点的步骤之前，所述方法还包括：针对可供进行音频数据处理的多个歌曲，分别根据针对歌曲输入的所有原始音频数据进行采样点的选取，以得到所述歌曲对应的多个参考采样点。5.根据权利要求4所述的方法，其特征在于，所述针对可供进行音频数据处理的多个歌曲，分别根据针对歌曲输入的所有原始音频数据进行采样点的选取，以得到所述歌曲对应的多个参考采样点的步骤包括：根据可供进行音频数据处理的多个歌曲，分别查找针对所述歌曲输入的所有原始音频数据；通过分别对每一原始音频数据进行的端点检测得到所述歌曲对应的所有有效音频数据；根据预置的采样点在所有有效音频数据中的覆盖率从所述采样点中筛选得到所述歌曲对应的多个参考采样点。6.据权利要求5所述的方法，其特征在于，所述根据预置的采样点在所有有效音频数据中的覆盖率从所述采样点中筛选得到所述歌曲对应的多个参考采样点的步骤包括：根据预置的采样点在有效音频数据中的覆盖率从所述采样点中筛选得到有效采样点；根据预置时间间隔从所述有效采样点中提取所述歌曲对应的多个参考采样点。7.根据权利要求6所述的方法，其特征在于，所述读取所述参考采样点根据所述所有原始音频数据得到的平均能量值的步骤之前，所述方法还包括：在所述歌曲对应的多个参考采样点为每一参考采样点查找关联的其它有效采样点；按照所述参考采样点和所述关联的其它有效采样点提取所述有效音频数据对应的能量值；运算所述能量值的平均值，以得到所述参考采样点在所述所有有效音频数据中的平均能量值。8.根据权利要求2所述的方法，其特征在于，所述按照所述增益因子对所述实时音频数据段进行增益处理，以得到完成能量调整的歌曲音频数据段的步骤之前，所述方法还包括：判断...

【专利技术属性】
技术研发人员：傅鸿城，
申请(专利权)人：广州酷狗计算机科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人