一种歌曲基频提取方法及装置制造方法及图纸

技术编号：21345758 阅读：33 留言：0更新日期：2019-06-13 23:18

本发明专利技术公开了一种歌曲基频提取方法，具体包括：获取所述歌曲的原唱文件、伴奏文件和歌词文件；根据所述原唱文件和伴奏文件，提取人声数据；对所述人声数据进行分帧处理，得到时域音频分帧数据；计算所述时域音频分帧数据每一分帧的第一音调和第一音量；提取所述歌词文件中每一单独字的起始位置和结束位置；根据所述每一分帧的第一音调和第一音量，计算所述每一单独字的第二音调和第二音量；根据所述每一单独字的第二音调、第二音量、起始位置和结束位置，生成所述歌曲的基频文件。通过上述方案，能够快速批量提取歌曲的基频数据，并能够较大程度提高歌曲音调提取准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种歌曲基频提取方法及装置
本专利技术涉及音频信号处理领域，特别涉及一种歌曲基频提取方法及装置。
技术介绍
随着人们娱乐生活的丰富，在闲暇时间选择到KTV唱歌的民众也越来越多。不过，由于歌曲难度的差异，在KTV中对所选择的歌曲的音准进行调节以满足不同人群的需求也成为了大部分KTV中必备的功能。这也就要求必须对原歌曲的音调提取非常准确，但是，在歌曲库中的歌曲数量十分庞大，又有源源不断的新曲入库，现有的歌曲音调提取方法难以大批量快速处理，效率低、准确率差，难以满足当下的需求。
技术实现思路
本专利技术提供了一种歌曲基频提取方法及装置，可以较大程度提高歌曲音调提取的效率和准确度。具体实现方式如下：一种歌曲基频提取方法，包括以下步骤：获取所述歌曲的原唱文件、伴奏文件和歌词文件；根据所述原唱文件和伴奏文件，提取人声数据；对所述人声数据进行分帧处理，得到时域音频分帧数据；计算所述时域音频分帧数据每一分帧的第一音调和第一音量；提取所述歌词文件中每一单独字的起始位置和结束位置；根据所述每一分帧的第一音调和第一音量，计算所述每一单独字的第二音调和第二音量；根据所述每一单独字的第二音调、...

【技术保护点】
1.一种歌曲基频提取方法，其特征在于，包括以下步骤：获取所述歌曲的原唱文件、伴奏文件和歌词文件；根据所述原唱文件和伴奏文件，提取人声数据；对所述人声数据进行分帧处理，得到时域音频分帧数据；计算所述时域音频分帧数据每一分帧的第一音调和第一音量；提取所述歌词文件中每一单独字的起始位置和结束位置；根据所述每一分帧的第一音调和第一音量，计算所述每一单独字的第二音调和第二音量；根据所述每一单独字的第二音调、第二音量、起始位置和结束位置，生成所述歌曲的基频文件。

【技术特征摘要】
1.一种歌曲基频提取方法，其特征在于，包括以下步骤：获取所述歌曲的原唱文件、伴奏文件和歌词文件；根据所述原唱文件和伴奏文件，提取人声数据；对所述人声数据进行分帧处理，得到时域音频分帧数据；计算所述时域音频分帧数据每一分帧的第一音调和第一音量；提取所述歌词文件中每一单独字的起始位置和结束位置；根据所述每一分帧的第一音调和第一音量，计算所述每一单独字的第二音调和第二音量；根据所述每一单独字的第二音调、第二音量、起始位置和结束位置，生成所述歌曲的基频文件。2.如权利要求1所述的歌曲基频提取方法，其特征在于，所述提取人声数据包括：根据所述歌词文件获取人声的起始时间；根据所述起始时间对所述原唱文件和伴奏文件进行音量对准；按照预设的窗口长度对音量对准后的所述原唱文件和伴奏文件进行分帧；计算所述原唱文件和伴奏文件每一分帧的幅度和相位；计算每一分帧的人声幅度和人声相位，所述人声幅度为所述原唱文件的幅度与所述伴奏文件的幅度之差，所述人声相位为所述原唱文件的相位；根据所述人声幅度和人声相位，计算所述人声数据。3.如权利要求1所述的歌曲基频提取方法，其特征在于，所述计算所述时域音频分帧数据每一分帧的第一音调和第一音量包括：计算所述时域音频分帧数据的倒频谱数据；根据人声基音频率范围与所述倒频谱数据计算人声基频；根据所述人声基频计算每一分帧的初始音调；对所述初始音调进行中值滤波，得到每一分帧的第一音调。4.如权力要求1所述的歌曲基频提取方法，其特征在于，所述计算所述时域音频分帧数据每一分帧的第一音调和第一音量包括：计算所述时域音频分帧数据每一分帧的第一平均电平；计算所述人声数据的第二平均电平；根据所述第一平均电平和第二平均电平计算每一分帧的第一音量。5.如权利要求1所述的歌曲基频提取方法，其特征在于，所述提取所述歌词文件中每一单独字的起始位置和结束位置之后，所述计算所述每一单独字的第二音调和第二音量之前，还包括步骤：将所述歌词文件与所述原唱文件进行歌声对齐；调整所述歌词文件中的每句歌词的句起始位置；调整所述歌词文件中的每个单独字的字起始位置。6.如权利要求5所述的歌曲基频提取方法，其特征在于，所述歌声对齐包括：将所述歌词文件的歌词时间标注转换为分帧的序号；计算所述原唱文件中歌声起始的第一起始帧序号与所述歌词文件的歌词起始时间标注对应的第二起始帧序号的差值；将所述歌词文件中所述歌词时间标注对应的分帧的序号与所述差值相加，进行歌声对齐。7.如权利要求5所述的歌曲基频提取方法，其特征在于，所述调整所述歌词文件中的每句歌词的句起始位置包括...

【专利技术属性】
技术研发人员：宋冬梅，武剑，王宏，
申请(专利权)人：北京雷石天地电子技术有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人