音频识别方法、装置、计算机设备及计算机可读存储介质制造方法及图纸

技术编号：34035987 阅读：18 留言：0更新日期：2022-07-06 12:18

本申请公开了音频识别方法、装置、计算机设备及计算机可读存储介质，应用于计算机技术领域。该方法包括：获取清唱音频数据后，提取清唱音频数据的基频序列；获取清唱音频数据对应的歌曲的乐器数字接口MIDI模板，该MIDI模板用于表示歌曲的标准化音乐参数；基于该MIDI模板调整基频序列对应的音区，以及基频序列对应的发声速度；计算调整后的基频序列和该MIDI模板之间的匹配度；根据该匹配度确定清唱音频数据的识别结果，该识别结果用于指示清唱音频数据是否合格。通过本申请，可以提高音频评价的准确性。确性。确性。

全部详细技术资料下载

【技术实现步骤摘要】
音频识别方法、装置、计算机设备及计算机可读存储介质

[0001]本申请涉及计算机
，尤其涉及音频识别方法、音频识别装置、计算机设备及计算机可读存储介质。

技术介绍

[0002]目前，传统的有参考歌唱评价，通常是参考固定模板，根据时间逐音符进行精准匹配，利用匹配结果进行评价，需要有音准条、高亮歌词或伴奏作为时间参考。
[0003]但是在规定用户需要清唱完成歌曲的情况下，此时没有音准条或伴奏作为时间参考，那么采用这种参考固定模板进行精准匹配的方式会降低音频评价的准确性。

技术实现思路

[0004]本申请实施例提供了音频识别方法、装置、计算机设备及计算机可读存储介质，可以提高音频评价的准确性。
[0005]一方面，本申请实施例提供一种音频识别方法，该方法包括：
[0006]获取清唱音频数据后，提取清唱音频数据的基频序列；
[0007]获取清唱音频数据对应的歌曲的乐器数字接口MIDI模板，该MIDI模板用于表示歌曲的标准化音乐参数；
[0008]基于该MIDI模板调整基频序列对应的音区，以及基频序列对应的发声速度；
[0009]计算调整后的基频序列和该MIDI模板之间的匹配度；
[0010]根据该匹配度确定清唱音频数据的识别结果，该识别结果用于指示清唱音频数据是否合格。
[0011]一方面，本申请实施例提供一种音频识别装置，该装置包括：
[0012]处理单元，用于获取清唱音频数据后，提取清唱音频数据的基频序列；
[0013]...

【技术保护点】

【技术特征摘要】
1.一种音频识别方法，其特征在于，包括：获取清唱音频数据后，提取所述清唱音频数据的基频序列；获取所述清唱音频数据对应的歌曲的乐器数字接口MIDI模板，所述MIDI模板用于表示歌曲的标准化音乐参数；基于所述MIDI模板调整所述基频序列对应的音区，以及所述基频序列对应的发声速度；计算调整后的基频序列和所述MIDI模板之间的匹配度；根据所述匹配度确定所述清唱音频数据的识别结果，所述识别结果用于指示所述清唱音频数据是否合格。2.根据权利要求1所述的方法，其特征在于，所述提取所述清唱音频数据的基频序列，包括：若所述清唱音频数据对应的音频时长大于或等于第一阈值，则提取所述清唱音频数据的基频序列。3.根据权利要求1所述的方法，其特征在于，所述获取所述清唱音频数据对应的歌曲的乐器数字接口MIDI模板，包括：基于所述基频序列确定所述清唱音频数据对应的人声时长；确定所述清唱音频数据对应的人声时长是否大于或等于第二阈值；若所述清唱音频数据对应的人声时长大于或等于所述第二阈值，则获取所述清唱音频数据对应的歌曲的乐器数字接口MIDI模板。4.根据权利要求3所述的方法，其特征在于，所述基于所述基频序列确定所述清唱音频数据对应的人声时长，包括：获取所述基频序列中每个基频对应的元音帧时长；基于所述每个基频对应的元音帧时长确定所述清唱音频数据对应的人声时长。5.根据权利要求1所述的方法，其特征在于，所述基于所述MIDI模板调整所述基频序列对应的音区，包括：确定所述MIDI模板对应的音高与所述基频序列对应的音高之间的差值；基于所述差值调整所述基频序列对应的音区。6.根据权利要求1所述的...

【专利技术属性】
技术研发人员：江益靓，骆一帆，赵伟峰，姜涛，
申请(专利权)人：腾讯音乐娱乐科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人