音频识别方法、装置、计算机设备及计算机可读存储介质制造方法及图纸

技术编号:34035987 阅读:18 留言:0更新日期:2022-07-06 12:18
本申请公开了音频识别方法、装置、计算机设备及计算机可读存储介质,应用于计算机技术领域。该方法包括:获取清唱音频数据后,提取清唱音频数据的基频序列;获取清唱音频数据对应的歌曲的乐器数字接口MIDI模板,该MIDI模板用于表示歌曲的标准化音乐参数;基于该MIDI模板调整基频序列对应的音区,以及基频序列对应的发声速度;计算调整后的基频序列和该MIDI模板之间的匹配度;根据该匹配度确定清唱音频数据的识别结果,该识别结果用于指示清唱音频数据是否合格。通过本申请,可以提高音频评价的准确性。确性。确性。

【技术实现步骤摘要】
音频识别方法、装置、计算机设备及计算机可读存储介质


[0001]本申请涉及计算机
,尤其涉及音频识别方法、音频识别装置、计算机设备及计算机可读存储介质。

技术介绍

[0002]目前,传统的有参考歌唱评价,通常是参考固定模板,根据时间逐音符进行精准匹配,利用匹配结果进行评价,需要有音准条、高亮歌词或伴奏作为时间参考。
[0003]但是在规定用户需要清唱完成歌曲的情况下,此时没有音准条或伴奏作为时间参考,那么采用这种参考固定模板进行精准匹配的方式会降低音频评价的准确性。

技术实现思路

[0004]本申请实施例提供了音频识别方法、装置、计算机设备及计算机可读存储介质,可以提高音频评价的准确性。
[0005]一方面,本申请实施例提供一种音频识别方法,该方法包括:
[0006]获取清唱音频数据后,提取清唱音频数据的基频序列;
[0007]获取清唱音频数据对应的歌曲的乐器数字接口MIDI模板,该MIDI模板用于表示歌曲的标准化音乐参数;
[0008]基于该MIDI模板调整基频序列对应的音区,以及基频序列对应的发声速度;
[0009]计算调整后的基频序列和该MIDI模板之间的匹配度;
[0010]根据该匹配度确定清唱音频数据的识别结果,该识别结果用于指示清唱音频数据是否合格。
[0011]一方面,本申请实施例提供一种音频识别装置,该装置包括:
[0012]处理单元,用于获取清唱音频数据后,提取清唱音频数据的基频序列;
[0013]获取单元,用于获取清唱音频数据对应的歌曲的乐器数字接口MIDI模板,该MIDI模板用于表示歌曲的标准化音乐参数;
[0014]该处理单元,还用于基于该MIDI模板调整基频序列对应的音区,以及基频序列对应的发声速度;
[0015]该处理单元,还用于计算调整后的基频序列和该MIDI模板之间的匹配度;
[0016]确定单元,用于根据该匹配度确定清唱音频数据的识别结果,该识别结果用于指示清唱音频数据是否合格。
[0017]一方面,本申请实施例提供一种计算机设备,该计算机设备包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述的音频识别方法。
[0018]一方面,本申请实施例提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被计算机设备的处理器读取并执行时,使得计算机设备执行上述的音频识别方法。
[0019]一方面,本申请实施例提供了一种计算机程序产品,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的音频识别方法。
[0020]在本申请实施例中,首先在获取清唱音频数据后,提取该清唱音频数据的基频序列;然后获取该清唱音频数据对应的歌曲的MIDI模板,根据MIDI模板调整基频序列对应的音区以及发声速度,最后通过计算调整后的基频序列和MIDI模板之间的匹配度确定清唱音频数据的识别结果,此处的识别结果可用于指示该清唱音频数据是否合格。针对清唱歌曲评价的场景,不借助音准条或伴奏作为时间参考,根据MIDI模板调整基频序列对应的音区以及发声速度,模糊匹配清唱音频数据与MIDI模板,克服清唱音频数据中发声速度不确定、音准不稳定等问题,能够提高音频评价的准确性。
附图说明
[0021]为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0022]图1是本申请实施例提供的一种音频识别系统的结构示意图;
[0023]图2是本申请实施例提供的一种音频识别方法的流程示意图;
[0024]图3是本申请实施例提供的一种基频序列调整的示意图;
[0025]图4是本申请实施例提供的一种矩阵网格的示意图;
[0026]图5是本申请实施例提供的一种清唱音频数据的识别结果显示界面;
[0027]图6是本申请实施例提供的一种MIDI模板对应的持续时长与匹配度之间的关系示意图;
[0028]图7是本申请实施例提供的另一种音频识别方法的流程示意图;
[0029]图8a是本申请实施例提供的一种唱歌游戏的流程图;
[0030]图8b是本申请实施例提供的一种唱歌领奖励的界面图;
[0031]图8c是本申请实施例提供的一种唱歌的界面图;
[0032]图8d是本申请实施例提供的一种获取奖励的界面图;
[0033]图9a是本申请实施例提供的一种音准测试的界面图;
[0034]图9b是本申请实施例提供的一种音准测试结果的界面图;
[0035]图10是本申请实施例提供的一种音频识别装置的结构示意图;
[0036]图11是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
[0037]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0038]需要说明的是,本申请实施例中所涉及到的“第一”、“第二”等描述仅用于描述目
的,而不能理解为指示或者暗示其相对重要性或者隐含指明所指示的技术特征的数量。因此,限定有“第一”、“第二”的技术特征可以明示或者隐含的包括至少一个该特征。
[0039]在本申请实施例中,涉及人工智能(Artificial Intelligence,AI)技术。所谓的人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
[0040]其中,语音技术(Speech Technology)的关键技术有自动语音识别技术和语音合成技术以及声纹识别技术。让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频识别方法,其特征在于,包括:获取清唱音频数据后,提取所述清唱音频数据的基频序列;获取所述清唱音频数据对应的歌曲的乐器数字接口MIDI模板,所述MIDI模板用于表示歌曲的标准化音乐参数;基于所述MIDI模板调整所述基频序列对应的音区,以及所述基频序列对应的发声速度;计算调整后的基频序列和所述MIDI模板之间的匹配度;根据所述匹配度确定所述清唱音频数据的识别结果,所述识别结果用于指示所述清唱音频数据是否合格。2.根据权利要求1所述的方法,其特征在于,所述提取所述清唱音频数据的基频序列,包括:若所述清唱音频数据对应的音频时长大于或等于第一阈值,则提取所述清唱音频数据的基频序列。3.根据权利要求1所述的方法,其特征在于,所述获取所述清唱音频数据对应的歌曲的乐器数字接口MIDI模板,包括:基于所述基频序列确定所述清唱音频数据对应的人声时长;确定所述清唱音频数据对应的人声时长是否大于或等于第二阈值;若所述清唱音频数据对应的人声时长大于或等于所述第二阈值,则获取所述清唱音频数据对应的歌曲的乐器数字接口MIDI模板。4.根据权利要求3所述的方法,其特征在于,所述基于所述基频序列确定所述清唱音频数据对应的人声时长,包括:获取所述基频序列中每个基频对应的元音帧时长;基于所述每个基频对应的元音帧时长确定所述清唱音频数据对应的人声时长。5.根据权利要求1所述的方法,其特征在于,所述基于所述MIDI模板调整所述基频序列对应的音区,包括:确定所述MIDI模板对应的音高与所述基频序列对应的音高之间的差值;基于所述差值调整所述基频序列对应的音区。6.根据权利要求1所述的...

【专利技术属性】
技术研发人员:江益靓骆一帆赵伟峰姜涛
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1