【技术实现步骤摘要】
音乐识别方法、装置、存储介质及电子设备
[0001]本公开的实施方式涉及计算机
,更具体地,本公开的实施方式涉及音乐识别方法、装置、计算机可读存储介质及电子设备。
技术介绍
[0002]本部分旨在为本公开的实施方式提供背景或上下文,此处的描述不因为包括在本部分中就承认是现有技术。
[0003]随着互联网技术的飞速发展,音乐的传播形式发生了巨大的变化;其中,以流媒体业务(例如,短视频、直播或者播客等)为依托的音乐传播形式,成为近几年最常见的音乐传播方式。
[0004]然而,现有的音乐检测方案,容易受音乐在媒体对象中的展示形式限制,音乐识别能力有限,且会出现识别结果不精准的问题,导致对侵犯音频版权的媒体对象无法准确识别。
技术实现思路
[0005]为此,非常需要一种音乐识别方案,可以对各种音乐展示形式的音频进行识别,提升音乐识别结果的可靠性,以更精准的识别侵犯音乐版权的媒体对象。
[0006]在本上下文中,本公开的实施方式期望提供一种音乐识别方法、装置、计算机可读存储介质及电子设备。 ...
【技术保护点】
【技术特征摘要】
1.一种音乐识别方法,其特征在于,包括:获取待处理音频段;确定所述待处理音频段中每帧待处理音频帧属于候选音频类型的概率值,所述候选音频类型包括无人声的音乐音频、有人声的音乐音频、带歌词演唱音乐音频以及不带歌词哼唱音乐音频的至少一种;根据所述每帧待处理音频帧属于目标音频类型的目标概率值,确定所述待处理音频段中属于所述目标音频类型的第一目标音频段,所述目标音频类型为所述候选音频类型中的任一种;确定所述第一目标音频段的音乐识别结果。2.根据权利要求1所述的方法,其特征在于,所述根据所述每帧待处理音频帧属于目标音频类型的目标概率值,确定所述待处理音频段中属于所述目标音频类型的第一目标音频段,包括:按照待处理音频帧生成时间由早到晚的顺序,遍历所述每帧待处理音频帧;根据预先设定的与所述目标音频类型关联的概率阈值,以及与每帧待处理音频帧关联的所述目标概率值,确定所述第一目标音频段。3.根据权利要求2所述的方法,其特征在于,所述根据预先设定的与所述目标音频类型关联的概率阈值,以及与每帧待处理音频帧关联的所述目标概率值,确定所述第一目标音频段,包括:若与第一帧和最后一帧待处理音频帧分别关联的所述目标概率值小于所述概率阈值,且与每帧待处理音频帧关联的所述目标概率值中,存在所述目标概率值大于或者等于所述概率阈值的待处理音频帧,则将第一个所述目标概率值大于或者等于所述概率阈值的待处理音频帧,确定为所述第一目标音频段的起始音频帧;将第一个所述目标概率值小于所述概率阈值的待处理音频帧,确定为所述第一目标音频段的结束音频帧。4.根据权利要求2所述的方法,其特征在于,所述根据预先设定的与所述目标音频类型关联的概率阈值,以及与每帧待处理音频帧关联的所述目标概率值,确定所述第一目标音频段,包括:若与第一帧待处理音频帧关联的所述目标概率值大于或者等于所述概率阈值,且与最后一帧待处理音频帧关联的所述目标概率值小于所述概率阈值,则将第一个所述目标概率值小于所述概率阈值的待处理音频帧,确定所述第一目标音频段的结束音频帧;获取在第一音频段中确定的所述第一目标音频段的起始音频帧,所述起始音频帧为所述第一音频段中,第一个所述目标概率值大于或者等于所述概率阈值的待处理音频帧,所述第一音频段的生成时间早于所述待处理音频段。5.根据权利要求1所述的方法,其特征在于,在根据所述每帧待处理音频帧属于目标音频类型的目标概率值,确定所述待处理音频段中属于所述目标音频类型的第一目标音频段之前,所述方法包括:对于每帧待处理音频帧,根据目标音频帧属于所述目标音频类型的目标概率值,对所述待处理音频帧属于所述目标音频类型的目标概率值进行修正,得到每帧待处理音频帧属于所述目标音频类型的修正目标概率值,所述目标音...
【专利技术属性】
技术研发人员:潘颂声,刘华平,李鹏,赵翔宇,郑思远,
申请(专利权)人:杭州网易云音乐科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。