副歌检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:23364278 阅读:21 留言:0更新日期:2020-02-18 17:50
本公开提供一种副歌检测方法、装置、电子设备及计算机可读存储介质,所述方法包括:从待检测音频文件中获取多个音频片段;对于每一音频片段,确定所述音频片段分别与其之后的每个音频片段的相似度;针对每一音频片段,计算相似度超过预设阈值的数量,确定该音频片段的重复次数;将重复次数最多的音频片段作为副歌;本公开实现准确获取副歌的过程。

Chorus detection method, device, electronic equipment and storage medium

【技术实现步骤摘要】
副歌检测方法、装置、电子设备及存储介质
本公开涉及多媒体
,尤其涉及一种副歌检测方法、装置、电子设备及计算机可读存储介质。
技术介绍
随着多媒体技术的发展,人们经常使用音频播放应用播放音频文件。例如,可以使用音频播放软件播放歌曲。主歌和副歌是流行歌曲的主要组成部分,主歌一般是歌曲中高潮之前的部分,将旋律慢慢推到高潮的同时,表达清楚故事背景;副歌是情感的升华,旋律上和主歌有强烈的对比,包含了歌曲高潮,歌曲高潮是指歌曲中乐思最集中、情绪最紧张的片段,它是全曲的中心,往往也是记忆性最强的地方。相关技术中对于副歌(高潮)部分的检测,通常是人工查到歌曲高潮部分,不仅查找效率低,而且需要耗费较高的时间成本和物力成本。
技术实现思路
有鉴于此,本公开实施例提供一种副歌检测方法、装置、电子设备及计算机可读存储介质。本公开的第一方面提供了一种副歌检测方法,所述方法具体包括:从待检测音频文件中获取多个音频片段;对于每一音频片段,确定所述音频片段分别与其之后的每个音频片段的相似度;针对每一音频片段,计算相似度超过预设阈值的数量,确定该音频片段的重复次数;将重复次数最多的音频片段作为副歌。可选地,所述相似度为两个音频片段中相同内容的长度与两个音频片段长度之和的一半的比值。可选地,所述针对每一音频片段,计算相似度超过预设阈值的数量,确定该音频片段的重复次数,包括:若所述相似度大于所述预设阈值,令该相似度为1,否则为0;针对每一音频片段,计算相似度为1的数量,确定该音频片段的重复次数。可选地,所述针对每一音频片段,计算相似度为1的数量,确定该音频片段的重复次数,包括:基于每一音频片段分别与其他音频片段的相似度构建相似度矩阵,所述相似度矩阵中的点所在坐标为相似度为1的两个音频片段在所述待检测音频文件中的排列顺序;确定所述相似度矩阵中的连续点,并滤除所述相似度矩阵中连续点的连续个数小于指定数量的部分;针对每一音频片段,基于所述滤除处理后的相似度矩阵,确定该音频片段的重复次数。可选地,所述针对每一音频片段,基于所述滤除处理后的相似度矩阵,确定该音频片段的重复次数,包括:对所述滤除处理后的相似度矩阵中的每一列的点数进行求和,得到每一音频片段的重复次数。可选地,所述待检测音频文件所包括的音频片段的总数不低于所述指定数量的2倍。可选地,所述待检测音频文件为待检测音频的歌词文件;所述音频片段为一句歌词。可选地,所述从待检测音频文件中获取多个音频片段,包括:对所述待检测音频的歌词文件进行预处理,获取多句歌词。可选地,所述预处理包括以下任意一个或多个操作:歌词文本格式标准化处理、过滤总字数少于指定阈值的歌词、删除歌词文本中的非歌词部分、合并断句不一致的歌词以及删除包含非指定语言的歌词。根据本公开实施例的第二方面,提供一种副歌检测装置,所述装置包括:音频片段获取单元,用于从待检测音频文件中获取多个音频片段;相似度确定单元,用于对于每一音频片段,确定所述音频片段分别与其之后的每个音频片段的相似度;重复次数确定单元,用于针对每一音频片段,计算相似度超过预设阈值的数量,确定该音频片段的重复次数;副歌确定单元,用于将重复次数最多的音频片段作为副歌。可选地,所述相似度为两个音频片段中相同内容的长度与两个音频片段长度之和的一半的比值。可选地,所述重复次数确定单元包括:设置子单元,用于若所述相似度大于所述预设阈值,令该相似度为1,否则为0;重复次数计算子单元,用于针对每一音频片段,计算相似度为1的数量,确定该音频片段的重复次数。可选地,所述重复次数计算子单元包括:矩阵构建模块,用于基于每一音频片段分别与其他音频片段的相似度构建相似度矩阵,所述相似度矩阵中的点所在坐标为相似度为1的两个音频片段在所述待检测音频文件中的排列顺序;滤除模块,用于确定所述相似度矩阵中的连续点,并滤除所述相似度矩阵中连续点的连续个数小于指定数量的部分;重复次数确定模块,用于针对每一音频片段,基于所述滤除处理后的相似度矩阵,确定该音频片段的重复次数。可选地,所述重复次数确定模块包括:对所述滤除处理后的相似度矩阵中的每一列的点数进行求和,得到每一音频片段的重复次数。可选地,所述待检测音频文件所包括的音频片段的总数不低于所述指定数量的2倍。可选地,所述待检测音频文件为待检测音频的歌词文件;所述音频片段为一句歌词。可选地,所述音频片段获取单元包括:对所述待检测音频的歌词文件进行预处理,获取多句歌词。可选地,所述预处理包括以下任意一个或多个操作:歌词文本格式规范化处理、过滤总字数少于指定阈值的歌词、删除歌词文本中的非歌词部分以及合并断句不一致的歌词。根据本公开实施例的第三方面,提供一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行第一方面中任一所述的方法。根据本公开实施例的第四方面,还提供了一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现第一方面中任一所述方法的步骤。根据本公开实施例的第五方面,提供了一种计算机程序产品,包括第一方面中任一所述方法的步骤。本公开的实施例提供的技术方案可以包括以下有益效果:本公开实施例从待检测音频文件中获取多个音频片段,然后对于每一音频片段,确定所述音频片段分别与其之后的每个音频片段的相似度,以根据所述相似度确定该音频片段的重复次数,从而将重复次数最多的音频片段作为副歌部分,实现过程简单高效,获取的副歌准确率高,无需用户自己拖动进度条去查找歌曲高潮,副歌的确定能帮用户更有效的找到喜爱的视频和音乐,减少用户的繁琐操作,提高用户的使用体验。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明图1为本公开根据一示例性实施例示出的一种副歌检测方法流程图;图2A为本公开根据一示例性实施例示出的一种相似度矩阵图;图2B为本公开根据一示例性实施例示出的第二种相似度矩阵图;图3为本公开根据一示例性实施例示出的第二种副歌检测方法流程图;图4为本公开根据一示例性实施例示出的第三种相似度矩阵图;图5A为本公开根据一示例性实施例示出的第四种相似度矩阵图;图5B为本公开根据一示例性实施例示出的第五种相似度矩阵图;图6为本公开根据一示例性实施例示出的一种副歌检测装置的框图;图7为本公开根据一示例性实施例示出的一种用于执行副歌检测方法实施例的装置的框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素本文档来自技高网...

【技术保护点】
1.一种副歌检测方法,其特征在于,包括:/n从待检测音频文件中获取多个音频片段;/n对于每一音频片段,确定所述音频片段分别与其之后的每个音频片段的相似度;/n针对每一音频片段,计算相似度超过预设阈值的数量,确定该音频片段的重复次数;/n将重复次数最多的音频片段作为副歌。/n

【技术特征摘要】
1.一种副歌检测方法,其特征在于,包括:
从待检测音频文件中获取多个音频片段;
对于每一音频片段,确定所述音频片段分别与其之后的每个音频片段的相似度;
针对每一音频片段,计算相似度超过预设阈值的数量,确定该音频片段的重复次数;
将重复次数最多的音频片段作为副歌。


2.根据权利要求1所述的方法,其特征在于,所述相似度为两个音频片段中相同内容的长度与两个音频片段长度之和的一半的比值。


3.根据权利要求1所述的方法,其特征在于,所述针对每一音频片段,计算相似度超过预设阈值的数量,确定该音频片段的重复次数,包括:
若所述相似度大于所述预设阈值,令该相似度为1,否则为0;
针对每一音频片段,计算相似度为1的数量,确定该音频片段的重复次数。


4.根据权利要求3所述的方法,其特征在于,所述针对每一音频片段,计算相似度为1的数量,确定该音频片段的重复次数,包括:
基于每一音频片段分别与其他音频片段的相似度构建相似度矩阵,所述相似度矩阵中的点所在坐标为相似度为1的两个音频片段在所述待检测音频文件中的排列顺序;
确定所述相似度矩阵中的连续点,并滤除所述相似度矩阵中连续点的连续个数小于指定数量的部分;
针对每一音频片段,基于所述滤除处理后的相似度矩阵,确定该音频片段的重复次数。

【专利技术属性】
技术研发人员:张文文张存义李佳文
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1