确定合唱歌词分配信息的方法、装置、设备及存储介质制造方法及图纸

技术编号:26892953 阅读:19 留言:0更新日期:2020-12-29 16:14
本申请公开了一种确定合唱歌词分配信息的方法,属于互联网技术领域。所述方法包括:提取目标歌曲音频中的人声音频;基于所述人声音频中静音帧的位置,将所述人声音频划分为多个发声音频段,将所述多个发声音频段确定为所述目标歌曲音频的各句歌词对应的演唱音频段;基于每个演唱音频段的时长和相邻演唱音频段之间的时间间隔,确定所述目标歌曲音频的合唱歌词分配信息,其中,所述合唱歌词分配信息中包括所述目标歌曲音频的每句歌词对应的演唱者。采用本申请能够提高得到合唱歌词分配信息的效率。

【技术实现步骤摘要】
确定合唱歌词分配信息的方法、装置、设备及存储介质
本申请涉及互联网
,特别涉及一种确定合唱歌词分配信息的方法、装置、设备及存储介质。
技术介绍
随着互联网技术的发展,K歌应用程序(歌曲演唱应用程序)越来越火热。用户可以在通过,如手机、平板电脑等,安装K歌应用程序,然后通过K歌应用程序播放的歌曲伴奏演唱歌曲。K歌应用程序可以对用户的演唱音频进行录制,再将录制的演唱音频与对应的歌曲伴奏合成用户演唱歌曲的音频。目前K歌应用程序提供有合唱的演唱形式。合唱的演唱形式需要预先将歌曲分为多个演唱段落,然后将歌词按照对应的演唱段落分配不同的演唱者标识,得到合唱歌词分配信息,其中,演唱者标识可以用于区分不同的用户。例如用户演唱相应的歌曲时,终端可以将对应不同演唱者标识的歌词设置为不同的颜色,用户A可以只演唱歌曲中指定颜色的歌词对应的部分,其他用户B可以在用户A的演唱音频的基础上,演唱歌曲中其他颜色的歌词对应的部分。在实现本申请的过程中,专利技术人发现相关技术至少存在以下问题:在相关技术中,首先需人工将对应的歌曲划分为多个演唱段落,然后再根据每个演唱段落对应的歌词分配演唱者标识,从而得到对应歌曲的合唱歌词分配信息。由于得到歌曲的合唱歌词分配信息需要人工参与,所以目前得到合唱歌词分配信息的效率较低。
技术实现思路
本申请实施例提供了一种互联网
,能够提高得到合唱歌词分配信息的效率。所述技术方案如下:一方面,提供了一种确定合唱歌词分配信息的方法,所述方法包括:提取目标歌曲音频中的人声音频;基于所述人声音频中静音帧的位置,将所述人声音频划分为多个发声音频段,将所述多个发声音频段确定为所述目标歌曲音频的各句歌词对应的演唱音频段;基于每个演唱音频段的时长和相邻演唱音频段之间的时间间隔,确定所述目标歌曲音频的合唱歌词分配信息,其中,所述合唱歌词分配信息中包括所述目标歌曲音频的每句歌词对应的演唱者。可选的,所述基于所述人声音频中静音帧的位置,将所述人声音频划分为多个发声音频段,包括:确定所述人声音频中各音频帧是否为静音帧,如果存在连续的超过第一预设数目的多个静音帧,则将所述多个静音帧对应的音频段确定为静音音频段;将所述人声音频中除去所述静音音频段之后剩余的多个音频段,确定为多个发声音频段。可选的,所述基于每个演唱音频段的时长和相邻演唱音频段之间的时间间隔,确定所述目标歌曲音频的合唱歌词分配信息,包括:基于所述每个演唱音频段的时长,确定至少两个第一类演唱音频段集合,其中,所述第一类演唱音频段集合中包括多个连续的演唱音频段,所述第一类演唱音频段集合中的多个演唱音频段与其它至少一个第一类演唱音频段集合中的多个演唱音频段满足时长近似条件;基于所述第一类演唱音频段集合中相邻演唱音频段之间的时间间隔,确定所述目标歌曲音频的合唱歌词分配信息。可选的,所述时长近似条件包括:两个第一类演唱音频段集合包括的演唱音频段数目相同,且在两个第一类演唱音频段集合中,任意两个在时序上位置相同的演唱音频段的时长之差小于预设差值阈值。可选的,所述基于所述每个演唱音频段的时长,确定至少两个第一类演唱音频段集合之后,还包括:确定至少一个第二类演唱音频段集合,其中,所述第二类演唱音频段集合中包括多个不在所述第一类演唱音频段集合中且连续的演唱音频段;所述基于所述第一类演唱音频段集合中相邻演唱音频段之间的时间间隔,确定所述目标歌曲音频的合唱歌词分配信息,包括:基于所述第一类演唱音频段集合中相邻演唱音频段之间的时间间隔,以及所述第二类演唱音频段集合中相邻演唱音频段之间的时间间隔,确定所述目标歌曲音频的合唱歌词分配信息。可选的,所述基于所述第一类演唱音频段集合中相邻演唱音频段之间的时间间隔,以及所述第二类演唱音频段集合中相邻演唱音频段之间的时间间隔,确定所述目标歌曲音频的合唱歌词分配信息,包括:对于所述第一类演唱音频段集合和所述第二类演唱音频段集合中的每个演唱音频段集合,在所述演唱音频段集合中,将时序上第一个演唱音频段确定为初始音频段;由所述初始音频段之后的第N个演唱音频段开始,逐个确定每个演唱音频段与后一个演唱音频段之间的时间间隔,当当前的演唱音频段与后一个演唱音频段之间的时间间隔大于时间间隔阈值时,将所述当前的演唱音频段确定为结束音频段;如果直到所述演唱音频段集合中时序上最后一个演唱音频段为止确定出的各时间间隔都小于或等于时间间隔阈值,则将所述演唱音频段集合中时序上最后一个演唱音频段确定为结束音频段;如果所述演唱音频段集合中所述初始音频段之后的演唱音频段的数目小于或等于N,则将所述演唱音频段集合中时序上最后一个演唱音频段确定为结束音频段;将从所述初始音频段至所述结束音频段的多个演唱音频段确定为连续演唱部分,将所述结束音频段的后一个演唱音频段设置为初始音频段,转至执行所述由所述初始音频段之后的第N个演唱音频段开始之后的处理,其中,N为预设正整数;关于在所述第一类演唱音频段集合和所述第二类演唱音频段集合中确定的多个连续演唱部分,按照预设的歌词分配顺序,为各个所述连续演唱部分对应的歌词分别添加对应的演唱者标识,得到所述目标歌曲音频的合唱歌词分配信息。另一方面,提供了一种确定合唱歌词分配信息的装置,其特征在于,所述装置包括:提取模块,用于提取目标歌曲音频中的人声音频;划分模块,用于基于所述人声音频中静音帧的位置,将所述人声音频划分为多个发声音频段,将所述多个发声音频段确定为所述目标歌曲音频的各句歌词对应的演唱音频段;确定模块,用于基于每个演唱音频段的时长和相邻演唱音频段之间的时间间隔,确定所述目标歌曲音频的合唱歌词分配信息,其中,所述合唱歌词分配信息中包括所述目标歌曲音频的每句歌词对应的演唱者。可选的,所述划分模块,用于:确定所述人声音频中各音频帧是否为静音帧,如果存在连续的超过第一预设数目的多个静音帧,则将所述多个静音帧对应的音频段确定为静音音频段;将所述人声音频中除去所述静音音频段之后剩余的多个音频段,确定为多个发声音频段。可选的,所述确定模块,用于:基于所述每个演唱音频段的时长,确定至少两个第一类演唱音频段集合,其中,所述第一类演唱音频段集合中包括多个连续的演唱音频段,所述第一类演唱音频段集合中的多个演唱音频段与其它至少一个第一类演唱音频段集合中的多个演唱音频段满足时长近似条件;基于所述第一类演唱音频段集合中相邻演唱音频段之间的时间间隔,确定所述目标歌曲音频的合唱歌词分配信息。可选的,所述时长近似条件包括:两个第一类演唱音频段集合包括的演唱音频段数目相同,且在两个第一类演唱音频段集合中,任意两个在时序上位置相同的演唱音频段的时长之差小于预设差值阈值。可选的,所述确定模块,还用于:确定至少一个第二类演唱音频段集合,其中,所述第二类演唱音频段集合中包括多个不在所述第一类演唱音频段集合中且连续的演唱音频段;本文档来自技高网...

【技术保护点】
1.一种确定合唱歌词分配信息的方法,其特征在于,所述方法包括:/n提取目标歌曲音频中的人声音频;/n基于所述人声音频中静音帧的位置,将所述人声音频划分为多个发声音频段,将所述多个发声音频段确定为所述目标歌曲音频的各句歌词对应的演唱音频段;/n基于每个演唱音频段的时长和相邻演唱音频段之间的时间间隔,确定所述目标歌曲音频的合唱歌词分配信息,其中,所述合唱歌词分配信息中包括所述目标歌曲音频的每句歌词对应的演唱者。/n

【技术特征摘要】
1.一种确定合唱歌词分配信息的方法,其特征在于,所述方法包括:
提取目标歌曲音频中的人声音频;
基于所述人声音频中静音帧的位置,将所述人声音频划分为多个发声音频段,将所述多个发声音频段确定为所述目标歌曲音频的各句歌词对应的演唱音频段;
基于每个演唱音频段的时长和相邻演唱音频段之间的时间间隔,确定所述目标歌曲音频的合唱歌词分配信息,其中,所述合唱歌词分配信息中包括所述目标歌曲音频的每句歌词对应的演唱者。


2.根据权利要求1所述的方法,其特征在于,所述基于所述人声音频中静音帧的位置,将所述人声音频划分为多个发声音频段,包括:
确定所述人声音频中各音频帧是否为静音帧,如果存在连续的超过第一预设数目的多个静音帧,则将所述多个静音帧对应的音频段确定为静音音频段;
将所述人声音频中除去所述静音音频段之后剩余的多个音频段,确定为多个发声音频段。


3.根据权利要求1所述的方法,其特征在于,所述基于每个演唱音频段的时长和相邻演唱音频段之间的时间间隔,确定所述目标歌曲音频的合唱歌词分配信息,包括:
基于所述每个演唱音频段的时长,确定至少两个第一类演唱音频段集合,其中,所述第一类演唱音频段集合中包括多个连续的演唱音频段,所述第一类演唱音频段集合中的多个演唱音频段与其它至少一个第一类演唱音频段集合中的多个演唱音频段满足时长近似条件;
基于所述第一类演唱音频段集合中相邻演唱音频段之间的时间间隔,确定所述目标歌曲音频的合唱歌词分配信息。


4.根据权利要求3所述的方法,其特征在于,所述时长近似条件包括:两个第一类演唱音频段集合包括的演唱音频段数目相同,且在两个第一类演唱音频段集合中,任意两个在时序上位置相同的演唱音频段的时长之差小于预设差值阈值。


5.根据权利要求3所述的方法,其特征在于,所述基于所述每个演唱音频段的时长,确定至少两个第一类演唱音频段集合之后,还包括:
确定至少一个第二类演唱音频段集合,其中,所述第二类演唱音频段集合中包括多个不在所述第一类演唱音频段集合中且连续的演唱音频段;
所述基于所述第一类演唱音频段集合中相邻演唱音频段之间的时间间隔,确定所述目标歌曲音频的合唱歌词分配信息,包括:
基于所述第一类演唱音频段集合中相邻演唱音频段之间的时间间隔,以及所述第二类演唱音频段集合中相邻演唱音频段之间的时间间隔,确定所述目标歌曲音频的合唱歌词分配信息。


6.根据权利要求5所述的方法,其特征在于,所述基于所述第一类演唱音频段集合中相邻演唱音频段之间的时间间隔,以及所述第二类演唱音频段集合中相邻演唱音频段之间的时间间隔,确定所述目标歌曲音频的合唱歌词分配信息,包括:
对于所述第一类演唱音频段集合和所述第二类演唱音频段集合中的每个演唱音频段集合,在所述演唱音频段集合中,将时序上第一个演唱音频段确定为初始音频段;
由所述初始音频段之后的第N个演唱音频段开始,逐个确定每个演唱音频段与后一个演唱音频段之间的时间间隔,当当前的演唱音频段与后一个演唱音频段之间的时间间隔大于时间间隔阈值时,将所述当前的演唱音频段确定为结束音频段;
如果直到所述演唱音频段集合中时序上最后一个演唱音频段为止确定出的各时间间隔都小于或等于时间间隔阈值,则将所述演唱音频段集合中时序上最后一个演唱音频段确定为结束音频段;
如果所述演唱音频段集合中所述初始音频段之后的演唱音频段的数目小于或等于N,则将所述演唱音频段集合中时序上最后一个演唱音频段确定为结束音频段;
将从所述初始音频段至所述结束音频段的多个演唱音频段确定为连续演唱部分,将所述结束音频段的后一个演唱音频段设置为初始音频段,转至执行所述由所述初始音频段之后的第N个演唱音频段开始之后的处理,其中,N为预设正整数;
关于在所述第一类演唱音频段集合和所述第二类演唱音频段集合中确定的多个连续演唱部分,按照预设的歌词分配顺序,为各个所述连续演唱部分对应的歌词分别添加对应的演唱者标识,得到所述目标歌曲音频的合唱歌词分配信息。


7.一种确定合唱歌词分...

【专利技术属性】
技术研发人员:庄晓滨
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1