歌曲处理方法及相关设备技术

技术编号:37644535 阅读:20 留言:0更新日期:2023-05-25 10:11
本申请实施例公开了歌曲处理方法及相关设备,该方法包括:获取原始歌曲中的原干声信号;对原干声信号进行变速不变调及重采样处理,以改变原干声信号的音调特征得到新干声信号;基于原干声信号的共振峰信息调整新干声信号的共振峰分布,以得到音色修正后的目标干声信号。本申请实施例既能调整原干声信号的音调,还能基于原干声信号的共振峰信息调整新干声信号的频谱信息,使得变调后的声信号具有较高的原唱人声保真效果,即音色高度保持,从而避免歌曲变调后造成人声失真而影响听感。避免歌曲变调后造成人声失真而影响听感。避免歌曲变调后造成人声失真而影响听感。

【技术实现步骤摘要】
歌曲处理方法及相关设备


[0001]本申请实施例涉及音频
,尤其涉及歌曲处理方法及相关设备。

技术介绍

[0002]日常生活应用中,不同用户对歌曲有着不同的音调偏好或需求。
[0003]目前对音调的主流调整方案是,直接利用基于时域压扩(TSM,Time scale modification)的变调工具,对歌曲做统一的音调调整。但不可避免的,该音调调整方案处理出的人声(可称为干声或无伴奏的纯歌声)部分,仍存在如小黄人声调般的花栗鼠(chipmunk)效应,该效应的不良表现有,使得人声部分vocal声道出现严重的音色失真,此从听感上而言,处理得的人声与歌者本身歌喉的音色特点大相径庭。
[0004]针对于此,相关技术并未提供有效的解决方案。

技术实现思路

[0005]本申请实施例提供了歌曲处理方法及相关设备,用于解决现有变调歌曲所出现的干声部分音色失真的技术问题。
[0006]本申请实施例第一方面提供一种歌曲处理方法,包括:
[0007]获取原始歌曲中的原干声信号;
[0008]对所述原干声信号进行变速不变调及重采样处理,以改变所述原干声信号的音调特征得到新干声信号;
[0009]基于所述原干声信号的共振峰信息调整所述新干声信号的共振峰分布,以得到音色修正后的目标干声信号。
[0010]本申请实施例第二方面提供一种电子设备,包括:
[0011]中央处理器,存储器以及输入输出接口;
[0012]所述存储器为短暂存储存储器或持久存储存储器;
[0013]所述中央处理器配置为与所述存储器通信,并执行所述存储器中的指令操作以执行本申请实施例第一方面或第一方面的任一具体实现方式所描述的方法。
[0014]本申请实施例第三方面提供一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使得计算机执行如本申请实施例第一方面或第一方面的任一具体实现方式所描述的方法。
[0015]本申请实施例第四方面提供一种包含指令或计算机程序的计算机程序产品,当所述计算机程序产品在计算机上运行时,使得计算机执行如本申请实施例第一方面或第一方面的任一具体实现方式所描述的方法。
[0016]从以上技术方案可以看出,本申请实施例至少具有以下优点:
[0017]本申请实施例既能调整原干声信号的音调,还能基于原干声信号的共振峰信息调整新干声信号的频谱信息,使得变调后的声信号具有较高的原唱人声保真效果,即音色高度保持,避免歌曲变调造成人声失真而影响听感。
附图说明
[0018]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
[0019]图1为本申请实施例的系统架构示意图;
[0020]图2为本申请实施例歌曲处理方法的一个流程示意图;
[0021]图3为本申请实施例歌曲处理方法的另一流程示意图;
[0022]图4为本申请实施例歌曲处理方法的另一流程示意图;
[0023]图5为本申请实施例歌曲处理方法的另一流程示意图;
[0024]图6为本申请实施例歌曲处理方法的信号频谱示意图;
[0025]图7为本申请实施例电子设备的一个结构示意图。
具体实施方式
[0026]为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
[0027]本申请的说明书和权利要求书及附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0028]在以下的描述中,涉及到“一个具体实施方式”或“一个具体示例”等类似表达,其描述了所有可能实施例的子集,但是可以理解,“一个具体实施方式”或“一个具体示例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。在以下的描述中,涉及到的术语多个是指至少两个。本申请所说的某数值达到阈值(如果存在),在一些具体示例中,可包括前者大于阈值后者的情况。
[0029]除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
[0030]为便于理解和说明,在对本申请做进一步详细说明之前,将对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
[0031]STFT:短时傅里叶变换。
[0032]PhaseVocoder:相频声码器,用于在不改变音调的情况下改变波形的速度,即变速不变调。
[0033]TSM:全称为Time

scale modification,译为时域压扩或变速不变调算法,顾名思义,TSM是一个能够改变音频的"语速"而不改变其音调的算法。简单来说,TSM就是把一段音频信号划分成不同长度的帧,然后对每个帧进行一系列处理比如拉伸或者压缩,再将这些
帧重新叠加成合成信号,很多的TSM方法中两个帧叠加时常常是有重叠部分(overlap)的,当然这个重叠部分需要进行一系列的处理以减少类似于相位不连续、幅度波动造成的影响。
[0034]Wsola:是在ola至sola基础上调优而来的时间伸缩(TSM)算法,简单说来是通过重复或删除帧片段来实现信号长度的拉长或缩短,从而实现变速目的。
[0035]Phasevocoder:与wsola的不同在于,它是通过调整帧间相位(频域)来完成时域帧的展缩,即主要侧重在调整频域信息。
[0036]变调:表示调整歌曲的调性,比如调为C调或D调等音乐主音。
[0037]本申请实施例提供的歌曲处理方法,可以应用于如图1所示的应用环境,本申请的音频具体可以含有干声的歌曲(包括无伴奏的纯人声作品)为例,其中,终端102通过网络与服务器101进行通信,数据存储系统100可以存储服务器101需要处理的数据;数据存储系统100可以集成在服务器101上,也可以放在云上或其他网络服务器上。终端102可以获取用户输入的原始歌曲,具体可以是获取原始歌曲中的原干声信号,及还可以获取原伴奏信号,并将获取到的声信号发送至服务器101,服务器1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种歌曲处理方法,其特征在于,包括:获取原始歌曲中的原干声信号;对所述原干声信号进行变速不变调及重采样处理,以改变所述原干声信号的音调特征得到新干声信号;基于所述原干声信号的共振峰信息调整所述新干声信号的共振峰分布,以得到音色修正后的目标干声信号。2.根据权利要求1所述的歌曲处理方法,其特征在于,所述基于所述原干声信号的共振峰信息,对变调所得的新干声信号进行音色修正,包括:对比所述原干声信号和所述新干声信号之间频谱的共振峰信息,并根据共振峰对比结果构造所述新干声信号各时频点的权重系数;使用各所述权重系数对相应时频点的所述新干声信号进行加权,以修正得符合所述原干声信号的共振峰分布,且不改变所述新干声信号的音调特征的目标干声信号。3.根据权利要求1所述的歌曲处理方法,其特征在于,若预得到相对所述原干声信号升调的目标干声信号,则对所述原干声信号进行变速不变调及重采样处理的过程包括:使用信号帧扩展算法拉伸所述原干声信号的帧片段,以得到相对于所述原干声信号减速但不变调的变速干声信号;对所述变速干声信号中的时频点信号进行降采样,以得到与所述原干声信号的帧片段长度相同但升调的目标干声信号。4.根据权利要求1所述的歌曲处理方法,其特征在于,若预得到相对所述原干声信号降调的目标干声信号,则对所述原干声信号进行变速不变调及重采样处理的过程包括:对所述原干声信号中的时频点信号进行升采样,以得到比所述原干声信号的帧片段更长但降调的变调干声信号;使用信号帧压缩算法缩短所述变调干声信号的帧片段,以得到与所述原干声信号的帧片段长度相同但降调的目标干声信号。5.根据权利要求1所述的歌曲处理方法,其特征在于,若所述原始歌曲包含伴奏信号和干声信号,则所述方法还包括:从所述原始歌曲中分离出原伴奏信号和原干声信...

【专利技术属性】
技术研发人员:张超鹏曹硕李灿涛赵伟峰姜涛
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1