当前位置: 首页 > 专利查询>刘盛举专利>正文

一种实现声音变速不变调方法及变速变调系统技术方案

技术编号:4290530 阅读:781 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种实现声音变速变调的系统,该系统由以下4个部分组成:输入缓存模块,将待处理声音信号数据读入缓存;变调处理模块,对声音信号进行变调处理以改变声音的音调;变速不变调处理模块,对声音信号进行变速不变调处理,以改变语速但音调不变;数据输出模块,把上述变速变调信号输出。变速不变调处理模块包括分割数据模块,采用窗口函数,根据变速系数从原始语音信号中提取出一串信号子系列(即小段声音);和连接数据模块,将这些信号子系列按它们的时间先后顺序连接起来就得到变速不变调信号。本发明专利技术的优点在于以非常低的算法复杂度实现了音频的变速不变调功能和变速变调功能,并不引入噪声,提高了处理后的声音质量。

【技术实现步骤摘要】

本专利技术涉及声音信号处理
,具体涉及一种实现声音变速不变调的方法及其声音变速变调的系统。
技术介绍
变调的过程实际上是将声音的频谱进行收縮或者扩展,同时原先各谐波成分之间 的关系仍然保留;变调需借助于一定的算法实现。现在变调算法主要分为时域算法和频域 算法两大类。频域算法是先对数字声音信号进行傅立叶变换运算,将数字语音信号转换成 频域的频谱信号,对此频谱信号平移一差值,以改变数字语音信号的频谱,再对此频谱信号 进行反傅立叶变换运算转成时域的数字语音信号,即可达成产生变调数字语音信号。但是, 该方法实现的变调效果会带有金属声。原因在于频率的搬移并不是频率的线性变化。频域 算法的另一种方法是在频域上用线性内插的方法来实现频率的提高与降低,从而实现声调 的变化。这个方法的缺点在于内插的方法会引入不需要的频率。特别是在某些能量大的 频点,假设要升2倍频,将会引入一些能量为原频点能量一半的频率分量。这些频率分量会 大大影响音频的音质。而且这些频率分量与原来有用的频率贴得很近,若要进行滤波也较 麻烦。另外,上述两种方法需要进行傅立叶变换及其反变换,运算量较大。这两种比较适合 大比例的音调改变,不过变调之后的声音的自然度较低。时域算法一般采用变速加变采样 率的方法实现。 变速即对信号进行变速不变声的处理,也就是将一段声音的持续时间拉长或者縮 短,而声音的音调不变。现在实现声音变速的方法几乎都是在时域进行的,都是对原始信号 进行删除或者插入,使信号变短或变长,从而实现声音的快放或者慢放。国际专利PCT(申 请号PCT/CN96/00074)和两个中国专利(公开号为CN1197976和CN1920951)认为音频信号 系统可以认为是由音元所组成;音元作为一种包含独立、完整基本信息元素的最基本结构 单元,可认为是一种声音分子;声音分子(音元)的不同排列、组合形式构成了不同的声源; 结构、性状相同或相近的声音分子的多次重复、组合构成同一个音;紧密连接的不同音,其 内的音元从一种形态变化到另一种形态是一种渐变的而非突变的过程。对于音频信号,进 行以音元为基本处理(分割)单位的切割,然后在切割点处插入信息单元(比如,在切割点 处插入所被切割的音元本身),使原信号的长度增长;或在切割点处,删去性状相同或相近 的音元中的一个或几个,使原信号的长度縮短,从而实现对音频信号的变慢或变快放音,并 获得的变速不变调放音效果。这种方法的关键点是寻找最佳匹配区。寻找最佳匹配区的方 法一般有最大互相关系数法、最大归一化互相关系数法、最小平均幅度差系数法三种。众所 周知,在求最大互相关系数、最大归一化互相关系数、或者最小平均幅度差系数时都要经过 大量的运算,这极度增大了实现算法的复杂度,不利于变速不变调的实时性。同时,这些发 明在处理两帧的连接处时把两帧数据直接连接,使得连接处不平滑而引入噪声。 =
技术实现思路
本专利技术的目的在于提供一种实现声音变速不变调的方法,以复杂度非常低的算法 实现了声音变速不变调效果,同时保持了原始声音的自然度。 为了实现这一 目的,本专利技术的技术方案为一种实现声音变速不变调的方法,其特 征在于该方法的技术方案包含4个主要步骤A.输入缓存对将要被处理的原始音频信号 读入缓存中;B.分割数据采用窗口函数,根据变速系数从原始语音信号中提取出一串信 号子系列(即小段声音);C.连接数据将这些信号子系列按它们的时间先后顺序连接起 来就得到变速不变调信号;D.输出缓存把处理过的音频信号输出出去。在分割数据时,所 用到的窗口函数通过下面的方式构造一,), 0 Sw < /r1, w < /e (1) 并且,当0《n〈lT时, 0《P (n) < P (n+1)《1 (2) P (n)是三角窗、Harming窗、Hammiing窗、或者是Blackman窗的前半部分,或者 是正弦窗的半部分或者是满足式(2)的其他数列;lw为窗口长度;le为一个窗口中有效数 据的长度,在此被定义为窗口中权值大于0.5的数据长度;lT为窗口的过渡段的长度;L和 le, lT之间的关系如下: lw = le+lT (3)。 假设一次读入缓存的数据的采样数为l,当1 > 2L时,利用式(1)定义的窗口把 读入的音频信号分割成多个信号子系列,相邻子系列的起始位置之间的距离ls计算方式如下 ls = le a (4) 其中,a为变速系数,当a > 1时,声音加速;当0 < a < 1时,声音放慢。 当1《21w时,把读入的音频信号分割成两个信号子系列,分割方式是①当a > 1时,前一子系列为从本次读出数据的最前面的,长度为1/a的数据(但最后It个采祥与 窗口系列式(1)中尾部lT个数据相乘),后一子系列为本次读出数据的最后的,长度为lT的 那段数据(但头部的lT个采样与窗口系列式(1)的头部lT个数据相乘); 当0.5< a < 1时,前一子系列为从本次所读出的数据本身(但最后It个采祥与窗口系列式(1)中尾 部1t个数据相乘);后一子系列为本次读出数据的最后的、长度为l d= 1 ,(1/a-l)+lT的 那段数据,如果l d > l,则利用前一次读入数据的最后长度为ld = l d_l补足,并且头部 的It个采祥与窗口系列式(1)的头部It个数据相乘。 连接数据是把分割出来的子系列按照它们的时间先后顺序连接起来,连接处的处 理方式为把前一子系列的尾部过渡数据与后一段数据的头部过渡数据相加,即假设前一 子系列尾部长度为1T的数据系列为Xj(0《j < 1T),后一子系列头部长度为1T的数据系列 为yj (0《j < 1T),连接处的数据系列Zj (0《j < 1T),那么, Zj = Xj+yj (5) 本专利技术的另一目的在于提供一种实现声音变速变调的系统,该系统以极低的复杂 度算法实现了声音变速变调效果,同时保持了原始声音的自然度。 为了实现这一目的,本专利技术的技术方案为一种实现声音变速变调的系统,该系统 由以下4个部分组成输入缓存模块,将待处理声音信号数据读入缓存;变调处理模块,对 声音信号进行变调处理以改变声音的音调;变速不变调处理模块,对声音信号进行变速不 变调处理,以改变语速但音调不变;数据输出模块,把上述变速变调信号输出。变调模块是 利用重采样处理技术和低通滤波处理技术实现的。变速不变调处理模块包括分割数据模 块,根据变速系数利用窗口函数从原始语音信号中提取出一串信号子系列(即小段声音); 和连接数据模块,将这些信号子系列按它们的时间先后顺序连接起来。 由于变调处理技术与变速不变调处理技术是相互独立的,所有在本专利技术中实现变 速变调系统时有两种情况(l)先对原始音频信号进行变调处理以得到变调信号,再对变 调信号进行变速不变调处理,这样就得到所期望的变速变调信号;(2)先对原始音频信号 进行变速不变调处理,以得到变速信号,再对变速信号进行变调处理,这样也得到所期望的 变速变调信号。 本专利技术的优点在于以很低算法复杂度实现了音频的变速不变调功能和变速变调 功能,并不引入噪声,提高了处理后的声音质量。附图说明 图1为适用于本专利技术的系统环境; 图2为本本文档来自技高网
...

【技术保护点】
一种实现声音变速不变调的方法,其特征在于该方法的技术方案包含4个主要步骤:A.输入缓存:对将要被处理的原始音频信号读入缓存中;B.分割数据:采用窗口函数,根据变速系数从原始语音信号中提取出一串信号子系列(即小段声音);C.连接数据:将这些信号子系列按它们的时间先后顺序连接起来就得到变速不变调信号;D.输出缓存:把处理过的音频信号输出出去。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘盛举郝桂堂周琴
申请(专利权)人:刘盛举郝桂堂
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利