The invention proposes a speech conversion method based on harmonic impulse decomposition, which includes the following steps: S1, decomposes speech signal into harmonic signal and impulse signal; S2, converts the harmonic signal into speech signal to form target harmonic signal; S3, superimposes the target harmonic signal and the impulse signal to form the target harmonic signal. Target speech signal. The invention adopts the harmonic impulse decomposition model to decompose the speech signal. The speech signal is decomposed into the harmonic signal part and the impulse signal part. Only the harmonic signal part is decomposed and sparsely expressed. Without any processing of the impulse signal, the information completeness can be guaranteed and the loss of information can be reduced. It is also conducive to improving the quality of the converted speech. The processing process is simple, convenient, and has a strong popularization. It has a high application prospect.
【技术实现步骤摘要】
一种基于谐波冲激分解的语音转换方法
本专利技术属于语音转换
,具体涉及一种基于谐波冲激分解的语音转换方法。
技术介绍
说话人身份特征是语音信号中所包含的一种非常重要的特征信息。语音转换的处理对象就是语音信号中的身份特征信息,它的目的就是要改变源语音中的身份特征,使得转换后的语音听起来就像是特定的目标说话人的声音一样。语音转换技术具有广泛的应用前景,特别是应用于个性化的语音合成领域。
技术实现思路
本专利技术提出一种基于谐波冲激分解的语音转换方法,以提高语音转换后的语音质量,简化语音转换处理过程。为实现本专利技术的目的,本专利技术采用以下技术方案:一种基于谐波冲激分解的语音转换方法,包括如下步骤:S1,将语音信号分解成谐波信号和冲激信号;S2,将所述谐波信号进行语音转换,形成目标谐波信号;S3,将所述目标谐波信号与所述冲激信号进行叠加,形成目标语音信号。进一步地,步骤S1中,将语音信号分解成谐波信号和冲激信号的具体步骤如下:S11,采用STRAIGHT模型对所述语音信号进行建模,得到该语音信号的频谱矢量序列X,X表示成语音信号的语谱图;S12,计算水平方向的幅度谱和垂直方向的幅度谱分别为:其中m表示语谱图的时间点,k表示语谱图的频点;wh用来描述水平方向中值滤波器的长度;wp用来描述垂直方向中值滤波器的长度;median(·)表示中值滤波函数。S13,对语音信号的语谱图X进行标记,得到谐波信号的标记矩阵Mh和冲激信号的标记矩阵Mp,即:S14,计算所述语音信号的谐波信号频谱Xh(m,k)和冲激信号频谱Xp(m,k),即:Xh(m,k)=X(m,k)·Mh( ...
【技术保护点】
1.一种基于谐波冲激分解的语音转换方法,其特征在于,包括如下步骤:S1,将语音信号分解成谐波信号和冲激信号;S2,将所述谐波信号进行语音转换,形成目标谐波信号;S3,将所述目标谐波信号与所述冲激信号进行叠加,形成目标语音信号。
【技术特征摘要】
1.一种基于谐波冲激分解的语音转换方法,其特征在于,包括如下步骤:S1,将语音信号分解成谐波信号和冲激信号;S2,将所述谐波信号进行语音转换,形成目标谐波信号;S3,将所述目标谐波信号与所述冲激信号进行叠加,形成目标语音信号。2.根据权利要求1所述的方法,其特征在于:步骤S1中,将语音信号分解成谐波信号和冲激信号的具体步骤如下:S11,采用STRAIGHT模型对所述语音信号进行建模,得到该语音信号的频谱矢量序列X,X表示成语音信号的语谱图;S12,计算水平方向的幅度谱和垂直方向的幅度谱分别为:其中m表示语谱图的时间点,k表示语谱图的频点;wh用来描述水平方向中值滤波器的长度;wp用来描述垂直方向中值滤波器的长度;median(·)表示中值滤波函数;S13,对语音信号的语谱图X进行标记,得到谐波信号的标记矩阵Mh和冲激信号的标记矩阵Mp,即:S14,计算所述语音信号的谐波信号频谱Xh(m,k)和冲激信号频谱Xp(m,k),即:Xh(m,k)=X(m,k)·Mh(m,k)Xp(m,k)=X(m,k)·Mp(m,k)。3.根据权利要求2所述的方法,其特征在于:所述方法包括训练阶段和转换阶段,在所述训练阶段,所述语音信号包括源语音信号和样本语音信号,所述步骤S1中,对所述源语音信号和样本语音信号进行激光冲激分解,同时提取梅尔频率倒谱系数MFCC,用MFCC根据动态时间规整算法对源语音信号和样本语...
【专利技术属性】
技术研发人员:简志华,张石磊,郭珊,徐剑,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。