【技术实现步骤摘要】
一种基于声道和韵律特征的情感语音转换方法
本专利技术属于音频信号处理领域,涉及一种基于声道和韵律特征的情感语音转换方法。
技术介绍
随着人工智能技术和机器人的发展,人类的生活日益丰富,听演唱会,看电影和电视剧,玩直播、手机游戏和虚拟现实逐渐成为大众喜欢的娱乐方式,人们为了得到更好的听觉体验,对语音的要求也越来越高。现今人与计算机最常见的交流方式就是使用中性语言,而未来人与机器人的对话不再局限于中性语音的对话。在情感计算和智能交互领域中,为了赋予计算机观察、理解和表达情感的能力,情感语音转换将成为一项重要的研究。情感语音转换属于语音转换的一种,语音转换是指改变源说话人的语音个性化信息,从而带上目标说话人的语音个性化信息,其中个性化信息很广泛,包括性别,情感,年龄等信息。通过对语音转换的研究,可以进一步探究人类语音的发音机制,更好地掌握语音的参数特征,让人们可以通过操控这些关键的参数信息而改变语音信息,来达到自己的目的。语音转换的意义不仅仅局限于转换本身,还和语音分析、识别、编码、增强、隐藏等技术相关。首先,语音转换的研究离不开这些相关技术的研究理论和成果;其次,语音 ...
【技术保护点】
1.一种基于声道和韵律特征的情感语音转换方法,其特征在于,所述方法是利用神经网络得到中性和其他情感语音声道和韵律特征的转换模型,在说话内容保持不变的前提下,实现中性到情感之间的语音转换,转换方法的好坏直接反映在用户对转换后音频的听觉感受以及可视化的声纹中。
【技术特征摘要】
1.一种基于声道和韵律特征的情感语音转换方法,其特征在于,所述方法是利用神经网络得到中性和其他情感语音声道和韵律特征的转换模型,在说话内容保持不变的前提下,实现中性到情感之间的语音转换,转换方法的好坏直接反映在用户对转换后音频的听觉感受以及可视化的声纹中。2.根据权利要求1所述的方法,其特征在于,包括:S1:情感语音训练阶段,先对中性和其他情感语音进行预处理,然后提取其声道和韵律特征参数,建立转换模型;S2:情感语音转换阶段,将中性语音的声道和韵律特征参数输入转换模型中,将模型输出参数进行语音合成,合成目标情感语音。3.根据权利要求2所述的方法,其特征在于,所述步骤S1中,所述的预处理是指设置一系列参数,对语音进行分帧加窗预处理。4.根据权利要求2所述的方法,其特征在于,所述步骤S1中,所述的声道特征参数提取中进行LSP(linearspectrumpair)分析,是用n个离散频率的分布式密度来表示语音信号频谱特征的一种方法;而在LSP系数计算中,采用线性预测分析法,通过使实际采样值和线性预测采样值之间差值的二次方和达到最小值,即进行最小均方误差的逼近,直接决定一组线性预测系数,求出LSP系数。5.根据权利要求2所述的方法,其特征在于,所述步骤S1中,所述的韵律特征提取中,本发明采用了主体-延伸法获取基音周期T,进一步包括:S11:对语音信号序列x(n)加窗分帧预处理,得到第i帧的语音信号xi(n),对序列xi(n)进行端点检测和元音主体检测,然后对序列x(n)进行带通滤波,得到...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。