通过频谱包络共振峰的频移动态修改语音音色的方法和装置制造方法及图纸

技术编号：23057429 阅读：31 留言：0更新日期：2020-01-07 16:14

本发明专利技术描述了一种用于修改声音信号的方法，所述方法包括：在频域中获得声音信号的时间帧的步骤；针对至少一个时间帧，在频域中应用声音信号的第一变换，包括：针对所述至少一个时间帧提取声音信号的频谱包络的步骤；计算所述频谱包络的共振峰的频率的步骤；修改(350)声音信号的频谱包络的步骤，所述修改包括应用(351)频谱包络的频率的连续递增变换函数，该连续递增变换函数由频谱包络的至少两个共振峰频率参数化。

A method and device for dynamically modifying voice tone by frequency shift of spectrum envelope formant

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】通过频谱包络共振峰的频移动态修改语音音色的方法和装置
本专利技术涉及声学处理领域。更具体地，本专利技术涉及修改包含语言的声学信号，以便为语音提供音色，例如微笑音色。
技术介绍
微笑可辨识地改变我们语音的声音，以至于到了客户服务部门建议他们的代表在电话上微笑的程度。即使客户看不到微笑，也会对客户满意度产生积极影响。研究与微笑语音相关的声音信号的特征是一个尚未被充分记录的新研究领域。使用颧肌微笑会改变口腔的形状，从而影响语音的频谱。已经特别证实，当说话者微笑时，语音的声谱指向较高的频率，而当语音悲伤时，语音的声谱指向较低的频率。文献QuenéH.,Semin,G.R.,&Foroni,F.(2012).Audiblesmilesandfrownsaffectspeechcomprehension.SpeechCommunication,54(7),917-922描述了一种微笑语音模拟测试。该实验包括记录一个由实验者中性发音的单词。该实验基于共振峰的频率与语音的音色之间的关系。语言声音的共振峰是语言的声谱的能量最大值。Quené实验包括：当它发出单词时，分析语音的共振峰，存储共振峰的频率，通过将初始共振峰的频率增加10％来产生修改后的共振峰，然后用修改后的共振峰重新合成单词。Quené实验使得可以获得被感知到是在微笑时发音的单词。然而，合成的单词具有将被用户感知为人造的音色。此外，Quené提出的两步架构要求在能够重新合成信号之前分析信号的一部分，从而导致在发出单词的时刻与可...

【技术保护点】
1.一种用于修改声音信号的方法，所述方法包括：/n在频域中获得(310)声音信号的时间帧的步骤；/n针对至少一个时间帧，在频域中应用所述声音信号的第一变换(320a)，包括：/n针对所述至少一个时间帧，提取(330)所述声音信号的频谱包络的步骤；/n计算(340)所述频谱包络的共振峰的频率的步骤；/n修改(350)所述声音信号的所述频谱包络的步骤，所述修改包括应用(351)所述频谱包络的频率的连续递增变换函数，该连续递增变换函数由所述频谱包络的至少两个共振峰频率参数化。/n

【技术特征摘要】
【国外来华专利技术】20170213 FR 17511631.一种用于修改声音信号的方法，所述方法包括：
在频域中获得(310)声音信号的时间帧的步骤；
针对至少一个时间帧，在频域中应用所述声音信号的第一变换(320a)，包括：
针对所述至少一个时间帧，提取(330)所述声音信号的频谱包络的步骤；
计算(340)所述频谱包络的共振峰的频率的步骤；
修改(350)所述声音信号的所述频谱包络的步骤，所述修改包括应用(351)所述频谱包络的频率的连续递增变换函数，该连续递增变换函数由所述频谱包络的至少两个共振峰频率参数化。

2.根据权利要求1所述的方法，其中修改(350)所述声音信号的所述频谱包络的步骤还包括:对所述频谱包络应用(352)滤波器，所述滤波器由所述声音信号的所述频谱包络的第三共振峰(F3)的频率参数化。

3.根据权利要求1或2所述的方法，包括：根据包括至少一种浊音帧类别和一种非浊音帧类别的一组时间帧类别对时间帧进行分类(360)的步骤。

4.根据权利要求3所述的方法，包括：
针对每个浊音帧，在频域中应用所述声音信号的所述第一变换(320a)；
针对每个非浊音帧，在频域中应用所述声音信号的第二变换(320b)，所述第二变换包括：应用滤波器以增加以预定频率为中心的声音信号(370)的能量的步骤。

5.根据权利要求4所述的方法，其中，所述声音信号的所述第二变换(320b)包括：
针对所述至少一个时间帧，提取(330)所述声音信号的频谱包络的步骤；
应用(351b)所述频谱包络的频率的连续递增变换函数，该连续递增变换函数与紧接在前的时间帧的频谱包络的频率的连续递增变换函数相同地被参数化。

6.根据权利要求1至5中任一项所述的方法，其中，应用(351)所述频谱包络的频率的连续递增变换函数包括：
为根据所述频谱包络的共振峰确定的一组初始频率(410、420、430、440、450)，计算修改的频率(410a、420a、430a、440a、450a)；
根据所述频谱包络的共振峰和所述修改的频率确定所述一组初始频率中的初始频率之间的线性插值(460、461、462、463)。

7.根据权利要求5所述的方法，其中通过将来自所述一组初始频率中的初始频率(420、430、440)乘以乘数系数(α)来获得至少一个修改的频率(420a、430a、440a)。
...

【专利技术属性】
技术研发人员：让朱立安·奥库蒂里耶，帕布罗·阿里亚斯，阿克塞尔·罗贝尔，
申请(专利权)人：法国国家科研中心，索邦大学，声学音乐研究及调配研究院，
类型：发明
国别省市：法国;FR

全部详细技术资料下载我是这个专利的主人