一种基于语音雷达与视频的语音合成方法技术

技术编号：21143699 阅读：42 留言：0更新日期：2019-05-18 05:55

本发明专利技术公开了一种基于语音雷达的新型语音合成方法，处理步骤如下：由雷达回波信号获得声带振动频率作为语音基频；由发音者发音时嘴唇视频信息提取的运动特征和麦克风同步获取语音信号提取的共振峰进行拟合，获得嘴唇的运动特征和共振峰映射关系的经验公式；将测试者发音时的嘴唇视频作为输入，获得时变共振峰；最后由获得的基频和时变共振峰进行语音合成。利用本发明专利技术的方法，可以不接触发音者体，将语音雷达与图像信息相结合，实现语音合成。

A Speech Synthesis Method Based on Speech Radar and Video

全部详细技术资料下载

【技术实现步骤摘要】
一种基于语音雷达与视频的语音合成方法
本专利技术属于雷达
，特别是一种基于语音雷达的新型语音合成方法。
技术介绍
语音是人类交流与沟通的最有效地方式之一。语音重构与恢复一直为科学家所研究。生物医学雷达技术已扩展语音信号，并且获得的语音信号质量可与麦克风信号相媲美；近年来，国际上很多计算机技术研究者利用数字图像处理技术与数字语音处理技术相结合，将图像信息的特征与语音信息特征进行融合，提高了背景噪声下的语音识别效果，然而现有技术中尚无将雷达信号与图像信息结合进行语音合成的方法。
技术实现思路
本专利技术的目的在于提供一种基于语音雷达的新型语音合成方法。实现本专利技术目的的技术解决方案为：一种基于语音雷达的新型语音合成方法，包括以下步骤：步骤1、语音的基频信息由雷达回波信号获取，非接触式语音雷达向发音者发送连续正弦波，通过接收天线接收，对回波进行预处理、基频与高次谐波模式分解、时频信号处理，从而获得时变声带振动的频率即语音信号的基频；步骤2、由发音者发音时嘴唇视频信息提取的运动特征和麦克风同步获取语音信号提取的共振峰进行拟合，获得嘴唇的运动特征和共振峰映射关系的经验公式；步骤3、由步骤2的经验公式，以发音者嘴唇的视频信息为输入进行测试，输出为发音者发字符的音的N组时变共振峰，其中发音者发音的字符可包括英文，中文等其他语言的字符。步骤4、由雷达回波获取的语音基频和视频获取的N组时变共振峰进行语音合成。本专利技术与现有技术相比，其显著优点在于：本专利技术的方法能脱离麦克风，不接触发音者体，将语音雷达与图像信息相结合，实现语音合成。本专利技术将生物雷达，视频图像技术...

【技术保护点】
1.一种基于语音雷达与视频的语音合成方法，其特征在于，包括以下步骤：步骤1、利用雷达回波信号获取语音的基频信息，具体为：非接触式语音雷达向发音者发送连续正弦波，接收天线接收回波信号，之后对接收到的回波信号进行预处理、基频与高次谐波模式分解、时频信号处理，从而获得时变声带振动的频率即语音信号的基频；步骤2、将发音者发音时嘴唇视频信息提取的时变运动特征和麦克风同步获取语音信号提取的时变共振峰进行拟合，获得嘴唇的时变运动特征和时变共振峰映射关系的经验公式；步骤3、将待合成语音的发音者嘴唇视频信息为输入，利用步骤2中的得到嘴唇的时变运动特征和时变共振峰映射关系的经验公式进行计算，得到发音者语音的N组时变共振峰，其中N为不小于三的整数；步骤4、由雷达回波获取的语音信号的基频和步骤3获得的N组时变共振峰进行语音合成，得到最终合成的语音信号。

【技术特征摘要】
1.一种基于语音雷达与视频的语音合成方法，其特征在于，包括以下步骤：步骤1、利用雷达回波信号获取语音的基频信息，具体为：非接触式语音雷达向发音者发送连续正弦波，接收天线接收回波信号，之后对接收到的回波信号进行预处理、基频与高次谐波模式分解、时频信号处理，从而获得时变声带振动的频率即语音信号的基频；步骤2、将发音者发音时嘴唇视频信息提取的时变运动特征和麦克风同步获取语音信号提取的时变共振峰进行拟合，获得嘴唇的时变运动特征和时变共振峰映射关系的经验公式；步骤3、将待合成语音的发音者嘴唇视频信息为输入，利用步骤2中的得到嘴唇的时变运动特征和时变共振峰映射关系的经验公式进行计算，得到发音者语音的N组时变共振峰，其中N为不小于三的整数；步骤4、由雷达回波获取的语音信号的基频和步骤3获得的N组时变共振峰进行语音合成，得到最终合成的语音信号。2.根据权利要求1所述的基于语音雷达与视频的语音合成方法，其特征在于，步骤1中所述的雷达回波信号为雷达回波所采集的发音者的声带振动信号；发音者的发音为某个字符的音。3.根...

【专利技术属性】
技术研发人员：洪弘，李慧，顾陈，赵恒，顾旭，高茜，奚梦婷，李彧晟，孙理，朱晓华，
申请(专利权)人：南京理工大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人