一种原声语音翻译方法技术

技术编号：30154457 阅读：13 留言：0更新日期：2021-09-25 15:05

本发明专利技术公开了一种原声语音翻译方法，涉及语音翻译技术领域，一种原声语音翻译方法，包括以下步骤：源语言语音采集，声音特征学习模块提取说话人的声音特征，送入深度神经网络DNN训练学习，STT模块转换源语音的文字信息，并分别由翻译模块和语言特征学习模块获取，其中，语言特征学习提取和记录源语言的语言特征，通过合成语音模块进行语音合成模拟。本发明专利技术通过将语言发音特征作为特征值送入深度神经网络DNN训练学习，学习后获得分别用于翻译与合成模块参考的语言特征模型特征向量与人声特征模型特征向量，通过合成语音模块进行语音合成模拟，发出与说话人语音相似的声音，使翻译后合成的语音高度接近说话人本人的特征。翻译后合成的语音高度接近说话人本人的特征。翻译后合成的语音高度接近说话人本人的特征。

全部详细技术资料下载

【技术实现步骤摘要】
一种原声语音翻译方法

[0001]本专利技术涉及语音翻译
，具体涉及一种原声语音翻译方法。

技术介绍

[0002]人工智能技术的发展使得语音翻译极大的发展与应用。语音翻译的过程主要将说话人的源语音信号转换为源文本信息，源文本信息通过文本翻译模块转换为目标语言的文本信息，再通过语音合成模块生成目标语言的语音信号播放而完成语音翻译，如今常用的语音翻译技术中，其翻译后发出的合成语音往往出现性别差异，说话人为男性但翻译语音为女声，缺少对说话人个性化的反应，无法传递说话想表达的情感和语言特征，且往往输出的语音生硬且交互体验不佳，进而造成翻译效果不够理想。

技术实现思路

[0003]本专利技术的目的是提供一种原声语音翻译方法，以解决现有技术中的上述不足之处。
[0004]为了实现上述目的，本专利技术提供如下技术方案：一种原声语音翻译方法，包括以下步骤：
[0005]步骤一、源语言语音采集，通过语音采集模块将语音信息采集后，发送给声音特征学习模块和STT(Speech
‑
To
‑
Text)模块。
[0006]步骤二、声音特征学习模块提取说话人的声音特征，特征被提取后经过深度神经网络DNN的学习建立声音特征模型，语言发音特征作为特征值送入深度神经网络DNN(Deep Neural Network)训练学习，学习后获得分别用于翻译与合成模块参考的语言特征模型特征向量与人声特征模型特征向量。
[0007]步骤三、STT模块转换源语音的文字信息，并分...

【技术保护点】

【技术特征摘要】
1.一种原声语音翻译方法，其特征在于，包括以下步骤：步骤一、源语言语音采集，通过语音采集模块将语音信息采集后，发送给声音特征学习模块和STT(Speech
‑
To
‑
Text)模块。步骤二、声音特征学习模块提取说话人的声音特征，特征被提取后经过深度神经网络DNN的学习建立声音特征模型，语言发音特征作为特征值送入深度神经网络DNN(Deep Neural Network)训练学习，学习后获得分别用于翻译与合成模块参考的语言特征模型特征向量与人声特征模型特征向量。步骤三、STT模块转换源语音的文字信息，并分别由翻译模块和语言特征学习模块获取，其中，语言特征学习提取和记录源语言的语言特征，该特征经深度神经网络DNN的学习后修正语言特征模型，该模型所用参数被用于翻译模块的重要参考参数，作为翻译的预判信息；步骤四、通过合成语音模块进行语音合成模拟，将翻译后，且经深度神经网络DNN的学习后修正语言特征模型作为语音输出的信息基础，模拟输出语言信息，采用时间区间模型与基频模型结合建立合成语音模型，生成时频谱信号，利用葛林氏算法Griffin
‑
Lim对合成语音模块进行合成处理，得到对应的人声特征语音信号，合成语音模型如下：S为给定的时频谱信号，x
i
...

【专利技术属性】
技术研发人员：孟强祥，田俊麟，宋昱，
申请(专利权)人：引智科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人