将文本转换为语音的系统及其存储介质技术方案

技术编号:28379737 阅读:24 留言:0更新日期:2021-05-08 00:07
本公开涉及将文本转换为语音的系统及其存储介质。用于从文本生成语音的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。系统之一包括一个或多个计算机和存储指令的一个或多个存储设备,当指令被一个或多个计算机执行时,使得一个或多个计算机实施:序列到序列递归神经网络,其被配置为:接收以特定自然语言的字符序列,并处理该字符序列以生成以特定自然语言的字符序列的言语表达的谱图;以及子系统,其被配置为:接收以特定自然语言的字符序列,并将该字符序列作为输入提供给序列到序列递归神经网络,以获得以特定自然语言的字符序列的言语表达的谱图作为输出。

【技术实现步骤摘要】
将文本转换为语音的系统及其存储介质分案说明本申请属于申请日为2018年3月29日的中国专利技术专利申请201880021978.2的分案申请。相关申请的交叉引用本申请是于2017年3月29日提交的希腊专利申请第20170100126号的非临时申请,并要求其优先权,该申请的全部内容通过引用结合于此。
本说明书涉及使用神经网络将文本转换为语音。
技术介绍
神经网络是机器学习模型,它采用非线性单元的一层或多层来预测接收输入的输出。一些神经网络除了输出层之外还包括一个或多个隐藏层。每个隐藏层的输出被用作网络中下一层(即下一隐藏层或输出层)的输入。网络的每一层根据相应参数集的当前值从接收输入生成输出。一些神经网络是递归神经网络。递归神经网络是接收输入序列并从输入序列生成输出序列的神经网络。具体地,递归神经网络可以在计算在当前时间步(timestep)中的输出时使用来自前一时间步的网络的一些或全部内部状态。递归神经网络的一个示例是包括一个或多个长短期(longshortterm,LSTM)存储器块的LSTM神经网络。本文档来自技高网...

【技术保护点】
1.一种计算机实现的方法,所述方法用于使用包括序列到序列递归神经网络的文本到语音转换系统从特定自然语言的字符序列生成所述特定自然语言的所述字符序列的言语表达的谱图,其中,所述序列到序列递归神经网络包括编码器神经网络和基于注意力的解码器递归神经网络,所述方法包括:/n在所述编码器神经网络处接收所述特定自然语言的所述字符序列;/n使用所述编码器神经网络处理所述字符序列以生成序列中的每个字符的相应编码表示;/n接收解码器输入序列;/n对于所述解码器输入序列中的每个解码器输入,使用所述基于注意力的解码器神经网络处理该解码器输入和所述编码表示以生成所述谱图的多个帧;以及/n从所述特定自然语言的所述字符序...

【技术特征摘要】
20170329 GR 201701001261.一种计算机实现的方法,所述方法用于使用包括序列到序列递归神经网络的文本到语音转换系统从特定自然语言的字符序列生成所述特定自然语言的所述字符序列的言语表达的谱图,其中,所述序列到序列递归神经网络包括编码器神经网络和基于注意力的解码器递归神经网络,所述方法包括:
在所述编码器神经网络处接收所述特定自然语言的所述字符序列;
使用所述编码器神经网络处理所述字符序列以生成序列中的每个字符的相应编码表示;
接收解码器输入序列;
对于所述解码器输入序列中的每个解码器输入,使用所述基于注意力的解码器神经网络处理该解码器输入和所述编码表示以生成所述谱图的多个帧;以及
从所述特定自然语言的所述字符序列的言语表达的所述谱图生成波形。


2.根据权利要求1所述的方法,其中,所述编码器神经网络包括编码器预网神经网络以及编码器CBHG神经网络,并且
其中,使用所述文本到语音转换系统的所述编码器神经网络处理所述字符序列以生成序列中的每个字符的相应编码表示包括:
使用所述编码器预网神经网络接收序列中的每个字符的相应嵌入,
使用所述编码器预网神经网络处理所述序列中的每个字符的所述相应嵌入以生成该字符的相应变换的嵌入,以及
使用所述编码器CBHG神经网络处理所述序列中的每个字符的相应变换的嵌入以生成该字符的相应编码表示。


3.根据权利要求2所述的方法,其中,所述编码器CBHG神经网络包括1-D卷积滤波器组,随后是高速通道网络,并且随后是双向递归神经网络。


4.根据权利要求3所述的方...

【专利技术属性】
技术研发人员:S本吉奥Y王Z杨Z陈Y吴I阿吉奥米詹纳基斯RJ韦斯N杰特里RM里夫金RAJ克拉克QV勒RJ瑞安Y肖
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1