【技术实现步骤摘要】
【国外来华专利技术】用于文本到语音的超结构循环神经网络
技术介绍
利用文本到语音应用来将书面文本读出来。这样的应用可以协助视力不好的人们、处于不期望阅读文本的位置上(例如,在开车的时候)的人们,以及更喜欢听到文本的阅读而不是阅读文本的人们。在向用户阅读文本的情况中,用户通常想要听到发音更自然并且准确地阅读文本的声音。实施例是针对这样的情况以及其他一般情况来做出的。同样,虽然已经讨论了相对具体的问题,但是应当理解的是实施例不应被限制为解决
技术介绍
中所识别出的特定问题。
技术实现思路
在一个方面中,技术关于用于将文本转换为语音的方法。该方法包括接收文本输入以及从由词性特性、音素、语言注音特性、上下文特性、以及语义特性构成的组中接收两个或更多个特性。该两个或更多个拼音特性是由循环神经网络(RNN)模块确定的。该方法还包括基于所接收的两个或更多个特性来确定文本输入的拼音特性,并且生成了生成序列。在一个实施例中,接收到的两个或更多个特性是词性特性和因素。在另一个实施例中,接收到的两个或更多个特性是语言注音特性、上下文特性以及语义特性。在另一个实施例中,接收到的两个或更多个特性是音素、上下文特性、以及语义 ...
【技术保护点】
一种用于将文本转换为语音的方法,所述方法包括:接收文本输入;从由以下项构成的组中接收两个或更多个特性:词性特性、音素、语言注音特性、上下文特性、以及语义特性;其中,所述两个或更多个特性是由循环神经网络模块来进行确定的;基于所接收的两个或更多个特性来确定用于所述文本输入的拼音特性;以及生成生成序列。
【技术特征摘要】
【国外来华专利技术】2014.06.13 US 14/303,9691.一种用于将文本转换为语音的方法,所述方法包括:接收文本输入;从由以下项构成的组中接收两个或更多个特性:词性特性、音素、语言注音特性、上下文特性、以及语义特性;其中,所述两个或更多个特性是由循环神经网络模块来进行确定的;基于所接收的两个或更多个特性来确定用于所述文本输入的拼音特性;以及生成生成序列。2.根据权利要求1所述的方法,还包括对所述生成序列进行优化。3.根据权利要求1所述的方法,其中,所述两个或更多个特性被接收作为密集辅助输入。4.根据权利要求1所述的方法,其中,所述文本输入和所述两个或更多个特性被接收作为密集辅助输入。5.根据权利要求1所述的方法,其中,确定用于所述文本输入的拼音特性是利用循环神经网络来进行确定的。6.根据权利要求5所述的方法,其中,所述两个或更多个特性是由所述循环神经网络的隐藏层和输出层来进行接收的。7.一种具有计算机可执行指令的计算机存储设备,当由至少一个处理器执行时,所述计算机可执行指令执行用于转换文本到语音的方法,所...
【专利技术属性】
技术研发人员:赵培,M·梁,姚开盛,B·严,赵晟,F·A·阿勒瓦,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。