【技术实现步骤摘要】
本专利技术为一件分案申请,原申请的申请号为95190349.7,申请日为1995年3月21日,专利技术名称为“使用神经网络变换文本为声频信号的方法和设备”。本专利技术涉及变换文本为声频信号的领域,特别涉及使用神经网络变换文本信号为声频信号。文本/话音变换涉及变换文本信息流为话音波形。这个变换过程通常包括文本的话音表示物变换为多个话音参数,然后话音参数由话音合成器变换为话音波形。使用级联系统(Concatenative sys-tem)变换话音表示物为话音参数。级联系统存储由话音分析产生的可能是二重单音或半音节的参数,和响应话音表示物,使用以调节它们的持续期间和平滑诸多跳变(transition)以产生话音参数的存储图型串接起来。级联系统的一个问题是必须存储大量的图型。一般地,在级联系统中必须存储1000个以上的图型。另外,在存储图型之间的跳变不是平滑的。还使用按规则合成(synthesis-by-rule)系统变换话音表示物为语音参数。按规则合成系统存储每个可能的语音表示物的目标话音参数。按照一组规则在语音表示物之间跳变的基础上修改目标话音参数。按规则合成系 ...
【技术保护点】
一种变换文本为声频信号的设备,其特征在于,包括:一个文本/音素处理器,其中该文本/音素处理器翻译文本流为一系列音素表示物;一个持续期间处理器,可操作地接到该文本/音素处理器,其中该持续期间处理器为该文本流产生持续期间数据;一个预 处理器,其中该预处理器变换该系列音素表示和该持续期间数据为一系列音素帧,其中该系列音素帧的每个音素帧具有固定持续期间并具有一个前后关系描述,和其中该前后关系表述是基于该系列音素帧的每个音素帧和该系列音素帧的至少一些其它音素帧;一个神经网 络,其中该神经网络基于该前后关系描述为该系列音素帧的一个音素帧产生一个声频表示物。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:奥尔汉卡拉里,杰拉尔德爱德华科里恩,艾拉艾伦拉尔森,
申请(专利权)人:摩托罗拉公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。