一种基于DIVA神经网络模型的汉语元音发音方法技术

技术编号：8215908 阅读：299 留言：0更新日期：2013-01-17 15:50

本发明专利技术公开了一种基于DIVA神经网络模型的汉语元音发音方法，利用DIVA神经网络模型对汉语元音目标进行分类学习训练并产生汉语元音发音，利用主元音方法建立汉语元音音素单元集，并将汉语元音音素单元集中的音素转换为共振峰频率的形式后映射到DIVA神经网络模型中，再随机输入汉语元音，对该汉语元音进行训练和学习，直到所有的汉语元音都被学习过为止，最后通过扬声器将汉语元音输出。该方法训练过程中精度高，最终实现模拟人体发出汉语元音。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种发音方法，更具体地说是一种基于DIVA神经网络模型的汉语元音发音方法。
技术介绍
将大脑中的思维过程“阅读〃出来，这一直是人类的一个梦想。波士顿大学语音实验室的弗兰克·冈瑟教授(Guenther. F. H.)提出的DIVA自适应神经网络模型帮助人们实现了这一梦想。他专利技术的DIVA模型依赖的语音背景是英文的29个基本音素，图5中给出了 DIVA模型依赖的29个英文音素。对于以汉语为母语的中国人来讲，要“阅读”其思维过程，需要对汉语语音加工过程中的大脑机制进行深入研究和讨论。DIVA (Directions Intoof Articulators)模型是一种关于语音生成与获取后描述相关处理过程的数学模型，主要用来仿真和描述有关大脑中涉及语音生成和语音理解区域的相关功能。可以说，它是一种为了生成单词、音节或音素，用来控制模拟声道运动的自适应神经网络模型。该网络模型在计算机中学习控制模拟声道的运动，以产生相应的语音。学习完成之后，模型能够产生语音的任意组合。DIVA网络模型为许多长期研究的语音生成现象包括运动等效、语境变化、说话时速度的影响、预期的协同发音和结转协同发音提供了一个统一的解释。对于人类语言能力统一计算模型的需求推动着DIVA模型的发展，自冈瑟教授在1994年首次提出DIVA网络模型以来涌现出了不少新的版本，不同版本的DIVA模型大致地反映了神经解剖学和大脑有关区域的关联性。到目前为止，DIVA网络的定义和测试相对而言仍然是最彻底的，并且是唯一应用伪逆控制方案的模型，这种控制方案对于人类发音器官的运动学数据提供了十分精确的解...

【技术保护点】
一种基于DIVA神经网络模型的汉语元音发音方法，其特征在于利用DIVA神经网络模型对汉语元音目标进行分类学习训练并产生汉语元音发音，包括以下步骤：步骤1、通过麦克风采集所有的汉语元音，并获取所有汉语元音的共振峰频率；步骤2、利用主元音方法建立汉语元音音素单元集，并将汉语元音音素单元集中的音素转换为共振峰频率的形式后映射到DIVA神经网络模型中，初始所有的汉语元音音素单元集中的音素单元为未激活状态；步骤3、随机输入一个汉语元音的共振峰频率，对该汉语元音进行训练和学习，具体为：判断汉语元音音素单元集中是否存在与该汉语元音的共振峰频率相同的音素单元，若存在，则激活映射到DIVA神经网络模型中的汉语元音音素单元中相应的音素单元；若不存在，则不能产生相应的发音，结束对该汉语元音的训练；步骤4、再次随机输入一个汉语元音的共振峰频率，判断此汉语元音是否已经在DIVA神经网络模型中学习过，若已经学习过，则跳过训练过程，直接通过扬声器发出该激活状态的音素单元所对应的元音；否则对该汉语元音进行训练和学习，具体为：判断汉语元音音素单元集中是否存在与该汉语元音的共振峰频率相同的音素单元，若存在，则激活映射到D...

【技术特征摘要】

【专利技术属性】
技术研发人员：张少白，刘欣，徐磊，徐歆冰，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人