基于集成特征和神经网络的语音可视化方法技术

技术编号：6803981 阅读：493 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及一种基于集成特征和神经网络的语音可视化方法，其特殊之处是：包括语音信号预处理、特征提取、特征优化、神经网络设计、位置信息映射、主颜色编码、图案信息编码和图像合成八个步骤。本发明专利技术通过集成不同的语音特征进入一幅图像中为聋哑人创造了语音信号的可读模式，而且不同位置上的图像颜色不同，这就更好地利用了聋哑人对色彩刺激的视觉记忆能力较强的优点；为减少屏幕容纳负荷和观察者记忆负担，提出采用声调特征来对图案信息进行编码，这样由相同声韵母不同声调构成的语音会显就示在同一个位置上。与现有方法相比，本发明专利技术具有很好的鲁棒性和分类定位能力，在聋哑人辅助学习方面，收到了良好的效果。?

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种汉语普通话的可视化方法，特别涉及一种。
技术介绍
语音是语言的声学表现，是人类交流信息最自然、最有效、最方便的手段，也是人类思维的一种依托。而对聋人来说，语言交流变成一件很难实现的事情，一部分聋人不能说话是因为他们的听觉器官遭到破坏，不能将语音信息采集到大脑。研究表明，人类听觉系统和视觉系统是两个性质不同的并具有互补性的信息系统，视觉系统是一个高度并行的信息接收和处理系统，人类眼球中视网膜上的数百万个锥状细胞通过纤维状神经组织与大脑相连，形成一个高度并行的信道，视觉信道接受信息的速率是很高的，据测量和估算，看电视时的信息接收速率大致可达到2X104Vs，这比听觉系统听语音时的信息接收速度高出上千倍，因此人们相信人类所获得的信息有70%是通过视觉获得的说法。所以对于聋人人来说，这无疑就是一个很大的助手，听觉的缺陷由视觉来补偿，语音不仅能听见，还可以通过多种其他形式使聋哑人“看”见。1947年R. K. Potter和G. A. Kopp等人就提出了一种可视化方法一语谱图，随后有不同的语音研究专家开始研究改进这种语音可视化方法，比如在1976年L. C. Stewart等人提出了有色谱图和1984年G. M. Kuhn等人提出了对聋人进行训练的实时的语谱图系统，以及1986年P. E. Stern、1998年F. Plante和2008年R. Steinberg等人也提出了许多语谱图的改进方法，但是显示的语谱图的专业性很强，而且很难辨别记忆。尤其是对于同一个语音不同的人来说，甚至是同一个语音同一个人来说都有可能造成语谱图的变化，对于...

【技术保护点】
信息与图案信息融合在一幅图像中在显示屏上显示，每幅图像显示２～５秒后消失。７）图案信息编码采用声调特征来对图案信息进行编码，四个声调特征参数作为神经网络Ⅰ的输入，神经网络Ⅰ的输出即为相应的图案信息，用００、０１、１０、１１分别表示阴平、阳平、上声和去声；　（８）图像合成按照单语音产生的先后顺序，把位置信息、主颜色“１”组合进行编码，每个位置对应一个无调单语音；（６）主颜色编码采用共振峰特征来对主颜色信息进行编码，把所有的共振峰特征值Ｆ１、Ｆ２、Ｆ３分别求平均值，然后通过Ｒ＝５Ｆ１／Ｆ３、Ｇ＝３Ｆ３／５Ｆ２、Ｂ＝Ｆ２／３Ｆ１，将其转换成主颜色信息；（量与优化特征参数组合的数量相同，输出层有ｎ个神经元，ｎ为７、８或９；（５）位置信息映射将优化特征参数组合作为神经网络Ⅱ的输入，将特征编成具有ｍ个码的方阵，２ｎ－１≤ｍ≤２ｎ，按着由左到右、由上到下的顺序依次对应着图像中的一个位置并用“０”、－ＭＦＣＣ１～ＰＭＵＳＩＣ－ＭＦＣＣ１２和ＷＰＴＣ１～ＷＰＴＣ２０进行优化，得到优化特征参数组合；（４）神经网络设计所述的神经网络是由神经网络Ⅰ和神经网络Ⅱ组成，其中神经网络Ⅰ的输入层有４个神经元，输出层有...

【技术特征摘要】

【专利技术属性】
技术研发人员：韩志艳，伦淑娴，王健，王东，于忠党，王巍，邰治新，
申请(专利权)人：渤海大学，
类型：发明
国别省市：21

全部详细技术资料下载我是这个专利的主人