一种具有语音评估功能的网络教学方法及系统技术方案

技术编号：13201390 阅读：75 留言：0更新日期：2016-05-12 10:31

提供一种语音评估方法以及使用该方法的网络教学方法及系统。根据本发明专利技术的语音评估方法，语音的音素状态被用来替代传统的梅尔倒谱系数(MFCC)训练出来的多高斯混合模型，并以此为特征来计算后验概率和零阶Baum-Welch统计量；利用多种语言的音素识别器以提取基于音素的语音特征。本发明专利技术表明这基于多种语言提取的特征在捕捉非本土发音的信息时是互补的并且基于音素持续时间的特征在自动本土口音评估中是有效的。最终通过融合系统后，本发明专利技术的方法在开发集和测试集上达到了0.5706和0.6089的Spearman相关系数。此相关系数表明，本发明专利技术提出的方法在口语评估中是十分准确并有效的。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术设及一种基于多语言音素后验概率和多语言音素持续时间相关特征的自动本地口音评估方法，属于语音识别领域，特别是设及口语评估领域，还设及一种具有语音评估功能的网络教学方法及系统。
技术介绍
近年来，随着移动互联网的普及和网络教学系统的快速发展，传统教学模式已逐渐不能满足用户对于多媒体信息化教学方式的需求。在网络教学过程中，教学过程的实时同步显示、教学过程的实时录制W及快速有效的点播回放，越来越为广大用户所关注。现有技术中，为了满足上述需要，在同步显示和录制等方面，提出了很多方案：现有技术1(《中国图象图形学报》，第8卷第9期，2003年9月，张丽萍等，"一种基于拷屏和压缩技术的屏幕共享方案"）公开了常见的屏幕共享包括两种方式:利用操作系统底层的GUI矢量指令实现;利用拷屏和压缩技术实现屏幕共享，屏幕显示内容不是通过拆解成具体的绘图命令来实现，而是通过先拷贝屏幕图像，然后进行数据压缩处理并传到客户端，最后由客户端解码显示来实现拷屏内容的重现。如图1所示，现有技术2 (《现代计算机》，2006年第5期，黄帆，"基于压缩域的肝EG...

【技术保护点】
一种语音评估方法，包括以下步骤：步骤1)，语音信号的采集，形成待评估音频数据；步骤2)，语音特征序列的提取，提取所述音频数据的3种特征：梅尔倒谱多高斯后验概率MGPP特征、音素后验概率PPP特征和基于音素持续时间的语音特征；步骤3)，特征序列层面上的融合：分别融合所述PPP特征和所述基于音素持续时间的语音特征，得到融合后的PPP特征和融合后的基于音素持续时间的特征；由于PPP特征和基于音素持续时间特征都是基于5种不同语言的音素上提取的，所以每个基于音素的特征都会产生5种不同的子特征，最后融合5种子特征，得到最终的PPP特征和基于音素持续时间的语音特征；步骤4)，评分层面上的融合：采用两层支持向...

【技术特征摘要】

【专利技术属性】
技术研发人员：李明，全小虎，卢启伟，徐永键，
申请(专利权)人：深圳市鹰硕音频科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人