【技术实现步骤摘要】
本专利技术设及一种基于多语言音素后验概率和多语言音素持续时间相关特征的自 动本地口音评估方法,属于语音识别领域,特别是设及口语评估领域,还设及一种具有语音 评估功能的网络教学方法及系统。
技术介绍
近年来,随着移动互联网的普及和网络教学系统的快速发展,传统教学模式已逐 渐不能满足用户对于多媒体信息化教学方式的需求。在网络教学过程中,教学过程的实时 同步显示、教学过程的实时录制W及快速有效的点播回放,越来越为广大用户所关注。现有 技术中,为了满足上述需要,在同步显示和录制等方面,提出了很多方案: 现有技术1(《中国图象图形学报》,第8卷第9期,2003年9月,张丽萍等,"一种基于 拷屏和压缩技术的屏幕共享方案")公开了常见的屏幕共享包括两种方式:利用操作系统底 层的GUI矢量指令实现;利用拷屏和压缩技术实现屏幕共享,屏幕显示内容不是通过拆解成 具体的绘图命令来实现,而是通过先拷贝屏幕图像,然后进行数据压缩处理并传到客户端, 最后由客户端解码显示来实现拷屏内容的重现。 如图1所示,现有技术2 (《现代计算机》,2006年第5期,黄帆,"基于压缩域的肝EG ...
【技术保护点】
一种语音评估方法,包括以下步骤:步骤1),语音信号的采集,形成待评估音频数据;步骤2),语音特征序列的提取,提取所述音频数据的3种特征:梅尔倒谱多高斯后验概率MGPP特征、音素后验概率PPP特征和基于音素持续时间的语音特征;步骤3),特征序列层面上的融合:分别融合所述PPP特征和所述基于音素持续时间的语音特征,得到融合后的PPP特征和融合后的基于音素持续时间的特征;由于PPP特征和基于音素持续时间特征都是基于5种不同语言的音素上提取的,所以每个基于音素的特征都会产生5种不同的子特征,最后融合5种子特征,得到最终的PPP特征和基于音素持续时间的语音特征;步骤4),评分层面上的 ...
【技术特征摘要】
【专利技术属性】
技术研发人员:李明,全小虎,卢启伟,徐永键,
申请(专利权)人:深圳市鹰硕音频科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。