评价口语能力的方法和系统技术方案

技术编号：3750108 阅读：199 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供了评价讲话者的一个或多个口语能力的技术。该技术包括：标识讲话者所讲的语段中的一个或多个感兴趣时间位置；计算一个或多个声学参数，其中所述一个或多个声学参数捕获所述一个或多个感兴趣时间位置的一个或多个声学－语音学特征的一个或多个特性；以及将所述一个或多个声学参数与自动语音识别器的输出相结合，以修改口语语言能力评价的输出。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术的实施例一般涉及信息技术，具体涉及语音识别。
技术介绍
评价口语语法能力是评价考生或个人的总体英语口语能力的主要组成部分。此外，人们对学习和提高英语口语能力的兴趣的骤增，外加因特网的日益普及激起了对计算机辅助语言学习(CALL，computerassisted language learning)领域的兴趣。大多数现有 CALL系统的方法关注发音和/或音节重音的评价。然而，这样的方法不关注口语语法评价。另外，现有CALL系统的评价由评估人员作出，导致主观、缺乏可衡量性、和较高成本等。在传统方法中，为了评价口语语法能力，要请考生针对给定话题讲一段话，然后由评估人员根据考生犯的语法错误的类型和频率来评价考生。然而，这样的方法难以实现自动口语语法评价，因为当前自动语音识别(ASR，automatic speech recognition)系统的准确性对于即兴自由演讲来说相对较低。并且，在ASR中起重要作用的语言模型(LM)显著降低了识别语法不正确的句子的概率。在现有自动方法中，向考生播放可能含有语法错误的提示。期待考生检测任何语法错误，并且记录相应语法正确的句子，然后让ASR系统利用包括一组预选句子的LM来解码该相应语法正确的句子。然而，这样的方法仍然可能引起识别错误。例如，当LM中的两个(或更多个)句子在声学上彼此相近时(例如，"he kill a snake"与"hekilled a snake")，这样的方法会出错。在这种情况下，很有可能识别成与实际讲的那句不同的句子。此外，在这样的方法中，当考生讲了一句未存在于L...

【技术保护点】
一种用于评价讲话者的一个或多个口语语言能力的方法，包含如下步骤：标识讲话者所讲的语段中的一个或多个感兴趣时间位置；计算一个或多个声学参数，其中所述一个或多个声学参数捕获所述一个或多个感兴趣时间位置的一个或多个声学－语音学特征的一个或多个特性；以及将所述一个或多个声学参数与自动语音识别器的输出相结合，以修改口语语言能力评价的输出。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：OD德什姆克，A维尔马，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人