一种自动检测语言学习者朗读错误的方法技术

技术编号：4330929 阅读：330 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及一种用于自动检测语言学习者朗读错误的方法，包括：根据朗读语料训练多发音模型；根据参考答案、发音字典、多发音模型构建精简搜索空间；根据参考答案及语言学知识构建朗读语言模型；对输入语音预处理分帧，提取语音特征；采用Ｖｉｔｅｒｂｉ算法在精简搜索空间中搜索一条声学模型得分、语言模型得分及发音得分的累积分数最高的一条发音路径作为识别发音序列；将识别的发音序列与参考答案的发音序列通过动态规划匹配算法对齐，进而得到朗读的多读、漏读、错读结果。本发明专利技术中采用隐马尔可夫模型作为声学模型，不需要模板语音，可大大提高使用的便利性，其性能和运行速度也较好。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机辅助语言教学领域，具体的说，本专利技术涉及一种自动检测语言学习者朗读语音中的朗读错误的方法。
技术介绍
在计算机辅助语言教学中，能够自动检测用户朗读语音中的错误并及时给予反馈是至关重要的一个部分。在语言朗读学习中，对词或字的多读、漏读、错读是学习者最容易出现的朗读错误。以往的检测方法通常是将用户语音与标准语音进行模板匹配，进而检测出朗读错误的位置。标准语音通常是事先录制好的老师的语音。这种方法最大的缺点是需要标准语音作为模板，学习材料不能随意更换，在实际应用中，非常的不方便。基于隐含马尔可夫模型的自动语音识别技术的发展给计算机辅助语言教学提供了一种新的发展道路。自动语音识别技术通过对大量的语音数据进行统计分析，构建出符合语音特征的声学模型；识别过程中，语音识别解码单元根据声学模型在一个有限的搜索空间中找到一条与实际语音最为匹配的一条路径，即语音的识别结果。一般意义上的语音识别技术解决的是将语音转化成文字的问题，其最终的输出结果是一个文字序列。在这里，语音的内容是完全未知的，因此它一般采用很大的词表和通用的语言模型来包含尽可能多的候选项。对于朗读错误检测的任务，其要解决的是检测用户语音与参考答案是否匹配的问题，其最终的输出结果是一个朗读错误的位置和类型信息。这时，用户朗读的内容是已知的，因此，通常的语音识别方法在这里并不适合。基于此，本专利技术提供了。
技术实现思路
本专利技术的目的在于提供。该方法以基于隐马尔可夫模型的自动语音识别技术为基础，提出了一种用于自动检测语言学习者朗读语音中的多读、漏读和错读的新...

【技术保护点】
一种自动检测语言学习者朗读错误的方法，其特征在于，包含如下步骤：　１）前端处理：对输入语音进行预处理，进行特征提取，所提取特征为ＭＦＣＣ特征矢量；　２）构建精简搜索空间：将用户所要朗读的内容作为参考答案，并根据参考答案、发音字典、多发音模型和声学模型构建精简的搜索空间；　３）构建朗读语言模型：根据参考答案构建用户的朗读语言模型，该语言模型描述用户在朗读该参考语句的时候可能朗读的上下文内容及其概率信息；　４）搜索：在搜索空间中，根据声学模型、朗读语言模型和多发音模型搜索得到与输入的特征矢量流最匹配的一条路径，作为用户的实际朗读结果内容，做成识别结果序列；　５）对齐：将所述参考答案与识别结果进行对齐，得到用户多读、漏读、错读的检测结果。

【技术特征摘要】
1、一种自动检测语言学习者朗读错误的方法，其特征在于，包含如下步骤1)前端处理对输入语音进行预处理，进行特征提取，所提取特征为MFCC特征矢量；2)构建精简搜索空间将用户所要朗读的内容作为参考答案，并根据参考答案、发音字典、多发音模型和声学模型构建精简的搜索空间；3)构建朗读语言模型根据参考答案构建用户的朗读语言模型，该语言模型描述用户在朗读该参考语句的时候可能朗读的上下文内容及其概率信息；4)搜索在搜索空间中，根据声学模型、朗读语言模型和多发音模型搜索得到与输入的特征矢量流最匹配的一条路径，作为用户的实际朗读结果内容，做成识别结果序列；5)对齐将所述参考答案与识别结果进行对齐，得到用户多读、漏读、错读的检测结果。2、如权利要求l所述的自动检测语言学习者朗读错误的方法，其特征在于，所述步骤l)中对输入语音的预处理包括对输入语音数字化、预加重高频提升、分帧及加窗处理，所述特征提取包括提取每一帧语音的MFCC特征矢量及两阶差分矢量。3、如权利要求l所述的自动检测语言学习者朗读错误的方法，其特征在于，所述步骤2)进一步包括如下步骤a) 将用户所要朗读的内容作为参考答案，并对参考答案进行分词；b) 对每个词，根据其发音字典和多发音模型，找到其所有可能的发音，构建成词网络，并加入一个filler发音；c) 根据发音字典，将上述词网络中的每个词展开成音素序列，构成一个音素网络；d) 将每个音素再转换成对应的隐马尔可夫模型，每个马尔可夫模型由若干个状...

【专利技术属性】
技术研发人员：颜永红，董滨，刘常亮，
申请(专利权)人：中国科学院声学研究所，北京中科信利技术有限公司，
类型：发明
国别省市：11[]

全部详细技术资料下载我是这个专利的主人