提高口语评测性能的方法及系统技术方案

技术编号：9695433 阅读：106 留言：0更新日期：2014-02-21 02:26

本发明专利技术公开了一种提高口语评测性能的方法及系统，该方法包括：接收待评测的用户语音数据，所述语音数据包括：朗读题语音数据和半开放题型语音数据；根据所述朗读题语音数据对各朗读题进行评分；从评分结果中获取自适应有效数据；根据所述自适应有效数据对预设的声学模型进行优化；利用优化后的声学模型对各半开放题进行评分。利用本发明专利技术，可以有效地提高口语评测的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
提高口语评测性能的方法及系统
本专利技术涉及语音信号处理
，具体涉及一种提高口语评测性能的方法及系统。
技术介绍
作为人际交流的重要媒介，口语语言在实际生活中占有极其重要的地位。随着社会经济的不断发展和全球化趋势的加剧，人们对语言学习的效率以及语言评估的客观性、公正性和规模化测试提出了越来越高的要求。传统的人工口语水平评测方法使教师和学生在教学时间和空间上受到很大限制，在师资力量、教学场地、经费支出等方面也存在诸多硬件上的差距和不平衡；人工评测无法避免评估者自身的个体偏差，从而不能保证评分标准的统一，有时甚至无法准确反映被测者的真实水平；而对于大规模口语测试，则需要大量的人力、物力和财力支持，限制了经常性、规模性的评估测试。为此，业界相继开发出了一些语言教学和评测系统。口语评测主要涉及到两类题型，即朗读题型和半开放题型。其中，朗读题型是指要求用户朗读预设文本借以考察用户对基本语音单元发音的标准程度及语句朗读的流利程度；半开放题型是指由系统播放图像、视频或者短文等提示内容，并根据这些提示内容要求用户回答相关问题或口语复述播放内容等的测试项目。对于半开放题型的口语评测，现有技术中主要是利用自动语音识别技术对用户语音内容进行文本识别，然后根据识别结果统计关键词汇和短语命中率等特征进行相关评分。由于半开放题型的口语评测标准主要在于判断关键词汇和短语是否出现语法错误，因此对待评测语音进行语音识别获取正确的识别结果显得尤为重要，如何提高在半开放性题型口语评测中语音识别结果的正确率是亟待解决的一个重要问题。
技术实现思路
本专利技术实施例提供一种提高口...

【技术保护点】
一种提高口语评测性能的方法，其特征在于，包括：接收待评测的用户语音数据，所述语音数据包括：朗读题语音数据和半开放题型语音数据；根据所述朗读题语音数据对各朗读题进行评分；从评分结果中获取自适应有效数据；根据所述自适应有效数据对预设的声学模型进行优化；利用优化后的声学模型对各半开放题进行评分。

【技术特征摘要】
1.一种提高口语评测性能的方法，其特征在于，包括: 接收待评测的用户语音数据，所述语音数据包括:朗读题语音数据和半开放题型语音数据；根据所述朗读题语音数据对各朗读题进行评分；从评分结果中获取自适应有效数据；根据所述自适应有效数据对预设的声学模型进行优化；利用优化后的声学模型对各半开放题进行评分。2.根据权利要求1所述的方法，其特征在于，所述根据所述朗读题语音数据对各朗读题进行评分包括: 将所述朗读题语音数据与所述朗读题的题面文本信息进行字音对齐，获取文本字串中各基本语音单元对应的语音信号片段；计算所述基本语音单元与其对应的语音信号片段的似然度；根据所述似然度统计所述基本语音单元与其对应的语音信号片段的后验概率；根据所述后验概率计算各朗读题的得分。3.根据权利要求2所述的方法，其特征在于，所述从评分结果中获取自适应有效数据包括: 选择得分高于设定的第一门限的朗读题的语音数据作为自适应有效数据。4.根据权利要求3所述的方法，其特征在于，所述方法还包括: 在根据所述自适应有效数据对预设的声学模型进行优化之前，对所述自适应有效数据进行语音单元均衡处理，包括: 分别统计每句自适应有效数据中各类簇出现的次数，所述各类簇是指发音类似的基本语音单元集合；依据所述各类簇出现的次数，利用最小化目标函数确定目标自适应语句；所述根据所述自适应有效数据对预设的声学模型进行优化包括:根据所述目标自适应语句对预设的声学模型进行优化。5.根据权利要求2所述的方法，其特征在于，所述从评分结果中获取自适应有效数据包括: 选择后验概率高于设定的第二门限的基本语音单元对应的语音数据作为自适应有效数据。6.根据权利要求5所述的方法，其特征在于，所述方法还包括: 在根据所述自适应有效数据对预设的声学模型进行优化之前，对所述自适应有效数据进行语音单元均衡处理，包括: 分别统计每句自适应有效数据中各类簇出现的次数，所述各类簇是指发音类似的基本语音单元集合；依据所述各类簇出现的次数，利用最小化目标函数确定目标自适应基本语音单元；所述根据所述自适应有效数据对预设的声学模型进行优化包括:根据所述目标自适应基本语音单元对预设的声学模型进行优化。7.根据权利要求1至6任一项所述的方法，其特征在于，所述根据所述自适应有效数据对预设的声学模型进行优化包括:采用基于最大似然线性回归的自适应方式对预设的声学模型进行优化；或者采用基于最大后验概率的自适应方式对预设的声学模型进行优化。8.一种提高口语评测性能的系统，其特征在于，包括: 接收模块，用于接收待评测的用户语音数据，所述语音数据...

【专利技术属性】
技术研发人员：高前勇，魏思，胡国平，刘丹，陈进，胡郁，
申请(专利权)人：安徽科大讯飞信息科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人