提高口语评测性能的方法及系统技术方案

技术编号:9695433 阅读:106 留言:0更新日期:2014-02-21 02:26
本发明专利技术公开了一种提高口语评测性能的方法及系统,该方法包括:接收待评测的用户语音数据,所述语音数据包括:朗读题语音数据和半开放题型语音数据;根据所述朗读题语音数据对各朗读题进行评分;从评分结果中获取自适应有效数据;根据所述自适应有效数据对预设的声学模型进行优化;利用优化后的声学模型对各半开放题进行评分。利用本发明专利技术,可以有效地提高口语评测的准确性。

【技术实现步骤摘要】
提高口语评测性能的方法及系统
本专利技术涉及语音信号处理
,具体涉及一种提高口语评测性能的方法及系统。
技术介绍
作为人际交流的重要媒介,口语语言在实际生活中占有极其重要的地位。随着社会经济的不断发展和全球化趋势的加剧,人们对语言学习的效率以及语言评估的客观性、公正性和规模化测试提出了越来越高的要求。传统的人工口语水平评测方法使教师和学生在教学时间和空间上受到很大限制,在师资力量、教学场地、经费支出等方面也存在诸多硬件上的差距和不平衡;人工评测无法避免评估者自身的个体偏差,从而不能保证评分标准的统一,有时甚至无法准确反映被测者的真实水平;而对于大规模口语测试,则需要大量的人力、物力和财力支持,限制了经常性、规模性的评估测试。为此,业界相继开发出了一些语言教学和评测系统。口语评测主要涉及到两类题型,即朗读题型和半开放题型。其中,朗读题型是指要求用户朗读预设文本借以考察用户对基本语音单元发音的标准程度及语句朗读的流利程度;半开放题型是指由系统播放图像、视频或者短文等提示内容,并根据这些提示内容要求用户回答相关问题或口语复述播放内容等的测试项目。对于半开放题型的口语评测,现有技术中主要是利用自动语音识别技术对用户语音内容进行文本识别,然后根据识别结果统计关键词汇和短语命中率等特征进行相关评分。由于半开放题型的口语评测标准主要在于判断关键词汇和短语是否出现语法错误,因此对待评测语音进行语音识别获取正确的识别结果显得尤为重要,如何提高在半开放性题型口语评测中语音识别结果的正确率是亟待解决的一个重要问题。
技术实现思路
本专利技术实施例提供一种提高口语评测性能的方法及系统,以提高口语评测的准确性。为此,本专利技术提供如下技术方案:一种提高口语评测性能的方法,包括:接收待评测的用户语音数据,所述语音数据包括:朗读题语音数据和半开放题型语音数据;根据所述朗读题语音数据对各朗读题进行评分;从评分结果中获取自适应有效数据;根据所述自适应有效数据对预设的声学模型进行优化;利用优化后的声学模型对各半开放题进行评分。优选地,所述根据所述朗读题语音数据对各朗读题进行评分包括:将所述朗读题语音数据与所述朗读题的题面文本信息进行字音对齐,获取文本字串中各基本语音单元对应的语音信号片段;计算所述基本语音单元与其对应的语音信号片段的似然度;根据所述似然度统计所述基本语音单元与其对应的语音信号片段的后验概率;根据所述后验概率计算各朗读题的得分。优选地,所述从评分结果中获取自适应有效数据包括:选择得分高于设定的第一门限的朗读题的语音数据作为自适应有效数据。优选地,所述方法还包括:在根据所述自适应有效数据对预设的声学模型进行优化之前,对所述自适应有效数据进行语音单元均衡处理,包括:分别统计每句自适应有效数据中各类簇出现的次数,所述各类簇是指发音类似的基本语音单元集合;依据所述各类簇出现的次数,利用最小化目标函数确定目标自适应语句;所述根据所述自适应有效数据对预设的声学模型进行优化包括:根据所述目标自适应语句对预设的声学模型进行优化。优选地,所述从评分结果中获取自适应有效数据包括:选择后验概率高于设定的第二门限的基本语音单元对应的语音数据作为自适应有效数据。优选地,所述方法还包括:在根据所述自适应有效数据对预设的声学模型进行优化之前,对所述自适应有效数据进行语音单元均衡处理,包括:分别统计每句自适应有效数据中各类簇出现的次数,所述各类簇是指发音类似的基本语音单元集合;依据所述各类簇出现的次数,利用最小化目标函数确定目标自适应基本语音单元;所述根据所述自适应有效数据对预设的声学模型进行优化包括:根据所述目标自适应基本语音单元对预设的声学模型进行优化。优选地,所述根据所述自适应有效数据对预设的声学模型进行优化包括:采用基于最大似然线性回归的自适应方式对预设的声学模型进行优化;或者采用基于最大后验概率的自适应方式对预设的声学模型进行优化。一种提高口语评测性能的系统,包括:接收模块,用于接收待评测的用户语音数据,所述语音数据包括:朗读题语音数据和半开放题型语音数据;朗读题评分模块,用于根据所述朗读题语音数据对各朗读题进行评分;自适应数据提取模块,用于从所述朗读题评分模块输出的评分结果中获取自适应有效数据;模型优化模块,用于根据所述自适应有效数据对预设的声学模型进行优化;半开放题评分模块,用于利用优化后的声学模型对各半开放题进行评分。优选地,所述朗读题评分模块包括:对齐单元,用于将所述朗读题语音数据与所述朗读题的题面文本信息进行字音对齐,获取文本字串中各基本语音单元对应的语音信号片段;似然度计算单元,用于计算所述基本语音单元与其对应的语音信号片段的似然度;后验概率计算单元,用于根据所述似然度统计所述基本语音单元与其对应的语音信号片段的后验概率;得分计算单元,用于根据所述后验概率计算各朗读题的得分。优选地,所述自适应数据提取模块,具体用于选择得分高于设定的第一门限的朗读题的语音数据作为自适应有效数据。优选地,所述系统还包括:第一均衡模块,用于在根据所述自适应数据对预设的声学模型进行优化之前,对所述自适应有效数据进行语音单元均衡处理;所述第一均衡模块包括:统计单元,用于分别统计每句自适应有效数据中各类簇出现的次数,所述各类簇是指发音类似的基本语音单元集合;第一确定单元,用于依据所述各类簇出现的次数,利用最小化目标函数确定目标自适应语句;所述模型优化模块,具体用于根据所述目标自适应语句对预设的声学模型进行优化。优选地,所述自适应数据提取模块,具体用于选择后验概率高于设定的第二门限的基本语音单元对应的语音数据作为自适应有效数据。优选地,所述系统还包括:第二均衡模块,用于在根据所述自适应数据对预设的声学模型进行优化之前,对所述自适应有效数据进行语音单元均衡处理;所述第二均衡模块包括:统计单元,用于分别统计每句自适应有效数据中各类簇出现的次数,所述各类簇是指发音类似的基本语音单元集合;第二确定单元,用于依据所述各类簇出现的次数,利用最小化目标函数确定目标自适应基本语音单元;所述模型优化模块,具体用于根据所述目标自适应基本语音单元对预设的声学模型进行优化。优选地,所述模型优化模块,具体用于采用基于最大似然线性回归的自适应方式对预设的声学模型进行优化;或者采用基于最大后验概率的自适应方式对预设的声学模型进行优化。本专利技术实施例提供的提高口语评测性能的方法及系统,从考生朗读题语音中提取有效自适应数据,并利用该数据对声学模型进行自动优化,从而将通用声学模型定制成与考生音色一致的考生模型,将话者无关模型转化成话者相关模型,极大地提高了语音识别效果,从而有效地提高了半开放题型甚至整体口语评测系统评分的准确性。【附图说明】为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1是现有技术中对半开放题型的评测方法的示意图。图2是本专利技术实施例提高口语评测性能的方法的流程图;图3是本专利技术实施例提高口语评测性能的系统的一种结构示意图;图4是本专利技术实施例提高口语评测性能的系统的另一种结构示意图;图5是本专利技术本文档来自技高网...

【技术保护点】
一种提高口语评测性能的方法,其特征在于,包括:接收待评测的用户语音数据,所述语音数据包括:朗读题语音数据和半开放题型语音数据;根据所述朗读题语音数据对各朗读题进行评分;从评分结果中获取自适应有效数据;根据所述自适应有效数据对预设的声学模型进行优化;利用优化后的声学模型对各半开放题进行评分。

【技术特征摘要】
1.一种提高口语评测性能的方法,其特征在于,包括: 接收待评测的用户语音数据,所述语音数据包括:朗读题语音数据和半开放题型语音数据;根据所述朗读题语音数据对各朗读题进行评分; 从评分结果中获取自适应有效数据; 根据所述自适应有效数据对预设的声学模型进行优化; 利用优化后的声学模型对各半开放题进行评分。2.根据权利要求1所述的方法,其特征在于,所述根据所述朗读题语音数据对各朗读题进行评分包括: 将所述朗读题语音数据与所述朗读题的题面文本信息进行字音对齐,获取文本字串中各基本语音单元对应的语音信号片段; 计算所述基本语音单元与其对应的语音信号片段的似然度; 根据所述似然度统计所述基本语音单元与其对应的语音信号片段的后验概率; 根据所述后验概率计算各朗读题的得分。3.根据权利要求2所述的方法,其特征在于,所述从评分结果中获取自适应有效数据包括: 选择得分高于设定的第一门限的朗读题的语音数据作为自适应有效数据。4.根据权利要求3所述的方法,其特征在于,所述方法还包括: 在根据所述自适应有效数据对预设的声学模型进行优化之前,对所述自适应有效数据进行语音单元均衡处理,包括: 分别统计每句自适应有效数据中各类簇出现的次数,所述各类簇是指发音类似的基本语音单元集合; 依据所述各类簇出现的次数,利用最小化目标函数确定目标自适应语句; 所述根据所述自适应有效数据对预设的声学模型进行优化包括:根据所述目标自适应语句对预设的声学模型进行优化。5.根据权利要求2所述的方法,其特征在于,所述从评分结果中获取自适应有效数据包括: 选择后验概率高于设定的第二门限的基本语音单元对应的语音数据作为自适应有效数据。6.根据权利要求5所述的方法,其特征在于,所述方法还包括: 在根据所述自适应有效数据对预设的声学模型进行优化之前,对所述自适应有效数据进行语音单元均衡处理,包括: 分别统计每句自适应有效数据中各类簇出现的次数,所述各类簇是指发音类似的基本语音单元集合; 依据所述各类簇出现的次数,利用最小化目标函数确定目标自适应基本语音单元;所述根据所述自适应有效数据对预设的声学模型进行优化包括:根据所述目标自适应基本语音单元对预设的声学模型进行优化。7.根据权利要求1至6任一项所述的方法,其特征在于,所述根据所述自适应有效数据对预设的声学模型进行优化包括:采用基于最大似然线性回归的自适应方式对预设的声学模型进行优化;或者 采用基于最大后验概率的自适应方式对预设的声学模型进行优化。8.一种提高口语评测性能的系统,其特征在于,包括: 接收模块,用于接收待评测的用户语音数据,所述语音数据...

【专利技术属性】
技术研发人员:高前勇魏思胡国平刘丹陈进胡郁
申请(专利权)人:安徽科大讯飞信息科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1