口语评测方法及系统技术方案

技术编号:9643112 阅读:169 留言:0更新日期:2014-02-07 02:33
本发明专利技术涉及语音信号处理技术领域,公开了一种口语评测方法及系统,该方法包括:接收待评测的语音信号;利用至少两种不同的语音识别系统分别获取所述语音信号中各基本语音单元对应的语音片断;对获取的语音片断进行融合,得到对应所述语音信号的有效语音片断序列;从所述有效语音片断序列中提取评测特征;根据所述评测特征进行评分。利用本发明专利技术,可以提高口语评测的准确性,减少异常评分。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及语音信号处理
,公开了一种口语评测方法及系统,该方法包括:接收待评测的语音信号;利用至少两种不同的语音识别系统分别获取所述语音信号中各基本语音单元对应的语音片断;对获取的语音片断进行融合,得到对应所述语音信号的有效语音片断序列;从所述有效语音片断序列中提取评测特征;根据所述评测特征进行评分。利用本专利技术,可以提高口语评测的准确性,减少异常评分。【专利说明】口语评测方法及系统
本专利技术涉及语音信号处理
,具体涉及一种口语评测方法及系统。
技术介绍
作为人际交流的重要媒介,口语语言在实际生活中占有极其重要的地位。随着社会经济的不断发展和全球化趋势的加剧,人们对语言学习的效率以及语言评估的客观性、公正性和规模化测试提出了越来越高的要求。传统的人工口语水平评测方法使教师和学生在教学时间和空间上受到很大限制,在师资力量、教学场地、经费支出等方面也存在诸多硬件上的差距和不平衡;人工评测无法避免评估者自身的个体偏差,从而不能保证评分标准的统一,有时甚至无法准确反映被测者的真实水平;而对于大规模口语测试,则需要大量的人力、物力和财力支持,限制了经常性、规模性的评估测试。为此,业界相继开发出了一些语言教学和评测系统。在现有技术中,口语评测系统通常采用单识别器对接收到的语音信号进行语音识另IJ (如问答题)或者语音文本对齐(如朗读题),从而获取各基本语音单元对应的语音片断。随后系统从各语音片断中分别提取描述各基本语音单元发音标准度或流畅度等衡量口语评测标准的特征,最后基于所述特征通过预测分析得到评测最终得分。在安静的环境下使用高保真的录音设备时,语音识别系统由于能提供较高的识别准确率因而后续口语评测也能提供较为客观准确的结果。然而在实际应用中特别是对于大规模口语考试,录音环境不可避免会受到考场噪声、环境噪声等因素的影响,语音识别准确率下降导致口语评测过程中会出现一定比例的异常评分语音。显然这种现象使得大规模口语考试中计算机自动评分很难真正实用,限制了口语评测系统的应用范围和推广,对很多至关重要的考试无法应用,否则一旦出现异常评分就会造成评卷事故。
技术实现思路
本专利技术实施例提供一种口语评测方法及系统,以提高口语评测的准确性,减少异常评分。为此,本专利技术提供如下技术方案:一种口语评测方法,包括:接收待评测的语音信号;利用至少两种不同的语音识别系统分别获取所述语音信号中各基本语音单元对应的语音片断;对获取的语音片断进行融合,得到对应所述语音信号的有效语音片断序列;从所述有效语音片断序列中提取评测特征;根据所述评测特征进行评分。优选地,所述对获取的语音片断进行融合,得到对应所述语音信号的有效语音片断序列包括:将不同语音识别系统得到的语音片断对应的文本分别与预先构建的标准答案网络进行动态匹配,获取最优匹配结果;根据所述最优匹配结果依次生成不同对应单元的集合,所述对应单元是指其对应的不同语音识别系统得到的语音片断在时间上存在重叠性,并且能够正确匹配标准答案网络的识别结果单元;确定所述集合中的最优单元;依次拼接所述集合中的最优单元,得到对应所述语音信号的有效语音片断序列。优选地,所述确定所述集合中的最优单元包括:分别计算所述集合中各对应单元的语音片断的声学模型概率或发音后验概率;选择具有最大声学模型概率或发音后验概率的对应单元作为所述集合中的最优单元。优选地,所述评测特征对应一种特征类型,所述特征类型为以下任意一种:完整性特征、发音准确性特征、流利性特征、韵律特征;所述根据所述评测特征进行评分包括:加载与所述评测特征的特征类型相对应的评分预测模型;计算所述评测特征相应于所述评分预测模型的相似度,并将所述相似度作为所述语音信号的得分。优选地,所述评测特征包括对应不同特征类型的至少两组评测特征,所述特征类型为以下任意一种:完整性特征、发音准确性特征、流利性特征、韵律特征;所述根据所述评测特征进行评分包括:对于每组评测特征,加载与所述评测特征的特征类型相对应的评分预测模型;计算所述评测特征相应于所述评分预测模型的相似度,并将所述相似度作为所述评测特征的得分;根据每组评测特征的得分计算所述语音信号的得分。一种口语评测系统,包括:接收模块,用于接收待评测的语音信号;语音片断获取模块,用于利用至少两种不同的语音识别系统分别获取所述语音信号中各基本语音单元对应的语音片断;融合模块,用于对所述语音片断获取模块获取的语音片断进行融合,得到对应所述语音信号的有效语音片断序列;特征提取模块,用于从所述有效语音片断序列中提取评测特征;评分模块,用于根据所述评测特征进行评分。优选地,所述融合模块包括:匹配单元,用于将不同语音识别系统得到的语音片断对应的文本分别与预先构建的标准答案网络进行动态匹配,获取最优匹配结果;集合生成单元,用于根据所述最优匹配结果依次生成不同对应单元的集合,所述对应单元是指其对应的不同语音识别系统得到的语音片断在时间上存在重叠性,并且能够正确匹配标准答案网络的识别结果单元;确定单元,用于确定所述集合中的最优单元;拼接单元,用于依次拼接所述集合中的最优单元,得到对应所述语音信号的有效语音片断序列。优选地,所述确定单元包括:计算单元,用于分别计算所述集合中各对应单元的语音片断的声学模型概率或发音后验概率;选择单元,用于选择具有最大声学模型概率或发音后验概率的对应单元作为所述集合中的最优单元。优选地,所述评测特征对应一种特征类型,所述特征类型为以下任意一种:完整性特征、发音准确性特征、流利性特征、韵律特征;所述评分模块包括:加载单元,用于加载与所述评测特征的特征类型相对应的评分预测模型;计算单元,用于计算所述评测特征相应于所述评分预测模型的相似度,并将所述相似度作为所述语音信号的得分。优选地,所述评测特征包括对应不同特征类型的至少两组评测特征,所述特征类型为以下任意一种:完整性特征、发音准确性特征、流利性特征、韵律特征;所述评分模块包括:加载单元,用于对每组评测特征,加载与所述评测特征的特征类型相对应的评分预测模型;第一计算单元,用于计算所述评测特征相应于所述评分预测模型的相似度,并将所述相似度作为所述评测特征的得分;第二计算单元,用于根据每组评测特征的得分计算所述语音信号的得分。本专利技术实施例提供的口语评测方法及系统,对待评测的语音信号采用多种语音识别方式进行识别,得到多个语音片断序列;然后对这些语音片断序列进行融合获得有效语音片断序列,最后根据所述有效语音片断序列进行口语评测获得评测结果。该方法及系统通过提高语音识别结果的准确率以及口语评测考察对象的有效性和合理性,极大降低了评分异常的比例,从而更好地满足了大规模口语考试的应用需求。【专利附图】【附图说明】为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1是本专利技术实施例口语评测方法的流程图;图2是本专利技术实施例中不同语音识别系统识别结果的匹配信息示意图;图3是本专利技术实施例中构建评分预测模型的流程图;图4是本专利技术实施例口语评测系统的结构示意图;图5是本专利技术实施例口语评本文档来自技高网
...

【技术保护点】
一种口语评测方法,其特征在于,包括:接收待评测的语音信号;利用至少两种不同的语音识别系统分别获取所述语音信号中各基本语音单元对应的语音片断;对获取的语音片断进行融合,得到对应所述语音信号的有效语音片断序列;从所述有效语音片断序列中提取评测特征;根据所述评测特征进行评分。

【技术特征摘要】

【专利技术属性】
技术研发人员:王士进刘丹魏思胡郁刘庆峰
申请(专利权)人:安徽科大讯飞信息科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1