语音评测方法和语音评测装置制造方法及图纸

技术编号:11196728 阅读:89 留言:0更新日期:2015-03-26 03:21
本发明专利技术公开了一种语音评测方法,包括:获取语音数据,并对语音数据进行解码以获取语音解码数据;对语音解码数据进行分析以生成评估参数;通过多个映射模型分别对评估参数进行评估以生成多个评估得分;以及根据多个评估得分生成最终评估得分。本发明专利技术实施例的方法通过多种不同类型的映射模型综合评估用户的发音好坏,克服了单映射模型评测存在的打分不稳定性问题,保证系统稳定性的同时,也提高了系统评测的效果。本发明专利技术还公开了一种语音评测装置。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种语音评测方法,包括:获取语音数据,并对语音数据进行解码以获取语音解码数据;对语音解码数据进行分析以生成评估参数;通过多个映射模型分别对评估参数进行评估以生成多个评估得分;以及根据多个评估得分生成最终评估得分。本专利技术实施例的方法通过多种不同类型的映射模型综合评估用户的发音好坏,克服了单映射模型评测存在的打分不稳定性问题,保证系统稳定性的同时,也提高了系统评测的效果。本专利技术还公开了一种语音评测装置。【专利说明】语音评测方法和语音评测装置
本专利技术涉及语音识别
,尤其涉及一种语音评测方法和语音评测装置。
技术介绍
随着语音识别技术的不断成熟,涉及到信号处理、自然语音理解、人工智能、数据挖掘和机器学习等多个学科的智能语音评测技术也得到了越来越广泛的应用。例如,智能辅助教学系统班班通项目在各中小学的推广,普通话口语考试系统在全国的普及等。其中,智能语音评测就是利用计算机自动地或半自动地对人的语音进行标准程度的评估和发音缺陷的检测。如何提高系统的稳定性、评测打分的准确性是智能语音评测的关键,也受到了越来越多的关注。 目前,语音评测方法是基于传统的映射模型以确定用户输入的语音内容,并依据此内容计算声学、语言学特征;然后,系统基于某一通用打分模型,运用上述信息和特征计算最终评测结果。其具体流程如图1所示:步一:输入评测试卷和用户朗读的语音数据;步二:使用声学模型和语言模型进行语音解码,如通过受限语法网络的切分识别,或者通过大词汇量的语音识别;步三:根据识别结果、声学信息,进行发音好坏、语法、语音的正确度的评估分析;步四:系统使用预先训练好的专家知识或打分模型,与步三的发音质量、语法、语义等特征相运算,通过某种线性或非线性的映射模型映射出对应的分数。 目前,传统的语音评测方法主要存在以下几个缺点: I)由于任何一种映射模型只能做到全局最优,而非局部最优,所以在评分时仅采用单一的映射模型评测方法,无法拟合覆盖到所有的数据,从而对系统的稳定性造成很大的影响; 2)在实际的应用和正规的口语考试中,一定会存在一些系统无法正确评测的数据。然而,如何准确的定位并找出这些异常数据并提交人工复审是非常重要的事情,这对于传统的单映射模型评测方法来说,较难实现。
技术实现思路
本专利技术的目的旨在至少在一定程度上解决上述的技术问题之一。 为此,本专利技术的一个目的在于提出一种语音评测方法。该方法克服了单映射模型评测存在的打分不稳定性问题,保证系统稳定性的同时,也提高了系统评测的效果。 本专利技术的另一个目的在于提出一种语音评测装置。 为了实现上述目的,本专利技术一方面实施例的语音评测方法,包括:获取语音数据,并对所述语音数据进行解码以获取语音解码数据;对所述语音解码数据进行分析以生成评估参数;通过多个映射模型分别对所述评估参数进行评估以生成多个评估得分;以及根据所述多个评估得分生成最终评估得分。 根据本专利技术实施例的语音评测方法,可先对获取到的语音数据进行解码以获取语音解码数据,之后可对语音解码数据进行分析以生成评估参数,并通过多个映射模型分别对评估参数进行评估以生成多个评估得分,以及根据多个评估得分生成最终评估得分,即通过多种不同类型的映射模型综合评估用户的发音好坏,克服了单映射模型评测存在的打分不稳定性问题,保证系统稳定性的同时,也提高了系统评测的效果。 为了实现上述目的,本专利技术另一方面实施例的语音评测装置,包括:第一获取模块,用于获取语音数据,并对所述语音数据进行解码以获取语音解码数据;第一生成模块,用于对所述语音解码数据进行分析以生成评估参数;第二生成模块,用于通过多个映射模型分别对所述评估参数进行评估以生成多个评估得分;以及第三生成模块,用于根据所述多个评估得分生成最终评估得分。 根据本专利技术实施例的语音评测装置,可通过第一获取模块获取语音数据,并对语音数据进行解码以获取语音解码数据,第一生成模块对语音解码数据进行分析以生成评估参数,第二生成模块通过多个映射模型分别对评估参数进行评估以生成多个评估得分,第三生成模块根据多个评估得分生成最终评估得分,即通过多种不同类型的映射模型综合评估用户的发音好坏,克服了单映射模型评测存在的打分不稳定性问题,保证系统稳定性的同时,也提高了系统评测的效果。 本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。 【专利附图】【附图说明】 本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中: 图1是传统的语音评测方法的流程图; 图2是根据本专利技术一个实施例的语音评测方法的流程图; 图3是根据本专利技术一个实施例的语音评测方法的流程图; 图4是根据本专利技术一个实施例的语音评测装置的结构示意图; 图5是根据本专利技术另一个实施例的语音评测装置的结构示意图; 图6是根据本专利技术又一个实施例的语音评测装置的结构示意图;以及 图7是根据本专利技术再一个实施例的语音评测装置的结构示意图。 【具体实施方式】 下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。 下面参考附图描述根据本专利技术实施例的语音评测方法和语音评测装置。 图2是根据本专利技术一个实施例的语音评测方法的流程图。如图2所示,该语音评测方法可以包括: S201,获取语音数据,并对语音数据进行解码以获取语音解码数据。 其中,在本专利技术的实施例中,语音解码数据可包括声学特征信息和语言学特征信息。声学特征信息可包括音高、音长、音强和音色;语音学特征信息可包括但不限于语音、语法、词汇、语义等。 例如,可先获取用户根据评测试卷进行朗读时的语音数据,之后可通过现有技术中的声学模型和语言模型分别对该语音数据进行语音解码以获取对应的声学特征和语言学特征,如受限语法网络的切分识别,或者大词汇量的语音识别等。其中,在本专利技术的实施例中,声学模型可为语音识别系统中最为重要部分之一,如隐马尔科夫模型;语言模型是根据语言客观事实而进行的语言抽象数学建模,是一种对应关系,语言模型与语言客观事实之间的关系,如同数学上的抽象直线与具体直线之间的关系。 S202,对语音解码数据进行分析以生成评估参数。 具体地,对语音解码数据进行发音好坏、语法、语音的正确度等方面的评估分析,之后可将分析结果作为评估参数,如发音质量、语法正确率、语义正确率等。 S203,通过多个映射模型分别对评估参数进行评估以生成多个评估得分。 其中,在本专利技术的实施例中,多个映射模型可包括线性的Linear Regress1n映射模型、非线性的支持向量机SVM映射模型和Cart回归树映射模型等中的两种或多种。 需要说明的是,在本专利技术的实施例中,针对同一批评估参数(用于评估和描述用户发音、语法、语义正确性的参数),可使用多个不同类型的映射模型分别对其进行评估。此过程类似于考试现场,针对一个考生的语音数据由多个专家分别进行评分,考生的最终得分通过综合考虑多个专家的得分确本文档来自技高网
...

【技术保护点】
一种语音评测方法,其特征在于,包括以下步骤:获取语音数据,并对所述语音数据进行解码以获取语音解码数据;对所述语音解码数据进行分析以生成评估参数;通过多个映射模型分别对所述评估参数进行评估以生成多个评估得分;以及根据所述多个评估得分生成最终评估得分。

【技术特征摘要】

【专利技术属性】
技术研发人员:朱群何春江胡阳
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1