一种数据评估教育系统技术方案

技术编号:15984580 阅读:39 留言:0更新日期:2017-08-12 06:10
本发明专利技术公开了一种数据评估教育系统,包括:语音预处理模块,取得周围语音信息,所述周围语音信息包含对所述数据评估教育系统讲话的讲话语音、表示所述讲话语音的讲话者的周围的声音,将所述周围语音信息分离为包含所述讲话语音的第1语音信息和包含除了所述讲话语音以外的声音的第2语音信息,将所述第1语音信息的声级和所述第2语音信息的声级进行比较,根据比较的结果,采用第1再现方法、和再现的语音的指向性与所述第1再现方法不同的第2再现方法中的某一方,再现对所述讲话语音的应答语音将待评测的英语口语音频文件随机分割为等长度切片。本发明专利技术通过语音识别技术,对语音进行识别处理,评估准确率高,扩展性强。

【技术实现步骤摘要】
一种数据评估教育系统
本专利技术涉及一种系统,具体是一种数据评估教育系统。
技术介绍
目前市场上己经出现了口语数据评估教育系统,但这些产品目前采用的都是如下方法:先利用语音识别技术将学生口语音频识别成文本,而后对识别的文本进行特征分析,最后用机器学习算法给出学生口语评估结果。该方法最大问题来自语音识别阶段以及后续的特征分析阶段。首先,高精度的英语语音识别引擎研发成本昂贵,目前只有类似谷歌之类的大型科技公司或研究单位才拥有。其次,语音识别的结果决定后续一切,然而目前的英语语音识别技术只是在发音标准的语音识别上有足够的准确率,而在发音不够准确的英语初学者(比如中国英语学习者)语音识别上还不理想。最后,特征分析阶段需要英语口语教学考试领域的专家来设计特征,这也会消耗不少人力物力,而且效果不好。
技术实现思路
本专利技术的目的在于提供一种数据评估教育系统,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种数据评估教育系统,包括:语音预处理模块,取得周围语音信息,所述周围语音信息包含对所述数据评估教育系统讲话的讲话语音、表示所述讲话语音的讲话者的周围的声音,将所述周围语音信息分离为包含所述讲话语音的第1语音信息和包含除了所述讲话语音以外的声音的第2语音信息,将所述第1语音信息的声级和所述第2语音信息的声级进行比较,根据比较的结果,采用第1再现方法、和再现的语音的指向性与所述第1再现方法不同的第2再现方法中的某一方,再现对所述讲话语音的应答语音将待评测的英语口语音频文件随机分割为等长度切片;卷积神经网络分析模块,对得到的音频切片进行短时傅里叶变换生成对应的二维时频图,再逐个对一维时频图进行高级抽象,得到音频切片的高级抽象特征;评估与反馈模块,通过机器学习模型逐个对音频切片的高级抽象特征进行分析得到每个音频切片的分数,再对所有得分取平均数即得到最终的英语口语评估分数。作为本专利技术进一步的方案:所述随机音频切片的时长为10s。作为本专利技术进一步的方案:所述语音信号处理模块,针对所有音频切片,依次完成时域分析、频域分析和倒谱域分析;声学参数分析模块,对音频切片的声学参数进行分析和计算,声学参数包括MLL频率倒谱系数、线性预测倒谱系数和线谱对系数。作为本专利技术进一步的方案:所述第2再现方法是对所述讲话者具有指向性的再现方法,在所述第1语音信息的声级高于所述第2语音信息的声级的情况下,采用所述第1再现方法再现所述应答语音,在所述第1语音信息的声级低于所述第2语音信息的声级的情况下,采用所述第2再现方法再现所述应答语音。作为本专利技术再进一步的方案:所述语音信号处理模块包括以下模块:时域分析模块,分析和提取音频切片中的时域特征参数;频域分析模块,通过带通滤波器组法、傅里叶变换法、频域基音检测法、时一频表示方法,提取音频切片的频谱、功率谱、频谱包络;倒谱域分析模块,通过同态处理分析和提取音频切片的倒谱域特征参数,进一步将声门激励信息和声道响应信息有效地分开:声门激励信息用于判断清浊音、求基音周期,声道响应信息用于求共振峰,用于语音的编码、合成、识别。与现有技术相比,本专利技术的有益效果是:本专利技术通过语音识别技术,对语音进行识别处理,评估准确率高,扩展性强。具体实施方式下面对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例中,一种数据评估教育系统,包括:语音预处理模块,取得周围语音信息,所述周围语音信息包含对所述数据评估教育系统讲话的讲话语音、表示所述讲话语音的讲话者的周围的声音,将所述周围语音信息分离为包含所述讲话语音的第1语音信息和包含除了所述讲话语音以外的声音的第2语音信息,将所述第1语音信息的声级和所述第2语音信息的声级进行比较,根据比较的结果,采用第1再现方法、和再现的语音的指向性与所述第1再现方法不同的第2再现方法中的某一方,再现对所述讲话语音的应答语音将待评测的英语口语音频文件随机分割为等长度切片;卷积神经网络分析模块,对得到的音频切片进行短时傅里叶变换生成对应的二维时频图,再逐个对一维时频图进行高级抽象,得到音频切片的高级抽象特征;评估与反馈模块,通过机器学习模型逐个对音频切片的高级抽象特征进行分析得到每个音频切片的分数,再对所有得分取平均数即得到最终的英语口语评估分数。根据所述讲话语音构成,取得包含对语音对话装置讲话的讲话语音的、表示讲话语音的讲话者的周围的声音的周围语音信息。周围语音信息被分离为包含讲话语音的第1语音信息和包含除了讲话语音以外的声音的第2语音信息。将第1语音信息的声级和第2语音信息的声级进行比较。根据比较的结果,采用第1再现方法和再现的语音的指向性与第1再现方法的不同的第2再现方法中的某一方再现应答语音。因此,根据包含对语音对话装置讲话的讲话语音的第1语音信息的声级、和包含除了讲话语音以外的声音的第2语音信息的声级的比较结果,采用第1再现方法和再现的语音的指向性与第1再现方法的不同的第2再现方法中的某一方再现应答语音,所以能够采用与讲话者的周围的状况相应的再现方法再现应答语音。所述随机音频切片的时长为10s。所述语音信号处理模块,针对所有音频切片,依次完成时域分析、频域分析和倒谱域分析;声学参数分析模块,对音频切片的声学参数进行分析和计算,声学参数包括MLL频率倒谱系数、线性预测倒谱系数和线谱对系数。所述第2再现方法是对所述讲话者具有指向性的再现方法,在所述第1语音信息的声级高于所述第2语音信息的声级的情况下,采用所述第1再现方法再现所述应答语音,在所述第1语音信息的声级低于所述第2语音信息的声级的情况下,采用所述第2再现方法再现所述应答语音。所述语音信号处理模块包括以下模块:时域分析模块,分析和提取音频切片中的时域特征参数;频域分析模块,通过带通滤波器组法、傅里叶变换法、频域基音检测法、时一频表示方法,提取音频切片的频谱、功率谱、频谱包络;倒谱域分析模块,通过同态处理分析和提取音频切片的倒谱域特征参数,进一步将声门激励信息和声道响应信息有效地分开:声门激励信息用于判断清浊音、求基音周期,声道响应信息用于求共振峰,用于语音的编码、合成、识别。对于本领域技术人员而言,显然本专利技术不限于上述示范性实施例的细节,而且在不背离本专利技术的精神或基本特征的情况下,能够以其他的具体形式实现本专利技术。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本专利技术的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本专利技术内。此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。本文档来自技高网...

【技术保护点】
一种数据评估教育系统,其特征在于,包括:语音预处理模块,取得周围语音信息,所述周围语音信息包含对所述数据评估教育系统讲话的讲话语音、表示所述讲话语音的讲话者的周围的声音,将所述周围语音信息分离为包含所述讲话语音的第1语音信息和包含除了所述讲话语音以外的声音的第2语音信息,将所述第1语音信息的声级和所述第2语音信息的声级进行比较,根据比较的结果,采用第1再现方法、和再现的语音的指向性与所述第1再现方法不同的第2再现方法中的某一方,再现对所述讲话语音的应答语音将待评测的英语口语音频文件随机分割为等长度切片;卷积神经网络分析模块,对得到的音频切片进行短时傅里叶变换生成对应的二维时频图,再逐个对一维时频图进行高级抽象,得到音频切片的高级抽象特征;评估与反馈模块,通过机器学习模型逐个对音频切片的高级抽象特征进行分析得到每个音频切片的分数,再对所有得分取平均数即得到最终的英语口语评估分数。

【技术特征摘要】
1.一种数据评估教育系统,其特征在于,包括:语音预处理模块,取得周围语音信息,所述周围语音信息包含对所述数据评估教育系统讲话的讲话语音、表示所述讲话语音的讲话者的周围的声音,将所述周围语音信息分离为包含所述讲话语音的第1语音信息和包含除了所述讲话语音以外的声音的第2语音信息,将所述第1语音信息的声级和所述第2语音信息的声级进行比较,根据比较的结果,采用第1再现方法、和再现的语音的指向性与所述第1再现方法不同的第2再现方法中的某一方,再现对所述讲话语音的应答语音将待评测的英语口语音频文件随机分割为等长度切片;卷积神经网络分析模块,对得到的音频切片进行短时傅里叶变换生成对应的二维时频图,再逐个对一维时频图进行高级抽象,得到音频切片的高级抽象特征;评估与反馈模块,通过机器学习模型逐个对音频切片的高级抽象特征进行分析得到每个音频切片的分数,再对所有得分取平均数即得到最终的英语口语评估分数。2.根据权利要求1所述的数据评估教育系统,其特征在于,所述随机音频切片的时长为10s。3.根据权利要求1所述的数据评估教育系统,其特征在于,所述语音信号...

【专利技术属性】
技术研发人员:杨高峰孟军霞朱炯圳郭海峰
申请(专利权)人:郑州仁峰软件开发有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1