【技术实现步骤摘要】
语音评测方法及系统
本专利技术涉及语音评测
,具体涉及一种语音评测方法及系统。
技术介绍
标准的普通话在人们的经济和生活中具有非常重要的意义,普通话考试的实施范围也越来越广。对于大规模的考试,人工评分的成本是非常高昂的,机器辅助人工评分是未来所有考试评分的发展趋势。随着语音识别及相关技术的里程碑式发展,机器评分的结果已经接近甚至超过人工评分的水平。但是,在口语评测中仍存在一些易混淆的字,其评测效果不尽如人意。
技术实现思路
本专利技术提供一种语音评测方法及系统,以解决现有的口语检错中的易混淆的字的检错效果不尽如人意的问题。为此,本专利技术提供如下技术方案:一种语音评测方法,包括:接收用户语音数据;对用户语音数据进行评测单元切分,得到评测单元;基于评测单元的频谱图、评测单元向量和预先构建的第一语音评测模型,得到语音评测结果。优选地,所述评测单元为以下任意一种:音节、字和单词。优选地,在得到评测单元之后,所述方法还包括:判断所述用户语音数据是否包括易混淆发音;如果是,则基于评测单元的频谱图、评测单元向量和预先构建的第一语音评测模型,得到语音评测结果;如果否,则根据所 ...
【技术保护点】
一种语音评测方法,其特征在于,包括:接收用户语音数据;对用户语音数据进行评测单元切分,得到评测单元;基于评测单元的频谱图、评测单元向量和预先构建的第一语音评测模型,得到语音评测结果。
【技术特征摘要】
1.一种语音评测方法,其特征在于,包括:接收用户语音数据;对用户语音数据进行评测单元切分,得到评测单元;基于评测单元的频谱图、评测单元向量和预先构建的第一语音评测模型,得到语音评测结果。2.根据权利要求1所述的方法,其特征在于,所述评测单元为以下任意一种:音节、字和单词。3.根据权利要求2所述的方法,其特征在于,在得到评测单元之后,所述方法还包括:判断所述用户语音数据是否包括易混淆发音;如果是,则基于评测单元的频谱图、评测单元向量和预先构建的第一语音评测模型,得到语音评测结果;如果否,则根据所述用户语音数据的语音特征和预先构建的第二语音评测模型,得到语音评测结果。4.根据权利要求1或3所述的方法,其特征在于,所述基于评测单元的频谱图、评测单元向量和预先构建的第一语音评测模型,得到语音评测结果包括:对于易混淆发音,根据易混淆发音的评测单元的频谱图、评测单元向量和预先构建的第一语音评测模型,得到语音评测结果;对于非易混淆发音,根据非易混淆发音的每帧语音的语音特征和预先构建的第二语音评测模型,得到语音评测结果。5.根据权利要求1或3所述的方法,其特征在于,所述第一语音评测模型为神经网络,包括:卷积神经网络和深度神经网络,其中,卷积神经网络包括:第一输入层、M个交替的卷积层和池化层;深度神经网络包括:第二输入层、N个全连接层和输出层,第一输入层的输入为评测单元的频谱图,池化层的输出为评测单元的抽象特征,第二输入层的输入为评测单元的抽象特征和评测单元向量,输出层的输出为所述评测单元的发音的评测结果,其中,M和N为≥1的整数。6.根据权利要求5所述的方法,其特征在于,所述第一语音评测模型通过以下方式进行训练:收集训练语音数据,所述训练语音数据中包括评测单元的标注信息;对所述训练语音数据进行切分,得到评测单元;提取评测单元的频谱图;将所述频谱图输入所述第一语音评测模型中的卷积神经网络,得到评测单元的抽象特征;将评测单元的抽象特征和正确的评测单元向量拼接构成正例,将评测单元的抽象特征和混淆的评测单元向量拼接构成反例;分别利用正例和反例对所述深度神经网络进行训练,得到模型参数。7.根据权利要求3所述的方法,其特征在于,所述判断所述用户语音数据是否包括易混淆发音包...
【专利技术属性】
技术研发人员:乔鹏程,吴奎,潘青华,
申请(专利权)人:广州讯飞易听说网络科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。