基于语音相似度的语音评测方法及系统技术方案

技术编号:14891235 阅读:182 留言:0更新日期:2017-03-28 23:56
本发明专利技术涉及一种基于语音相似度的语音评测方法,包括如下步骤:提供训练数据集;利用所述训练数据集对动态时间规整算法和支持向量顺序回归算法进行算法训练,以获得相似度评分模型;提供参照语音信息;录制模仿朗读所述参照语音信息的模仿语音信息;提取所述参照语音信息中的参照语音特征序列集和所述模仿语音信息中的模仿语音特征序列集;以及向所述相似度评分模型输入所述参照语音特征序列集和所述模仿语音特征序列集,获得所述模仿语音信息和所述参照语音信息的相似度评分值并输出。本发明专利技术的语音相似度的评测方法在对发音正确性进行考核的基础上,增加了对发音模仿程度的评估,可帮助用户有针对性的进行模仿练习,提高发音水平。

【技术实现步骤摘要】

本专利技术涉及语音评测领域,特指一种基于语音相似度的语音评测方法及系统
技术介绍
语音信号处理技术是语音处理和语音识别领域中的一个重要分支,也是现今语音识别和语音评价系统的主要核心技术。随着科技的发展,语音信号处理技术已深入到各个领域,包括语言学习以及语音自动评分,而在语言学习和自动评分中,运用语音信号处理的目的是将最新的语音技术于当前的教学和学习方法结合,建立辅助语言学习的系统或者语音智能评分系统。对于语音评测的研究,目前大多数的评测方法或系统均专注于如何提高语音评测的准确性,即提高评测结果的准确度,以实现对发音质量的公正、客观、高效的评测。但是评测结果是否准确对学习者的语言学习并没有提供直接的帮助,其仅能更为客观的反应学习者目前的口语水平,不能提高口语水平和语言学习效果。
技术实现思路
本专利技术的目的在于克服现有技术的缺陷,提供一种基于语音相似度的评测方法及系统,解决现有的评测系统不能为学习者的语言学习提供直接帮助和不能提高口语水平及语言学习效果的问题。实现上述目的的技术方案是:本专利技术提供了一种基于语音相似度的语音评测方法,包括如下步骤:提供训练数据集,所述训练数据集包括训练参照语音数据、与所述训练参照语音数据对应的训练模仿语音数据以及所述训练参照语音数据和所述训练模仿语音数据的相似度评分值;利用所述训练数据集对动态时间规整算法和支持向量顺序回归算法进行算法训练,以获得相似度评分模型;提供参照语音信息;录制模仿朗读所述参照语音信息的模仿语音信息;提取所述参照语音信息中的参照语音特征序列集和所述模仿语音信息中的模仿语音特征序列集;以及向所述相似度评分模型输入所述参照语音特征序列集和所述模仿语音特征序列集,获得所述模仿语音信息和所述参照语音信息的相似度评分值并输出。本专利技术提出了一种语音相似度的评测方法,能够直观的为学习者给出相似度的评分,为语言学习的模仿学习方法提供了有效的反馈,能够促进学习者在语言学习中反复模仿练习,以提高学习者的语言学习水平和学习效果,进而为学习者的语音学习提供直接的帮助。本专利技术的语音相似度的评测方法在对发音正确性进行考核的基础上,增加了对发音模仿程度的评估,可帮助用户有针对性的进行模仿练习,提高发音水平。本专利技术基于语音相似度的语音评测方法的进一步改进在于,所述训练参照语音数据和所述训练模仿语音数据包括语音内容特征序列、语音音调特征序列、语音时长特征序列、语音停顿特征序列以及语音重读特征序列;进行算法训练包括:利用所述训练参照语音数据和所述训练模仿语音数据中的语音音调特征序列、语音时长特征序列、语音停顿特征序列以及语音重读特征序列对所述动态时间规整算法进行算法训练,以使得通过所述动态时间规整算法获得所述训练参照语音数据和所述训练模仿语音数据之间的语音音调距离、语音时长距离、语音停顿距离以及语音重读距离;利用所述训练参照语音数据和所述训练模仿语音数据中的语音内容特征序列、所述训练参照语音数据和所述训练模仿语音数据的相似度评分值、所获得的语音音调距离、语音时长距离、语音停顿距离以及语音重读距离对所述支持向量顺序回归算法进行算法训练。本专利技术基于语音相似度的语音评测方法的进一步改进在于,在进行算法训练时,为所述动态时间规整算法设定以时间帧顺序依序进行计算的约束条件。本专利技术基于语音相似度的语音评测方法的进一步改进在于,提取所述参照语音信息中的参照语音特征序列集和所述模仿语音信息中的模仿语音特征序列集,包括:对所述参照语音信息进行语音识别以获得对应的语音内容特征序列、语音停顿特征序列以及语音时长特征序列并加入到参照语音特征序列集中;对所述模仿语音信息进行语音识别以获得对应的语音内容特征序列、语音停顿特征序列以及语音时长特征序列并加入到模仿语音特征序列集中。本专利技术基于语音相似度的语音评测方法的进一步改进在于,提取所述参照语音信息中的参照语音特征序列集和所述模仿语音信息中的模仿语音特征序列集,还包括:对所述参照语音信息进行基频提取以获得对应的语音音调特征序列并加入到参照语音特征序列集中;对所述参照语音信息进行能量提取以获取对应的语音重读特征序列并加入到参照语音特征序列集中;对所述模仿语音信息进行基频提取以获得对应的语音音调特征序列并加入到模仿语音特征序列集中;对所述模仿语音信息进行能量提取以获取对应的语音重读特征序列并加入到模仿语音特征序列集中。本专利技术还提供了一种基于语音相似度的语音评测系统,包括:数据存储模块,用于存储参照语音信息;语音播报模块,与所述数据存储模块连接,用于播报所述数据存储模块中存储的参照语音信息;语音获取模块,用于录制模仿朗读所述语音播报模块播报的参照语音信息的模仿语音信息;特征提取模块,与所述语音播报模块和所述语音获取模块连接,用于对所述语音播报模块所播报的参照语音信息和所述语音获取模块所获取的模仿语音信息进行特征提取,以获得对应的参照语音特征序列集和模仿语音特征序列集;以及评分模块,与所述特征提取模块连接,所述评分模块接收所述特征提取模块获得的参照语音特征序列集和模仿语音特征序列集,并计算得出所述模仿语音信息和所述参照语音信息的相似度评分值。本专利技术基于语音相似度的语音评测系统的进一步改进在于,所述评分模块内建立有相似度评分模型,所述相似度评分模型通过训练数据集对动态时间规整算法和支持向量顺序回归算法进行算法训练而建立,所述训练数据集包括训练参照语音数据、与所述训练参照语音数据对应的训练模仿语音数据以及所述训练参照语音数据和所述训练模仿语音数据的相似度评分值;所述评分模块将所述的参照语音特征序列集和模仿语音特征序列集后输入到所述相似度评分模块以获得所述模仿语音信息和所述参照语音信息的相似度评分值。本专利技术基于语音相似度的语音评测系统的进一步改进在于,所述训练参照语音数据和所述训练模仿语音数据包括语音内容特征序列、语音音调特征序列、语音时长特征序列、语音停顿特征序列以及语音重读特征序列;通过所述训练参照语音数据和所述训练模仿语音数据中的语音音调特征序列、语音时长特征序列、语音停顿特征序列以及语音重读特征序列对所述动态时间规整算法进行算法训练,以使得通过所述动态时间规整算法获得所述训练参照语音数据和所述训练模仿语音数据之间的语音音调距离、语音时长距离、语音停顿距离以及语音重读距离;通过所述训练参照语音数据和所述训练模仿语音数据中的语音内容特征序列、所述训练参照语音数据和所述训练模仿语音数据的相似度评分值、所获得的语音音调距离、语音时长距离、语音停顿距离以及语音重读距离对所述支持向量顺序回归算法进行算法训练,从而于所述评分模块内建立了相似度评分模型。本专利技术基于语音相似度的语音评测系统的进一步改进在于,所述动态时间规整算法在进行算法训练时,设定有以时间帧顺序依序进行算法训练的约束条件。本专利技术基于语音相似度的语音评测系统的进一步改进在于,所述特征提取模块包括语音识别子模块、基频提取子模块、能量提取子模块以及序列缓存子模块;所述序列缓存子模块内存储有参照语音特征序列集和模仿语音特征序列集;所述语音识别子模块用于对所述参照语音信息进行语音识别以获得对应的语音内容特征序列、语音停顿特征序列以及语音时长特征序列并写入到所述参照语音特征序列集中;还用于对所述模仿语音信息进行语音识别以获得对本文档来自技高网...
基于语音相似度的语音评测方法及系统

【技术保护点】
一种基于语音相似度的语音评测方法,其特征在于,包括如下步骤:提供训练数据集,所述训练数据集包括训练参照语音数据、与所述训练参照语音数据对应的训练模仿语音数据以及所述训练参照语音数据和所述训练模仿语音数据的相似度评分值;利用所述训练数据集对动态时间规整算法和支持向量顺序回归算法进行算法训练,以获得相似度评分模型;提供参照语音信息;录制模仿朗读所述参照语音信息的模仿语音信息;提取所述参照语音信息中的参照语音特征序列集和所述模仿语音信息中的模仿语音特征序列集;以及向所述相似度评分模型输入所述参照语音特征序列集和所述模仿语音特征序列集,获得所述模仿语音信息和所述参照语音信息的相似度评分值并输出。

【技术特征摘要】
1.一种基于语音相似度的语音评测方法,其特征在于,包括如下步骤:提供训练数据集,所述训练数据集包括训练参照语音数据、与所述训练参照语音数据对应的训练模仿语音数据以及所述训练参照语音数据和所述训练模仿语音数据的相似度评分值;利用所述训练数据集对动态时间规整算法和支持向量顺序回归算法进行算法训练,以获得相似度评分模型;提供参照语音信息;录制模仿朗读所述参照语音信息的模仿语音信息;提取所述参照语音信息中的参照语音特征序列集和所述模仿语音信息中的模仿语音特征序列集;以及向所述相似度评分模型输入所述参照语音特征序列集和所述模仿语音特征序列集,获得所述模仿语音信息和所述参照语音信息的相似度评分值并输出。2.如权利要求1所述的基于语音相似度的语音评测方法,其特征在于,所述训练参照语音数据和所述训练模仿语音数据包括语音内容特征序列、语音音调特征序列、语音时长特征序列、语音停顿特征序列以及语音重读特征序列;进行算法训练包括:利用所述训练参照语音数据和所述训练模仿语音数据中的语音音调特征序列、语音时长特征序列、语音停顿特征序列以及语音重读特征序列对所述动态时间规整算法进行算法训练,以使得通过所述动态时间规整算法获得所述训练参照语音数据和所述训练模仿语音数据之间的语音音调距离、语音时长距离、语音停顿距离以及语音重读距离;利用所述训练参照语音数据和所述训练模仿语音数据中的语音内容特征序列、所述训练参照语音数据和所述训练模仿语音数据的相似度评分值、所获得的语音音调距离、语音时长距离、语音停顿距离以及语音重读距离对所述支持向量顺序回归算法进行算法训练。3.如权利要求2所述的基于语音相似度的语音评测方法,其特征在于,在进行算法训练时,为所述动态时间规整算法设定以时间帧顺序依序进行计算的约束条件。4.如权利要求1所述的基于语音相似度的语音评测方法,其特征在于,提取所述参照语音信息中的参照语音特征序列集和所述模仿语音信息中的模仿语音特征序列集,包括:对所述参照语音信息进行语音识别以获得对应的语音内容特征序列、语音停顿特征序列以及语音时长特征序列并加入到参照语音特征序列集中;对所述模仿语音信息进行语音识别以获得对应的语音内容特征序列、语音停顿特征序列以及语音时长特征序列并加入到模仿语音特征序列集中。5.如权利要求4所述的基于语音相似度的语音评测方法,其特征在于,提取所述参照语音信息中的参照语音特征序列集和所述模仿语音信息中的模仿语音特征序列集,还包括:对所述参照语音信息进行基频提取以获得对应的语音音调特征序列并加入到参照语音特征序列集中;对所述参照语音信息进行能量提取以获取对应的语音重读特征序列并加入到参照语音特征序列集中;对所述模仿语音信息进行基频提取以获得对应的语音音调特征序列并加入到模仿语音特征序列集中;对所述模仿语音信息进行能量提取以获取对应的语音重读特征序列并加入到模仿语音特征序列集中。6.一种基于语音相似度的语音评测系统,其特征在于,包括:数据存储模块,用于存储参照语音信息;语音播报模块,与所述数据存储模块连接,用于播报所述数据存储模块中存储的参照语音信息;语音获取模块,用于录制模仿朗读所述语音播报模块播报的参照语音信息的模仿语音信息;特征提取模块,与...

【专利技术属性】
技术研发人员:戴晓澄曹昊黄盼
申请(专利权)人:上海语知义信息技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1