The embodiment of the present invention provides a speech evaluation method, which includes: according to the pronunciation length, pitch characteristic and posterior probability of each phoneme in the speech to be evaluated, and the pronunciation length, pitch characteristic and posterior probability of each phoneme in the reference speech corresponding to the speech to be evaluated, the speech to be evaluated is pronounced. Evaluation. The embodiment of the present invention provides a voice evaluation method, which takes reference voice as the standard of measurement and carries out voice evaluation from three aspects of pronunciation length, pitch characteristics and posterior probability. It can fully reflect the spoken language level of the spokesperson, so that the spokesperson can understand the shortcomings of his spoken language from different angles. In order to improve oral English level.
【技术实现步骤摘要】
一种语音测评方法
本专利技术实施例涉及语音识别与测评
,尤其涉及一种语音测评方法。
技术介绍
当下的经济发展和文化交流,对个人的外语能力要求越来越高。如何快速高效地获取外语技能,是语言教育迫切需要解决的问题。日益发达的计算机技术,特别是人工智能技术,是实现高效语言学习的重要途径。例如,计算机辅助语言学习技术,可以快速地对学习者的口语进行测评,并指出具体的错误,学习者可以据此有针对性地练习和提高。目前的语音测评技术大多基于GOP(GoodnessOfPronunciation)算法。给定待测评语音和相应的文本(可表示成音素串),计算每个音素的后验概率,并根据上述每一后验概率,进行音素级别的语音测评。比如某个音素的后验概率超过一定阈值,则认为学习者对该音素的发音较好,否者判断为发音有误。这类算法聚焦的是音素级别的评分,基于此可以得到词级别到句子级别的评分,但这类分数对学习者口语的评估是片面的,它只反映了口语的一个基本要素,即发音准确性,使得学习者无法针对分数未覆盖的其他口语特性进行练习,致使口语水平不能得到全方位提升。
技术实现思路
本专利技术实施例提供一种语音测评方法,用以解决现有的语音测评只能反映发音准确性而无法覆盖其他口语特征的问题。一方面,本专利技术实施例提供一种语音测评方法,包括:根据每一音素在待测评语音中的发音长度、音高特征和后验概率,以及所述每一音素在待测评语音对应的参考语音中的发音长度、音高特征和后验概率,对所述待测评语音进行语音测评。另一方面,本专利技术实施例提供一种语音测评装置,包括:语音测评单元,用于根据每一音素在待测评语音中的发音长度 ...
【技术保护点】
1.一种语音测评方法,其特征在于,包括:根据每一音素在待测评语音中的发音长度、音高特征和后验概率,以及所述每一音素在待测评语音对应的参考语音中的发音长度、音高特征和后验概率,对所述待测评语音进行语音测评。
【技术特征摘要】
1.一种语音测评方法,其特征在于,包括:根据每一音素在待测评语音中的发音长度、音高特征和后验概率,以及所述每一音素在待测评语音对应的参考语音中的发音长度、音高特征和后验概率,对所述待测评语音进行语音测评。2.根据权利要求1所述的方法,其特征在于,所述根据每一音素在待测评语音中的发音长度、音高特征和后验概率,以及所述每一音素在待测评语音对应的参考语音中的发音长度、音高特征和后验概率,对所述待测评语音进行语音测评,之前还包括:基于训练好的语音识别系统,获取每一音素在待测评语音中的发音长度、音高特征和后验概率,以及所述每一音素在待测评语音对应的参考语音中的发音长度、音高特征和后验概率。3.根据权利要求1所述的方法,其特征在于,所述根据每一音素在待测评语音中的发音长度、音高特征和后验概率,以及所述每一音素在待测评语音对应的参考语音中的发音长度、音高特征和后验概率,对所述待测评语音进行语音测评,进一步包括:根据每一音素在待测评语音中的发音长度,获取待测评语音的音长向量;根据每一音素在参考语音中的发音长度,获取参考语音的音长向量;获取所述待测评语音的音长向量和参考语音的音长向量的相似度作为第一音长测评结果;根据每一音素在待测评语音中的音高特征,获取待测评语音的音高向量;根据每一音素在参考语音中的音高特征,获取参考语音的音高向量;获取所述待测评语音的音高向量和参考语音的音高向量的相似度作为第一音高测评结果;根据每一音素在待测评语音中的后验概率,获取待测评语音的平均后验概率;根据每一音素在参考语音中的后验概率,获取参考语音的平均后验概率;将所述待测评语音的平均后验概率和参考语音的平均后验概率之差作为第一音准测评结果;根据所述第一音长测评结果、第一音高测评结果和第一音准测评结果,对所述待测评语音进行语音测评。4.根据权利要求1所述的方法,其特征在于,所述根据每一音素在待测评语音中的发音长度、音高特征和后验概率,以及所述每一音素在待测评语音对应的参考语音中的发音长度、音高特征和后验概率,对所述待测评语音进行语音测评,进一步包括:获取任一音素在待测评语音中的发音长度与在参考语音中的发音长度的相似度;根据每一音素在待测评语音中的发音长度与在参考语音中的发音长度的相似度,获取第二音长测评结果;获取任一音素在待测评语音中的音高特征与在参考语音中的音高特征的相似度;根据每一音素在待测评语音中的音高特征与在参考语音中的音高特征的相似度,获取第二音高测评结果;获取任一音素在待测评语音中的后验概率与在参考语音中的后验概率之差;根据每一音素在待测评语音中的后验概率与在参考语音中的后验概率之差,获取第二音准测评结果;根据所述第二音长测评结果、第二音高测评结果和第二音准测评结果,对所述待测评语音进行语音测评。5.根据权利要求1所述的方法,其特征在于,所述根...
【专利技术属性】
技术研发人员:汤志远,王东,
申请(专利权)人:清华大学,北京孚睿星辰智能科技有限责任公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。