The present invention provides an oral scoring method and device, in which the method includes: obtaining the pending speech, and evaluating the phoneme pronunciation quality score by the pre trained phoneme score model, and determining the quality score of the speech to be graded according to the score of each phoneme to be included. The invention uses phoneme as the unit to carry out oral scoring, and pre trains the phoneme score model corresponding to each phoneme contained in each language type. Because of the low number of phonemes, the training of phoneme score model has a small workload and high efficiency. The scores of each phoneme included by the phoneme were evaluated by the phoneme score model, and then the score was fused into the quality score of the whole. In the whole scoring process, there was no need for people in the professional field to design GOP, native likelihood and other characteristics according to the characteristics of the oral pronunciation quality. The process is more detailed and improves the accuracy and stability of oral scoring.
【技术实现步骤摘要】
一种口语评分方法及装置
本专利技术涉及语音识别及数据处理
,具体而言,涉及一种口语评分方法及装置。
技术介绍
目前对朗读风格题型的口语发音评分,主要考察发音质量、流利度、韵律等几个方面。其中,发音质量是口语评分考察的重中之重。当前,相关技术中通常通过以下三种方式来实现口语发音的质量评测:(1)将待评分语音与标准发音做比对。(2)统计待评分语音的GOP(goodofpronunciation)发音质量特征,根据得到的GOP发音质量特征,建立简单的映射模型,得到最终的发音评分。(3)按照回归的方式,提取多个发音特征,如GOP、native似然度等,人工标注大量的评分数据,构建回归评分模型,利用该回归评分模型为待评分语音进行评分。但上述三种相关技术中,需要专业领域内人士,根据口语发音质量的相关特性,设计GOP、native似然度等评分特征,评分的准确性不高,评分的稳定性不好。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提供一种口语评分方法及装置,以解决现有技术存在的以下问题:现有技术中需要专业领域内人士,根据口语发音质量的相关特性,设计GOP、native似然度等评分特征,评分的准确性及稳定性都不好。第一方面,本专利技术实施例提供了一种口语评分方法,包括:获取待评分语音;通过预先训练的音素评分模型对所述待评分语音进行音素发音质量评分;根据所述待评分语音包括的每个音素的评分结果,确定所述待评分语音的质量分值。结合第一方面,本专利技术实施例提供了第一方面的第一种可能的实现方式,其中,所述通过预先训练的音素评分模型对所述待评分语音进行音素发音质量评分,包括: ...
【技术保护点】
一种口语评分方法,其特征在于,所述方法包括:获取待评分语音;通过预先训练的音素评分模型对所述待评分语音进行音素发音质量评分;根据所述待评分语音包括的每个音素的评分结果,确定所述待评分语音的质量分值。
【技术特征摘要】
1.一种口语评分方法,其特征在于,所述方法包括:获取待评分语音;通过预先训练的音素评分模型对所述待评分语音进行音素发音质量评分;根据所述待评分语音包括的每个音素的评分结果,确定所述待评分语音的质量分值。2.根据权利要求1所述的方法,其特征在于,所述通过预先训练的音素评分模型对所述待评分语音进行音素发音质量评分,包括:识别所述待评分语音所属的语言类型;对所述待评分语音进行声学切分,获得所述待评分语音包括的每个音素对应的时间边界信息及语音段;从预先训练的所述语言类型对应的所有音素评分模型中,确定出所述每个音素对应的音素评分模型;根据所述每个音素对应的时间边界信息及语音段,通过所述每个音素对应的音素评分模型分别获得所述每个音素对应的质量分值。3.根据权利要求2所述的方法,其特征在于,所述对所述待评分语音进行声学切分,获得所述待评分语音包括的每个音素对应的时间边界信息及语音段,包括:通过预设声学模型获取所述待评分语音中每个音素的时间边界信息;根据所述每个音素的时间边界信息,从所述待评分语音中切分出所述每个音素对应的语音段。4.根据权利要求2所述的方法,其特征在于,所述根据所述待评分语音包括的每个音素的评分结果,确定所述待评分语音的质量分值,包括:根据所述每个音素对应的时间边界信息及质量分值,确定所述待评分语音包括的每个单词的质量分值;将所述每个单词的质量分值融合为所述待评分语音的质量分值。5.根据权利要求4所述的方法,其特征在于,所述根据所述每个音素对应的时间边界信息及质量分值,确定所述待评分语音包括的每个单词的质量分值,包括:根据所述每个音素对应的时间边界信息,确定所述待评...
【专利技术属性】
技术研发人员:陆勇毅,秦龙,
申请(专利权)人:北京先声教育科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。