一种口语发音的评估方法及装置制造方法及图纸

技术编号:21973168 阅读:87 留言:0更新日期:2019-08-28 01:50
本发明专利技术涉及一种口语发音的评估方法及装置,所述方法包括:获取的考生的口语回答结果的文本内容;提取所述文本内容中每个词发音特征;基于所述每个词的发音特征,确定每个词的发音是否正确;基于发音正确的词的数量,评估考生的口语发音结果。对于考生的口语回答,本发明专利技术可以基于每个词的发音特征,确定发音正确的词的数量,从而评估考生的口语发音效果是好或者坏,从而有针对性的提升考生的口语水平。

A Method and Device for Evaluating Oral Pronunciation

【技术实现步骤摘要】
一种口语发音的评估方法及装置
本专利技术涉及计算机
,特别是涉及一种口语发音的评估方法及装置。
技术介绍
作为人际交流的重要媒介,口语语言在实际生活中占有极其重要的地位。随着社会经济的不断发展和经济全球化趋势的进行,人们对语言学习的效率以及语言评估的客观性、公正性和规模化测试提出了越来越高的要求。口语考试中的开放题型如口头作文、故事复述和看图说话等是反映考生口语的表达能力的一个重要题型。通常,老师除了在内容上进行评判外,还会判断该学生的单词发音是否标准,以及整体的发音情况。传统的口语考试评分系统是直接根据老师打分的总分标注数据学习评分模型,给出一个总分输出。而学生在口语表达中的发音是否标准,整体的发音情况如何无从得知。
技术实现思路
基于此,有必要针对目前口语考试发音难以评估的问题,提供一种口语发音的评估方法及装置。一种口语发音的评估方法,所述方法包括:获取的考生的口语回答结果的文本内容;提取所述文本内容中每个词的发音特征;基于所述每个词的发音特征,确定每个词的发音是否正确;基于发音正确的词的数量,评估考生的口语发音结果。本实施例中,所述发音特征包括词的声学似然特征,所述提取所述文本内容中每个词的发音特征,包括:基于每个词的元音和辅音的帧平均似然度,确定每个词的声学似然得分;将所述声学似然得分对应作为每个词的声学似然特征。本实施例中,所述发音特征包括gop特征,所述提取所述文本内容中每个词的发音特征,包括:获取每个词中元音和辅音的gop打分;基于每个词中元音和辅音的gop打分确定对应每个词的gop打分;将每个词的gop打分作为对应词的gop特征。本实施例中,所述发音特征包括发音的一致性特征,所述提取所述文本内容中每个词的发音特征,包括:确定每个词中元音及辅音与标准发音相一致的帧的个数;将每个词中元音与辅音相一致的帧的个数作为所述对应词发音的一致性特征。本实施例中,所述发音特征包括发音的正确率特征,所述提取所述文本内容中每个词的发音特征,包括:获取每个词中元音和辅音正确的帧的个数;基于每个词中元音和辅音正确的帧的个数,确定每个词中元音和辅音发音正确的帧正确率;将所述每个词中元音和辅音发音正确的帧正确率确定为每个词的所述发音的正确率特征。一种口语发音的评估装置,所述装置包括:获取模块,用于获取的考生的口语回答结果的文本内容;提取模块,用于提取所述文本内容中每个词的发音特征;确定模块,用于基于所述每个词的发音特征,确定每个词的发音是否正确;评估模块,用于基于发音正确的词的数量,评估考生的口语发音结果。本实施例中,所述发音特征包括词的声学似然特征,所述提取模块用于:基于每个词的元音和辅音的帧平均似然度,确定每个词的声学似然得分;将所述声学似然得分对应作为每个词的声学似然特征。本实施例中,所述发音特征包括gop特征,所述提取模块用于:获取每个词中元音和辅音的gop打分;基于每个词中元音和辅音的gop打分确定对应每个词的gop打分;将每个词的gop打分作为对应词的gop特征。本实施例中,所述发音特征包括发音的一致性特征,所述提取模块用于:确定每个词中元音及辅音与标准发音相一致的帧的个数;将每个词中元音与辅音相一致的帧的个数作为所述对应词发音的一致性特征。本实施例中,所述发音特征包括发音的正确率特征,所述提取模块用于:获取每个词中元音和辅音正确的帧的个数;基于每个词中元音和辅音正确的帧的个数,确定每个词中元音和辅音发音正确的帧正确率;将所述每个词中元音和辅音发音正确的帧正确率确定为每个词的所述发音的正确率特征。本专利技术中,在获取的考生的口语回答结果的文本内容后,可以提取所述文本内容中每个词发音特征;基于所述每个词的发音特征,确定每个词的发音是否正确;基于发音正确的词的数量,评估考生的口语发音结果。由此,对于考生的口语回答,本专利技术可以基于每个词的发音特征,确定发音正确的词的数量,从而评估考生的口语发音效果是好或者坏,从而有针对性的提升考生的口语水平。附图说明图1为一实施例的口语发音的评估方法的流程图;图2为一实施例的口语发音的评估装置的结构图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。图1为一实施例的口语发音的评估方法的流程图。如图1所示,该方法包括:步骤110,获取的考生的口语回答结果的文本内容;步骤120,提取文本内容中每个词的发音特征;步骤130,基于每个词的发音特征,确定每个词的发音是否正确;步骤140,基于发音正确的词的数量,评估考生的口语发音结果。本专利技术中,在获取的考生的口语回答结果的文本内容后,可以提取所述文本内容中每个词发音特征;基于所述每个词的发音特征,确定每个词的发音是否正确;基于发音正确的词的数量,评估考生的口语发音结果。由此,对于考生的口语回答,本专利技术可以基于每个词的发音特征,确定发音正确的词的数量,从而评估考生的口语发音效果是好或者坏,从而有针对性的提升考生的口语水平。其中,考生的口语回答结果可以是由声音采集系统采集的音频文件等。文本内容可以是语音识别系统从口语回答结果中提取的文字内容。可以理解,本实施例不局限于口语回答结果和文本内容的获取方式。本实施例中,发音特征可以是声学似然特征、gop特征、发音的一致性特征、发音的正确率特征等中的至少一个。本实施例的一实现方式中,发音特征包括词的声学似然特征,提取文本内容中每个词发音特征,包括:基于每个词的元音和辅音的帧平均似然度,确定每个词的声学似然得分;将声学似然得分对应作为每个词的声学似然特征。其中,可以统计文本内容中词的声学似然得分,并考虑元音、辅音的差别,具体可以基于如下数据:词级的帧平均似然度(mean,max,min)单词中元音的帧平均似然度(mean,max,min)单词中辅音的帧平均似然度(mean,max,min)词中元音个数、辅音个数、总的phone个数本实施例的一实现方式中,发音特征包括gop特征,提取文本内容中每个词发音特征,包括:获取每个词中元音和辅音的gop打分;基于每个词中元音和辅音的gop打分确定对应每个词的gop打分;将每个词的gop打分作为对应词的gop特征。其中,统计文本内容中词的phone级gop打分,并考虑元音、辅音的差别,可以具体如下:单词中元音的gop打分的mean,max,min;单词中辅音的gop打分的mean,max,min;单词中phone的gop打分的mean,max,min。本实施例的一实现方式中,发音特征包括发音的一致性特征,提取文本内容中每个词发音特征,包括:确定每个词中元音及辅音与标准发音相一致的帧的个数;将每个词中元音与辅音相一致的帧的个数作为对应词发音的一致性特征。其中,可以统计文本内容中输入词$word_i$的fa、rec的元音、辅音、all的一致性(单位:帧)所有发音一致性:agrall=sum(HitFramesphonex)/NumFramesAll;元音一致性:agrvowels=sum(HitFramesvowelsx)/NumFramesVow;辅音一致性:agrconsonants=sum(Hitframesconson本文档来自技高网...

【技术保护点】
1.一种口语发音的评估方法,其特征在于,所述方法包括:获取的考生的口语回答结果的文本内容;提取所述文本内容中每个词的发音特征;基于所述每个词的发音特征,确定每个词的发音是否正确;基于发音正确的词的数量,评估考生的口语发音结果。

【技术特征摘要】
1.一种口语发音的评估方法,其特征在于,所述方法包括:获取的考生的口语回答结果的文本内容;提取所述文本内容中每个词的发音特征;基于所述每个词的发音特征,确定每个词的发音是否正确;基于发音正确的词的数量,评估考生的口语发音结果。2.根据权利要求1所述的方法,其特征在于,所述发音特征包括词的声学似然特征,所述提取所述文本内容中每个的词发音特征,包括:基于每个词的元音和辅音的帧平均似然度,确定每个词的声学似然得分;将所述声学似然得分对应作为每个词的声学似然特征。3.根据权利要求1所述的方法,其特征在于,所述发音特征包括gop特征,所述提取所述文本内容中每个词的发音特征,包括:获取每个词中元音和辅音的gop打分;基于每个词中元音和辅音的gop打分确定对应每个词的gop打分;将每个词的gop打分作为对应词的gop特征。4.根据权利要求1所述的方法,其特征在于,所述发音特征包括发音的一致性特征,所述提取所述文本内容中每个词的发音特征,包括:确定每个词中元音及辅音与标准发音相一致的帧的个数;将每个词中元音与辅音相一致的帧的个数作为所述对应词发音的一致性特征。5.根据权利要求1所述的方法,其特征在于,所述发音特征包括发音的正确率特征,所述提取所述文本内容中每个词的发音特征,包括:获取每个词中元音和辅音正确的帧的个数;基于每个词中元音和辅音正确的帧的个数,确定每个词中元音和辅音发音正确的帧正确率;将所述每个词中元音和辅音发音正确的帧正确率确定为每...

【专利技术属性】
技术研发人员:方敏蔡雅莉戚自力惠寅华彭书勇林远东
申请(专利权)人:苏州驰声信息科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1