一种口语评分方法及装置制造方法及图纸

技术编号：21955284 阅读：31 留言：0更新日期：2019-08-24 19:07

本发明专利技术涉及一种口语评分方法及装置，所述方法包括：获取对口语测试题的作答后的语音文件；从所述语音文件解码出作答文本信息；对参考答案文本和所述作答文本信息进行预处理，分别对应生成文字内容更少的目标参考答案文本和目标作答文本信息，其中，所述目标参考答案文本与所述参考答案文本的语义相同，所述目标作答文本信息与所述作答文本信息的语义相同；基于所述目标参考答案文本和目标作答文本信息，提取表征所述目标参考答案文本和目标作答文本信息的语义相似度的内容特征；将所述内容特征输入预设的训练模型输出对应的口语评分。本发明专利技术可以提升开放题型中口语作答的评分效率。

A Method and Device for Oral Scoring

全部详细技术资料下载

【技术实现步骤摘要】
一种口语评分方法及装置
本专利技术涉及计算机
，特别是涉及一种口语评分方法及装置。
技术介绍
口语开放题测试是指在考试当中，通过口语测试题，对学生口语作答的内容进行打分的一种考试机制。目前，口语开放题测试还不能实现自动评分，增加了口语测试的评分难度。
技术实现思路
基于此，有必要针对目前口语考试无法自动评分的问题，提供一种口语评分方法及装置。一种口语评分方法，所述方法包括：获取对口语测试题的作答后的语音文件；从所述语音文件解码出作答文本信息；对参考答案文本和所述作答文本信息进行预处理，分别对应生成文字内容更少的目标参考答案文本和目标作答文本信息，其中，所述目标参考答案文本与所述参考答案文本的语义相同，所述目标作答文本信息与所述作答文本信息的语义相同；基于所述目标参考答案文本和目标作答文本信息，提取表征所述目标参考答案文本和目标作答文本信息的语义相似度的内容特征；将所述内容特征输入预设的训练模型输出对应的口语评分。优选的，所述提取表征所述目标参考答案文本和目标作答文本信息的语义相似度的内容特征，包括：基于预先定义的单词逆文档频率信息，选择单词逆文档频率值较大的若干个单词作同义词扩展，作为所述目标参考答案文本的关键词，然后取其并集得到参考答案关键词；统计所述参考答案关键词在所述目标作答文本信息中出现的频率，得到关键词命中率；统计所述标作答文本信息在所述目标参考答案文本中的N元词命中率，并取其中的最大值作为杰卡德相似系数；通过idf值加权词向量的方式，分别得到所述目标参考答案文本与所述目标作答文本信息的文档向量表示，并计算所述目标参考答案文本的文档向量与所述目...

【技术保护点】
1.一种口语评分方法，其特征在于，所述方法包括：获取对口语测试题的作答后的语音文件；从所述语音文件解码出作答文本信息；对参考答案文本和所述作答文本信息进行预处理，分别对应生成文字内容更少的目标参考答案文本和目标作答文本信息，其中，所述目标参考答案文本与所述参考答案文本的语义相同，所述目标作答文本信息与所述作答文本信息的语义相同；基于所述目标参考答案文本和目标作答文本信息，提取表征所述目标参考答案文本和目标作答文本信息的语义相似度的内容特征；将所述内容特征输入预设的训练模型输出对应的口语评分。

【技术特征摘要】
1.一种口语评分方法，其特征在于，所述方法包括：获取对口语测试题的作答后的语音文件；从所述语音文件解码出作答文本信息；对参考答案文本和所述作答文本信息进行预处理，分别对应生成文字内容更少的目标参考答案文本和目标作答文本信息，其中，所述目标参考答案文本与所述参考答案文本的语义相同，所述目标作答文本信息与所述作答文本信息的语义相同；基于所述目标参考答案文本和目标作答文本信息，提取表征所述目标参考答案文本和目标作答文本信息的语义相似度的内容特征；将所述内容特征输入预设的训练模型输出对应的口语评分。2.根据权利要求1所述的方法，其特征在于，所述提取表征所述目标参考答案文本和目标作答文本信息的语义相似度的内容特征，包括：基于预先定义的单词逆文档频率信息，选择单词逆文档频率值较大的若干个单词作同义词扩展，作为所述目标参考答案文本的关键词，然后取其并集得到参考答案关键词；统计所述参考答案关键词在所述目标作答文本信息中出现的频率，得到关键词命中率；统计所述标作答文本信息在所述目标参考答案文本中的N元词命中率，并取其中的最大值作为杰卡德相似系数；通过idf值加权词向量的方式，分别得到所述目标参考答案文本与所述目标作答文本信息的文档向量表示，并计算所述目标参考答案文本的文档向量与所述目标作答文本信息的文档向量之间的夹角余弦值，并将最大的所述夹角余弦值作为余弦相似度；确定所述目标参考答案文本和目标作答文本信息之间的词移距离；将所述关键词命中率、杰卡德相似系数、余弦相似度和词移距离作为所述内容特征。3.根据权利要求1所述的方法，其特征在于，所述对参考答案文本和所述作答文本信息进行预处理，包括：对参考答案文本和所述作答文本信息分别去除停用词和单词词形还原，所述停用词是指句子中对内容表达没有影响的单词，包括但不限于：冠词、介词、连词、语气词、常用作连词的副词，所述词形还原是指对给定形式的单词转换为基本词形。4.根据权利要求3所述的方法，其特征在于，所述将所述内容特征输入预设的训练模型输出对应的口语评分，包括：基于训练生成的SVR模型，将所述内容特征...

【专利技术属性】
技术研发人员：彭书勇，方敏，戚自力，孙婷婷，林远东，
申请(专利权)人：苏州驰声信息科技有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人