【技术实现步骤摘要】
答案评分方法、模型训练方法、装置、存储介质及设备
[0001]本申请涉及人工智能
,具体涉及一种答案评分方法、模型训练方法、装置、计算机可读存储介质及计算机设备。
技术介绍
[0002]近年来,随着人工智能技术的发展与进步,越来越多的场景都使用了人工智能技术,例如涉及口语考试的口语测评场景。在口语测评场景如中高考英文口语考试中,当前机器评分已经大批量取代了人工评分。其中,考察考生综合发音水平的是英文口语看图说话题,英文口语看图说话题评判的是考生的发音水平、作答要点的完整度、作答内容的语言水平、发音流畅度等4个方面。
[0003]虽然机器评分整体上优于人工评分,但是机器评分还是会出现一些离谱的评分错误。例如,考生作答离题、或内容只匹配了关键词但要点错误/要点相似度低,考生表述与考试图片内容部分关键词相似,但是表述含义不同,出现机器打分过高的现象等。这些都会导致看图说话题的机器评分的准确率降低。
技术实现思路
[0004]本申请实施例提供一种答案评分方法、模型训练方法、装置、计算机可读存储介质及计算机设备,可以提高看题说话题机器评分的稳定性和准确性。
[0005]本申请实施例提供了一种答案评分方法,包括:
[0006]获取口语考试中考生作答的语音,以及根据所述语音所确定的所述考生作答全文的文本序列和所述考生作答全文的音素序列;
[0007]根据所述语音、所述音素序列确定所述考生作答的全文语音水平表示,以及根据所述文本序列确定所述考生作答的全文语言水平表示;
[ ...
【技术保护点】
【技术特征摘要】
1.一种答案评分方法,其特征在于,包括:获取口语考试中考生作答的语音,以及根据所述语音所确定的所述考生作答全文的文本序列和所述考生作答全文的音素序列;根据所述语音、所述音素序列确定所述考生作答的全文语音水平表示,以及根据所述文本序列确定所述考生作答的全文语言水平表示;获取所述口语考试的多个范文要点,根据多个范文要点和所述文本序列确定所述考生作答的全局要点表示;根据所述全文语音水平表示、所述全文语言水平表示和所述全局要点表示,对所述考生作答进行评分处理,以得到所述考生作答的评分。2.根据权利要求1所述的方法,其特征在于,所述根据多个范文要点和所述文本序列确定所述考生作答的全局要点表示的步骤,包括:对多个范文要点中的每个范文要点和所述文本序列进行要点提取处理,以确定每个范文要点对应的考生作答要点;对每个范文要点和对应的所述考生作答要点,进行要点级别的注意力语义提取处理,以得到所述考生作答的全局要点表示。3.根据权利要求2所述的方法,其特征在于,所述对每个范文要点和对应的所述考生作答要点,进行要点级别的注意力语义提取处理,以得到所述考生作答的全局要点表示的步骤,包括:对每个范文要点和对应的所述考生作答要点,进行要点级别的语义提取处理,以得到所述考生作答的全文要点语义表示、以及每个范文要点和对应的所述考生作答要点之间的上下文相似度的隐层语义表示;对所述全文要点语义表示和所述隐层语义表示进行注意力机制处理,以得到经过所述隐层语义表示的注意力权重加权之后的全局要点表示。4.根据权利要求3所述的方法,其特征在于,所述方法还包括口语评分模型,所述口语评分模型包括要点级别语义对错模块,所述对每个范文要点和对应的所述考生作答要点,进行要点级别的语义提取处理,以得到所述考生作答的全文要点语义表示和多个范文要点的隐层语义表示的步骤,包括:将每个范文要点和对应的所述考生作答要点进行文本拼接处理,以得到每个要点对文本,其中,每个要点对文本中包括开始标识符;将全局要点表示标识符和多个要点对文本输入至所述要点级别语义对错模块中的要点匹配预训练模型中,进行要点级别的语义提取处理,以得到所述考生作答的全文要点语义表示、和多个要点对文本对应的隐层语义表示;提取多个要点对文本中的每个要点对文本的所述开始标识符对应位置处的隐层语义表示作为每个要点对文本之间的上下文相似度的隐层语义表示。5.根据权利要求3所述的方法,其特征在于,所述方法还包括口语评分模型,所述口语评分模型包括要点重要度模块,所述对所述全文要点语义表示和所述隐层语义表示进行注意力机制处理,以得到经过所述隐层语义表示的注意力权重加权之后的全局要点表示的步骤,包括:将所述全文要点语义表示和所述隐层语义表示进行拼接处理,以得到拼接语义表示;
将所述拼接语义表示输入至所述要点重要度模块的要点重要度模型中进行注意力权重处理,以得到所述全文要点语义表示和多个所述隐层语义表示对应的注意力权重;根据多个所述隐层语义表示对应的注意力权重和对应的所述隐层语义表示进行加权处理,确定经过所述隐层语义表示的注意力权重加权之后的全局要点表示。6.根据权利要求2所述的方法,其特征在于,所述方法还包括口语评分模型,所述口语评分模型包括要点级别语义对错模块,所述对多个范文要点中的每个范文要点和所述文本序列进行要点提取处理,以确定每个范文要点对应的考生作答要点的步骤,包括:将多个范文要点中的每个范文要点和所述文本序列进行拼接处理,以得到多个拼接文本序列;将多个拼接文本序列中的每个拼接文本序列输入至所述要点级别语义对错模块中的要点抽取模型中进行要点提取处理,以得到每个范文要点对应的考生作答要点。7.根据权利要求1所述的方法,其特征在于,所述获取所述口语考试的多个范文要点的步骤,包括:获取口语考试所对应的看图说话题的考试图片;对所述考试图片进行图片编码处理,以得到图片编码结果;根据所述图片编码结果,生成所述考试图片的多个范文要点。8.根据权利要求1所述的方法,其特征在于,所述方法还包括口语评分模型,所述口语评分模型包括融合模块,所述根据所述全文语音水平表示、所述全文语言水平表示和所述全局要点表示,对所述考生作答进行评分处理,以得到所述考生作答的评分的步骤,包括:将所述全文语音水平表示、所述全文语言水平表示和所述全局要点表示进行融合处理,以得到融合了要点表示的融合隐层表示;将所述融合隐层表示输入至所述融合模块中的融合模型中进行非线性评分处理,以得到所述考生作答的评分。9.根据权利要求1所述的方法,其特征在于,所述根据所述语音、所述音素序列确定所述考生作答的全文语音水平表示的步骤,包括:将所述语音分成多个语音片段,并确定多个语音片段对应的多个音素片段;对多个语音片段中的每个语音片段、多个音素片段中与每个语音片段对应的每个音素片段,进行编解码处理,以得到每个语音片段的隐层表示;将所得到的多个语音片段的隐层表示按照音素级别进行处理,以得到所述考生作答的全文语音水平表示。10.一种口语评分模型训练方法,其特征在于,包括:获取训练数据集和初始口语评分模型,其中,训练数据集中包括口语考试中的多个训练样本,每个训练样本中包括每个考生作答的训练语音、所述考生作答的标签评分、以及根据所述训练语音所确定的所述考生作答全文的训练文本序列和所述考生作答全文的训练音素序列;将所述训练语音和所述训练音素序列输入至所述初始口语评分模型的语音水平建模模块中进行编解码处理,以确定所述考生作...
【专利技术属性】
技术研发人员:朱磊,李浩,盛志超,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。