一种口语测试评估方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39324212 阅读:9 留言:0更新日期:2023-11-12 16:03
本申请涉及计算机领域,尤其涉及一种口语测试评估方法、装置、电子设备及存储介质,方法包括:在获得多个被测试对象的音频数据的初始评估结果后,如果确定存在评估标准变更信息,则获取多个音频数据各自对应的文本数据,提取每个文本数据对应的文本特征;基于多个文本特征之间的相似性,对多个文本数据进行聚类处理,获得多个文本数据集合;基于评估标准变更信息,确定多个文本数据集合中待处理的至少一个目标文本数据集合;基于设定的调整方式,将每个目标文本数据集合中的多个目标文本数据各自对应的初始评估结果进行调整,获得多个目标文本数据各自的最终评估结果。本申请通过批量对初始评估结果进行调整,提高机器评估的效率。率。率。

【技术实现步骤摘要】
一种口语测试评估方法、装置、电子设备及存储介质


[0001]本申请涉及计算机领域,尤其涉及一种口语测试评估方法、装置、电子设备及存储介质。

技术介绍

[0002]随着英文口语测试规模的日益增大,大量考生的音频数据需要进行评估。人工评估是传统的评估方法,但存在很多不易解决的问题,如评估较主观等,使得评估结果不准确;因此,机器评估方法被越来越多的应用于英文口语测试中。
[0003]在目前的机器评估方法中,通常采用评估模型对考生的音频数据进行评估,该评估模型基于标注样本集训练获得,标注样本集中的每个标注样本包括样本音频数据和分数标签,每个样本音频数据可以是一个考生的音频数据,分数标签由人工根据参考答案确定。
[0004]在训练上述评估模型过程中或者获得上述评估模型后,如果上述参考答案出现临时更新(如增加答案、删除答案、修改答案等),或者,由于打分标准变化导致标注样本中的分数标签出现误标注,则可能使得评估模型的评估结果出现偏差,需要重新训练评估模型并重新对考生的音频数据进行评估,这会耗费很长的时间,从而降低机器评估的效率。

技术实现思路

[0005]本申请提供了一种口语测试评估方法、装置、电子设备及存储介质,用以在评估模型的评估结果出现偏差的情况下,无需重新训练评估模型,通过批量对评估结果进行调整,提高机器评估的效率。
[0006]第一方面,本申请实施例提供一种口语测试评估方法,包括:
[0007]在获得多个被测试对象各自的音频数据的初始评估结果后,若确定存在评估标准变更信息,则获取所述多个被测试对象各自的音频数据对应的文本数据;
[0008]提取所述多个文本数据各自对应的文本特征,并基于获得的多个文本特征之间的相似性,对所述多个文本数据进行聚类处理,获得多个文本数据集合;
[0009]基于所述评估标准变更信息,确定所述多个文本数据集合中待处理的至少一个目标文本数据集合;
[0010]针对所述至少一个目标文本数据集合,分别执行以下操作:基于设定的调整方式,将一个目标文本数据集合中的多个目标文本数据各自对应的初始评估结果进行调整,获得所述多个目标文本数据各自的最终评估结果。
[0011]第二方面,本申请实施例提供一种口语测试评估装置,包括:
[0012]获取模块,用于在获得多个被测试对象各自的音频数据的初始评估结果后,若确定存在评估标准变更信息,则获取所述多个被测试对象各自的音频数据对应的文本数据;
[0013]聚类模块,用于提取所述多个文本数据各自对应的文本特征,并基于获得的多个文本特征之间的相似性,对所述多个文本数据进行聚类处理,获得多个文本数据集合;
[0014]确定模块,用于基于所述评估标准变更信息,确定所述多个文本数据集合中待处
理的至少一个目标文本数据集合;
[0015]调整模块,用于针对所述至少一个目标文本数据集合,分别执行以下操作:基于设定的调整方式,将一个目标文本数据集合中的多个目标文本数据各自对应的初始评估结果进行调整,获得所述多个目标文本数据各自的最终评估结果。
[0016]在一些可能的实施例中,所述聚类模块还用于:
[0017]基于获得的多个文本特征之间的相似性,对所述多个文本数据进行第一聚类处理,获得多个第一文本数据集合;
[0018]针对所述多个第一文本数据集合,分别执行以下操作:基于一个第一文本数据集合对应的多个文本特征的相似性,对所述第一文本数据集合中的多个文本数据进行第二聚类处理,获得多个第二文本数据集合;
[0019]将获得的多个第二文本数据集合作为所述多个文本数据集合。
[0020]在一些可能的实施例中,所述评估标准变更信息包括参考答案变更信息,每个文本数据集合中包含一个聚类中心文本数据;
[0021]则所述确定模块还用于:
[0022]针对所述多个文本数据集合,分别执行以下操作:确定一个文本数据集合中的聚类中心文本数据,与所述参考答案变更信息中的变更数据的相似度;
[0023]将相似度满足预设相似度条件的聚类中心文本数据所在的文本数据集合,作为所述目标文本数据集合。
[0024]在一些可能的实施例中,所述调整模块还用于:
[0025]基于所述参考答案变更信息中的变更数据,确定所述一个目标文本数据集合对应的评估调整值;
[0026]基于所述评估调整值,对所述一个目标文本数据集合中的多个目标文本数据各自对应的初始评估结果进行调整。
[0027]在一些可能的实施例中,所述评估标准变更信息包括打分标准变更信息;
[0028]则所述确定模块还用于:
[0029]基于所述打分标准变更信息,将所述多个文本数据集合中的每个文本数据集合作为一个目标文本数据集合。
[0030]在一些可能的实施例中,所述调整模块还用于:
[0031]确定所述一个目标文本数据集合中的多个目标文本数据各自对应的初始评估结果,是否满足预设数据分布;
[0032]如果不满足,则将所述一个目标文本数据集合中的多个目标文本数据各自对应的初始评估结果,调整至满足所述预设数据分布。
[0033]在一些可能的实施例中,所述提取所述多个文本数据各自对应的文本特征时,所述聚类模块还用于:
[0034]针对所述多个文本数据,分别执行以下操作:
[0035]将一个文本数据中的至少一个单词数据进行词处理,获得所述至少一个单词数据各自的词干数据;
[0036]基于预设的词向量生成方法,生成至少一个词干数据各自对应的词向量;
[0037]基于生成的至少一个词向量,获得所述一个文本数据对应的文本特征。
[0038]第三方面,本申请实施例提供一种电子设备,其包括处理器和存储器,其中,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行第一方面任一所述方法的步骤。
[0039]第四方面,本申请实施例提供一种计算机存储介质,所述计算机存储介质存储有计算机程序,当所述计算机程序在计算机上运行时,使得计算机执行第一方面任一所述方法的步骤。
[0040]第五方面,本申请实施例提供一种计算机程序产品,其包括计算机程序,所述计算机程序存储在计算机可读存储介质中;当电子设备的处理器从所述计算机可读存储介质读取所述计算机程序时,所述处理器执行该计算机程序,使得所述电子设备执行第一方面任一所述方法的步骤。
[0041]本申请实施例采用上述技术方案,至少具有如下技术效果:
[0042]在获得多个被测试对象的音频数据的初始评估结果后,如果确定存在评估标准变更信息,则需要对各个初始评估结果进行调整,此时,获取多个音频数据各自转换后的文本数据,并获得每个文本数据对应的文本特征;基于获得的多个文本特征之间的相似性,对多个文本数据进行聚类处理,获得多个文本数据集合;基于评估标准变更信息,确定多个文本数据集合中需要处理的至少一个目标文本数据集合;针对每个目标文本数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种口语测试评估方法,其特征在于,包括:在获得多个被测试对象各自的音频数据的初始评估结果后,若确定存在评估标准变更信息,则获取所述多个被测试对象各自的音频数据对应的文本数据;提取所述多个文本数据各自对应的文本特征,并基于获得的多个文本特征之间的相似性,对所述多个文本数据进行聚类处理,获得多个文本数据集合;基于所述评估标准变更信息,确定所述多个文本数据集合中待处理的至少一个目标文本数据集合;针对所述至少一个目标文本数据集合,分别执行以下操作:基于设定的调整方式,将一个目标文本数据集合中的多个目标文本数据各自对应的初始评估结果进行调整,获得所述多个目标文本数据各自的最终评估结果。2.根据权利要求1所述的方法,其特征在于,所述基于获得的多个文本特征之间的相似性,对所述多个文本数据进行聚类处理,获得多个文本数据集合,包括:基于获得的多个文本特征之间的相似性,对所述多个文本数据进行第一聚类处理,获得多个第一文本数据集合;针对所述多个第一文本数据集合,分别执行以下操作:基于一个第一文本数据集合对应的多个文本特征的相似性,对所述第一文本数据集合中的多个文本数据进行第二聚类处理,获得多个第二文本数据集合;将获得的多个第二文本数据集合作为所述多个文本数据集合。3.根据权利要求1所述的方法,其特征在于,所述评估标准变更信息包括参考答案变更信息,每个文本数据集合中包含一个聚类中心文本数据;则基于所述评估标准变更信息,确定所述多个文本数据集合中待处理的至少一个目标文本数据集合,包括:针对所述多个文本数据集合,分别执行以下操作:确定一个文本数据集合中的聚类中心文本数据,与所述参考答案变更信息中的变更数据的相似度;将相似度满足预设相似度条件的聚类中心文本数据所在的文本数据集合,作为所述目标文本数据集合。4.根据权利要求3所述的方法,其特征在于,所述基于设定的调整方式,将一个目标文本数据集合中的多个目标文本数据各自对应的初始评估结果进行调整,包括:基于所述参考答案变更信息中的变更数据,确定所述一个目标文本数据集合对应的评估调整值;基于所述评估调整值,对所述一个目标文本数据集合中的多个目标文本数据各自对应的初始评估结果进行调整。5.根据权利要求1所述的方法,其特征在于,所述评估标准变更信息包括打分标准变更信息;则基于所述评估标准变更信息,确定所述多个文本数据集合中待处理的至少一个目标文本数据集合,包括:基于所述打分标准变更信息...

【专利技术属性】
技术研发人员:王知涵
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1