选择题的混淆选项生成方法及装置、电子设备、存储介质制造方法及图纸

技术编号:37272646 阅读:25 留言:0更新日期:2023-04-20 23:41
本申请提供一种选择题的混淆选项生成方法及装置、电子设备、计算机可读存储介质,属于自然语言处理技术领域,方法包括:从目标文档中抽取出至少一个目标词汇,得到选择题的题干;为所述题干的空格位置添加掩词标记,得到指定题干;其中,所述空格位置为抽取掉所述目标词汇的位置;将所述指定题干输入至已训练的掩码语言模型,获得所述掩码语言模型输出的对应于所述掩词标记的多个预测词汇,以及每一预测词汇的预测得分;选择预测得分靠前的若干预测词汇,并从所述若干预测词汇中去除所述目标词汇,得到所述掩词标记所在空格位置的混淆选项。本申请方案,实现了自动化生成选择题的混淆选项。淆选项。淆选项。

【技术实现步骤摘要】
选择题的混淆选项生成方法及装置、电子设备、存储介质


[0001]本申请涉及自然语言处理
,特别涉及一种选择题的混淆选项生成方法及装置、电子设备、计算机可读存储介质。

技术介绍

[0002]陪练系统是通过在线做题的形式,帮助用户掌握业务知识,对用户的掌握情况进行在线考试打分的系统。在为陪练系统出完形填空选择题时,需要人工从知识文档中抽取一个或连续几个字,把抽取的文本作为正确答案,然后人为想出与正确答案近似的混淆选项。这一过程中,需要消耗较多的人工成本和时间成本。

技术实现思路

[0003]本申请实施例的目的在于提供一种选择题的混淆选项生成方法及装置、电子设备、计算机可读存储介质,用于自动化生成选择题的混淆选项。
[0004]一方面,本申请提供了一种选择题的混淆选项生成方法,包括:
[0005]从目标文档中抽取出至少一个目标词汇,得到选择题的题干;
[0006]为所述题干的空格位置添加掩词标记,得到指定题干;其中,所述空格位置为抽取掉所述目标词汇的位置;
[0007]将所述指定题干输入至已训练的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种选择题的混淆选项生成方法,其特征在于,包括:从目标文档中抽取出至少一个目标词汇,得到选择题的题干;为所述题干的空格位置添加掩词标记,得到指定题干;其中,所述空格位置为抽取掉所述目标词汇的位置;将所述指定题干输入至已训练的掩码语言模型,获得所述掩码语言模型输出的对应于所述掩词标记的多个预测词汇,以及每一预测词汇的预测得分;选择预测得分靠前的若干预测词汇,并从所述若干预测词汇中去除所述目标词汇,得到所述掩词标记所在空格位置的混淆选项。2.根据权利要求1所述的方法,其特征在于,所述从目标文档中抽取出至少一个目标词汇,包括:响应于抽取指令,从所述目标文档中抽取所述抽取指令指示的至少一个目标词汇。3.根据权利要求1所述的方法,其特征在于,所述掩码语言模型通过如下方式训练得到:对样本数据集中的样本文档,抽取出至少一个指定词汇,得到样本题干;为所述样本题干的空格位置添加掩词标记,得到指定样本题干;将所述指定样本题干输入至用于预测遮挡词汇的自然语言模型,得到所述自然语言模型的词表中各个词汇在掩词标记对应的预测得分;针对每一掩词标记,检查所述指定词汇在所述掩词标记对应的预测得分,并根据所述指定词汇的预测得分与默认得分之间的差异,调整所述自然语言模型的模型参数;重复上述过程,直至所述自然语言模型收敛,得到已训练的掩码语言模型。4.根据权利要求3所述的方法,其特征在于,在所述将所述指定样本题干输入至用于预测遮挡词汇的自然语言模型,得到所述自然语言模型的词表中各个词汇在掩词标记对应的预测得分之前,所述方法还包括:对所述样本数据集中的样本文档进行分词处理,得到多个分词结果;从所述多个分词结果中滤除停用词和无效词,获得经过滤除处理的分词结果,作为候选词汇;统计各个候选词汇在所述样本文档中的词频,并选择词频靠前的指定数量的多个候选词汇,构建所述词表。5.根据权利要求3所述的方法,...

【专利技术属性】
技术研发人员:简仁贤李龙威马永宁韩哲
申请(专利权)人:竹间智能科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1