System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种错因解析数据增强方法、装置、存储介质及设备制造方法及图纸_技高网

一种错因解析数据增强方法、装置、存储介质及设备制造方法及图纸

技术编号:40963085 阅读:7 留言:0更新日期:2024-04-18 20:42
本申请公开了一种错因解析数据增强方法、装置、存储介质及设备,该方法包括:首先将目标无标注数据文本结合第一prompt,判断目标作答文本是否作答正确;若是,则利用作答错误的已标注数据文本结合第二prompt,对目标无标注数据文本进行改写,并利用K个属于不同错误类型的作答错误的已标注数据文本,对改写后的目标无标注数据文本进行错因解析,得到第一错因解析结果;再将其与改写后的目标无标注数据文本构成增强后的第一错因解析数据;若否,则利用K个属于不同错误类型的作答错误的已标注数据文本,结合第三prompt,对目标无标注数据文本进行错因解析,得到第二错因解析结果;并将其与目标无标注数据文本构成增强后的第二错因解析数据,提高了增强准确率。

【技术实现步骤摘要】

本申请涉及自然语言处理,尤其涉及一种错因解析数据增强方法、装置、存储介质及设备


技术介绍

1、随着人工智能、物联网等信息技术的快速发展,人机交互的应用场景越来越广泛。各式各样的大语言模型(large lakguage model,简称llm)出现在人们的生活工作中,如聊天生成预训练转换器(chat gekerative pre-traiked traksformer,简称chatgpt)、智能音箱、智能电视等,可以为人们提供数据分析等众多应用场景的智能交互功能,以辅助用户完成各种行为意图。一个常见的用途是让大语言模型理解题目问题、标准答案和学生作答,通过大语言模型对学生作答进行诊断,判断学生作答是否正确,指出学生作答的错误位置,并生成相应的错误原因分析,实现错因解析。

2、大语言模型的预训练和微调都需要海量数据,而且数据的质量对大语言模型的表现有至关重要的影响,所以,如果想提高大语言模型实现错音解析的效果,就需要更多的标注好的错因解析数据进行模型训练。但是,如教育领域等垂直领域下的标注数据数量较少,垂直领域大模型的训练数据需要大量标注人员进行大规模标注,成本较高,且标注数据的质量无法保证。即使采用现有的随机交换、随机插入、随机删除和同义词替换等数据增强方法进行错因解析数据增强,也无法得到较为理想的增强效果。


技术实现思路

1、本申请实施例的主要目的在于提供一种错因解析数据增强方法、装置、存储介质及设备,能够提高错因解析数据的增强效率和准确率。

2、本申请实施例提供了一种错因解析数据增强方法,包括:

3、获取待处理的目标无标注数据文本;所述目标无标注数据文本包括目标题目、目标标准答案和目标作答文本;

4、将所述目标无标注数据文本结合第一提示指令prompt,输入至预设的大语言模型,判断所述目标作答文本是否作答正确;

5、若是,则利用作答错误的已标注数据文本结合第二提示指令prompt,输入至预设的大语言模型,对所述目标无标注数据文本进行改写,得到改写后的目标无标注数据文本;并利用k个属于不同错误类型的作答错误的已标注数据文本,结合第三提示指令prompt,输入至预设的大语言模型,对所述改写后的目标无标注数据文本进行错因解析,得到所述改写后的目标无标注数据文本对应的第一错因解析结果;以及将改写后的目标无标注数据文本及其对应的第一错因解析结果,构成增强后的第一错因解析数据;所述k为大于1的正整数;

6、若否,则利用k个属于不同错误类型的作答错误的已标注数据文本,结合第三提示指令prompt,输入至预设的大语言模型,对所述目标无标注数据文本进行错因解析,得到所述目标无标注数据文本对应的第二错因解析结果;并将所述目标无标注数据文本及其对应的第二错因解析结果,构成增强后的第二错因解析数据。

7、一种可能的实现方式中,所述将所述目标无标注数据文本结合第一提示指令prompt,输入至预设的大语言模型,判断所述目标作答文本是否作答正确之后,所述方法还包括:

8、当判断出所述目标作答文本作答正确时,利用作答正确的已标注数据文本结合第四提示指令prompt,输入至预设的大语言模型,对所述目标无标注数据文本进行错因解析,得到所述目标无标注数据文本对应的第三错因解析结果;并将所述目标无标注数据文本及其对应的第三错因解析结果,构成增强后的第三错因解析数据。

9、一种可能的实现方式中,所述利用作答错误的已标注数据文本结合第二提示指令prompt,输入至预设的大语言模型,对所述目标无标注数据文本进行改写,得到改写后的目标无标注数据文本之后,所述方法还包括:

10、计算目标作答文本和改写后的目标作答文本的编辑距离,并利用所述编辑距离对所述改写后的目标无标注数据文本进行过滤,得到过滤后的目标无标注数据文本;

11、和/或,对所述改写后的目标无标注数据文本进行改写合规性和适用性的过滤,得到过滤后的目标无标注数据文本。

12、一种可能的实现方式中,所述利用k个属于不同错误类型的作答错误的已标注数据文本,结合第三提示指令prompt,输入至预设的大语言模型,对所述改写后的目标无标注数据文本进行错因解析,得到所述改写后的目标无标注数据文本对应的第一错因解析结果;以及将改写后的目标无标注数据文本及其对应的第一错因解析结果,构成增强后的第一错因解析数据,包括:

13、利用k个属于不同错误类型的作答错误的已标注数据文本,结合第三提示指令prompt,输入至预设的大语言模型,对所述过滤后的目标无标注数据文本进行错因解析,得到所述过滤后的目标无标注数据文本对应的第一错因解析结果;以及将过滤后的目标无标注数据文本及其对应的第一错因解析结果,构成增强后的第一错因解析数据。

14、一种可能的实现方式中,所述利用k个属于不同错误类型的作答错误的已标注数据文本,对所述改写后的目标无标注数据文本进行错因解析,得到所述改写后的目标无标注数据文本对应的第一错因解析结果之后,所述方法还包括:

15、提取所述第一错因解析结果中的错因分析文本和错误类型,并利用预训练的bert模型确定二者对应的第一句向量;

16、对所述第一句向量进行白化处理,得到白化后的第一句向量;

17、利用聚类算法,对所述白化后的第一句向量进行聚类处理,并根据得到的聚类结果构建错误类型候选集;

18、所述将改写后的目标无标注数据文本及其对应的第一错因解析结果,构成增强后的第一错因解析数据,包括:

19、根据所述错误类型候选集,调整第一错因解析结果,并将改写后的目标无标注数据文本及其对应的调整后的第一错因解析结果,构成增强后的第一错因解析数据。

20、一种可能的实现方式中,所述利用k个属于不同错误类型的作答错误的已标注数据文本,结合第三提示指令prompt,输入至预设的大语言模型,对所述目标无标注数据文本进行错因解析,得到所述目标无标注数据文本对应的第二错因解析结果之后,所述方法还包括:

21、提取所述第二错因解析结果中的错因分析文本和错误类型,并利用预训练的bert模型确定二者对应的第二句向量;

22、对所述第二句向量进行白化处理,得到白化后的第二句向量;

23、利用聚类算法,对所述白化后的第二句向量进行聚类处理,并根据得到的聚类结果构建错误类型候选集;

24、所述将所述目标无标注数据文本及其对应的第二错因解析结果,构成增强后的第二错因解析数据,包括:

25、根据所述错误类型候选集,调整第二错因解析结果,并将所述目标无标注数据文本及其对应的调整后的第二错因解析结果,构成增强后的第二错因解析数据。

26、一种可能的实现方式中,所述聚类算法为k均值聚类算法。

27、本申请实施例还提供了一种错因解析数据增强装置,包括:

28、获取单元,用于获取待处理的目标无标注数据文本;所述目标无标注数本文档来自技高网...

【技术保护点】

1.一种错因解析数据增强方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述目标无标注数据文本结合第一提示指令prompt,输入至预设的大语言模型,判断所述目标作答文本是否作答正确之后,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述利用作答错误的已标注数据文本结合第二提示指令prompt,输入至预设的大语言模型,对所述目标无标注数据文本进行改写,得到改写后的目标无标注数据文本之后,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述利用K个属于不同错误类型的作答错误的已标注数据文本,结合第三提示指令prompt,输入至预设的大语言模型,对所述改写后的目标无标注数据文本进行错因解析,得到所述改写后的目标无标注数据文本对应的第一错因解析结果;以及将改写后的目标无标注数据文本及其对应的第一错因解析结果,构成增强后的第一错因解析数据,包括:

5.根据权利要求1所述的方法,其特征在于,所述利用K个属于不同错误类型的作答错误的已标注数据文本,对所述改写后的目标无标注数据文本进行错因解析,得到所述改写后的目标无标注数据文本对应的第一错因解析结果之后,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述利用K个属于不同错误类型的作答错误的已标注数据文本,结合第三提示指令prompt,输入至预设的大语言模型,对所述目标无标注数据文本进行错因解析,得到所述目标无标注数据文本对应的第二错因解析结果之后,所述方法还包括:

7.根据权利要求5或6所述的方法,其特征在于,所述聚类算法为k均值聚类算法。

8.一种错因解析数据增强装置,其特征在于,包括:

9.一种错因解析数据增强设备,其特征在于,包括:处理器、存储器、系统总线;

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行权利要求1-7任一项所述的方法。

...

【技术特征摘要】

1.一种错因解析数据增强方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述目标无标注数据文本结合第一提示指令prompt,输入至预设的大语言模型,判断所述目标作答文本是否作答正确之后,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述利用作答错误的已标注数据文本结合第二提示指令prompt,输入至预设的大语言模型,对所述目标无标注数据文本进行改写,得到改写后的目标无标注数据文本之后,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述利用k个属于不同错误类型的作答错误的已标注数据文本,结合第三提示指令prompt,输入至预设的大语言模型,对所述改写后的目标无标注数据文本进行错因解析,得到所述改写后的目标无标注数据文本对应的第一错因解析结果;以及将改写后的目标无标注数据文本及其对应的第一错因解析结果,构成增强后的第一错因解析数据,包括:

5.根据权利要求1所述的方法,其...

【专利技术属性】
技术研发人员:盛志超朱焯铭王永康钟志成沙晶杜倩云王士进刘聪胡国平
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1