多轮对话模型的训练数据构建方法、装置及电子设备制造方法及图纸

技术编号：42618880 阅读：24 留言：0更新日期：2024-09-03 18:25

本说明书提供一种多轮对话模型的训练数据构建方法、装置及电子设备。该方法包括：获取在教育场景下的对话数据；对于多轮对话，在续轮对话中提问的长度小于第一设定阈值是进入第一处理分支，否则进入第二处理分支；在第一处理分支中，根据提问中所包含的关键词，得到续轮对话的分类结果；在第二处理分支中，根据提问的语法结构、提问与上一轮回答的上下文关系和所包含的关键词，得到续轮对话的分类结果；根据续轮对话的分类结果，确定对话数据的分类结果；根据分类结果得到分类训练数据，以在相应类别下对多轮对话模型进行训练，使得模型能够更加精准地理解用户在教育场景下的具体需求，提供更高质量的回答，从而提供更好的用户体验和教学效果。

全部详细技术资料下载

【技术实现步骤摘要】

本说明书一个或多个实施例涉及人工智能，尤其涉及一种多轮对话模型的训练数据构建方法、装置及电子设备。

技术介绍

1、在人工智能领域，尤其是自然语言处理(nlp)技术的发展中，大模型在多轮对话场景下的应用已成为研究和实践的热点。多轮对话技术的核心在于通过连续的交互，使得模型能够理解并适应用户的意图和上下文，从而提供更加准确和个性化的回复。

2、目前，在多轮对话训练数据构造方面的技术主要依赖于规则驱动的方法和基于少量标注数据的监督学习。然而在教育场景下，由于对话的复杂性和多样性，以上方法在实际应用中泛化能力和适应性不足，难以提供稳定和高质量的对话体验。

技术实现思路

1、有鉴于此，本说明书一个或多个实施例提供一种多轮对话模型的训练数据构建方法、装置及电子设备，以构建满足教育场景下用户需求的多样性的多轮对话模型的训练数据。

2、为实现上述目的，本说明书一个或多个实施例提供技术方案如下：

3、根据本说明书一个或多个实施例的第一方面，提出了一种多轮对话模型的训练数据构建方法，包括：

4、获取在教育场景下的对话数据；

5、在所述对话数据为多轮对话数据的情况下，在续轮对话中提问的长度小于第一设定阈值的情况下进入第一处理分支，否则进入第二处理分支；

6、在所述第一处理分支中，根据所述提问中所包含的关键词，得到所述续轮对话的分类结果；在所述第二处理分支中，根据所述提问的语法结构、所述提问与上一轮回答的上下文关系和所包含的关键词，得到所述续轮对话的分类结果；

7、根据所述续轮对话的分类结果，确定所述对话数据的分类结果；

8、根据所述分类结果得到分类训练数据，所述分类训练数据用于在相应类别下对所述多轮对话模型进行训练。

9、在一些实施例中，所述根据所述提问中所包含的第一设定关键词，得到所述续轮对话的分类结果，包括：

10、在所述关键词包含表征要求重复的词的情况下，确定所述分类结果指示要求重述类别；

11、在所述关键词包含口语应答词的情况下，确定所述分类结果指示无意义口语类别。

12、在一些实施例中，所述根据所述提问的语法结构、所述提问与上一轮回答的上下文关系和所包含的关键词中的至少一项，得到所述续轮对话的分类结果，包括：

13、在所述提问中包含主谓宾成分的情况下，进入第一子处理分支；否则，进入第二子处理分支；

14、在所述第一子处理分支中，根据所述提问所包含的关键词进行分类；

15、在所述第二子处理分支中，根据所述提问与上一轮回答的上下文关系和所包含的关键词进行分类。

16、在一些实施例中，在所述第一子处理分支中，根据所述提问所包含的关键词进行分类，包括：

17、若所述关键词包含自称代词和表征评价的词，确定所述分类结果指示用户自我评价类别，否则确定所述分类结果指示多轮单次问答类别。

18、在一些实施例中，在所述第二子处理分支中，根据所述提问与上一轮回答的上下文关系和所包含的关键词进行分类，包括：

19、若所述提问与上一轮回答的重复比例高于第二设定阈值，则确定所述分类结果指示无意义重复类别；

20、若所述提问中出现上一轮回答的词或短句的次数满足设定要求且所述关键词包含表征要求说明的词，则确定所述分类结果指示细节追问类别；

21、否则，判断所述关键词中是否包含表征评价的词，若包含则确定所述分类结果指示评价模型回复类别，否则确定所述分类结果指示多轮单次问答类别。

22、在一些实施例中，所述方法还包括：在所述对话数据中存在分类结果不同的续轮对话的情况下，将出现次数最多的分类结果作为所述对话数据的分类结果。

23、在一些实施例中，所述方法还包括：在所述对话数据为单轮对话数据或者多轮单次问答数据的情况下，根据提问的问题类型对得到所述对话数据的分类结果，所述问题类型包括知识点询问、作业帮助、学习策略中的至少一种。

24、根据本说明书一个或多个实施例的第二方面，提出了一种多轮对话模型的训练数据构建装置，包括：

25、获取单元，用于获取在教育场景下的对话数据；

26、判断单元，用于在所述对话数据为多轮对话数据的情况下，在续轮对话中提问的长度小于第一设定阈值的情况下进入第一处理分支，否则进入第二处理分支；

27、分类单元，用于在所述第一处理分支中，根据所述提问中所包含的关键词，得到所述续轮对话的分类结果；在所述第二处理分支中，根据所述提问的语法结构、所述提问与上一轮回答的上下文关系和所包含的关键词，得到所述续轮对话的分类结果；

28、确定单元，用于根据所述续轮对话的分类结果，确定所述对话数据的分类结果；

29、构建单元，用于根据所述分类结果得到分类训练数据，所述分类训练数据用于在相应类别下对所述多轮对话模型进行训练。

30、在一些实施例中，所述分类单元具体用于：

31、在所述关键词包含表征要求重复的词的情况下，确定所述分类结果指示要求重述类别；

32、在所述关键词包含口语应答词的情况下，确定所述分类结果指示无意义口语类别。

33、在一些实施例中，所述分类单元具体用于：

34、在所述提问中包含主谓宾成分的情况下，进入第一子处理分支；否则，进入第二子处理分支；

35、在所述第一子处理分支中，根据所述提问所包含的关键词进行分类；

36、在所述第二子处理分支中，根据所述提问与上一轮回答的上下文关系和所包含的关键词进行分类。

37、在一些实施例中，所述分类单元在用于根据所述提问所包含的关键词进行分类时，具体用地：

38、若所述关键词包含自称代词和表征评价的词，确定所述分类结果指示用户自我评价类别，否则确定所述分类结果指示多轮单次问答类别。

39、在一些实施例中，所述分类单元在用于根据所述提问与上一轮回答的上下文关系和所包含的关键词进行分类时，具体用于：

40、若所述提问与上一轮回答的重复比例高于第二设定阈值，则确定所述分类结果指示无意义重复类别；

41、若所述提问中出现上一轮回答的词或短句的次数满足设定要求且所述关键词包含表征要求说明的词，则确定所述分类结果指示细节追问类别；

42、否则，判断所述关键词中是否包含表征评价的词，若包含则确定所述分类结果指示评价模型回复类别，否则确定所述分类结果指示多轮单次问答类别。

43、在一些实施例中，所述装置还包括更新单元，用于：

44、在所述对话数据中存在分类结果不同的续轮对话的情况下，将出现次数最多的分类结果作为所述对话数据的分类结果。

45、在一些实施例中，所述装置还包括细化单元，用于：

46、在所述对话数据为单轮对话数据或者多轮单次问答数据的情况下，根据提问的问题类型对得到所述本文档来自技高网...

【技术保护点】

1.一种多轮对话模型的训练数据构建方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述提问中所包含的关键词，得到所述续轮对话的分类结果，包括：

3.根据权利要求1所述的方法，其特征在于，所述根据所述提问的语法结构、所述提问与上一轮回答的上下文关系和所包含的关键词，得到所述续轮对话的分类结果，包括：

4.根据权利要求3所述的方法，其特征在于，在所述第一子处理分支中，根据所述提问所包含的关键词进行分类，包括：

5.根据权利要求3所述的方法，其特征在于，在所述第二子处理分支中，根据所述提问与上一轮回答的上下文关系和所包含的关键词进行分类，包括：

6.根据权利要求1至5中任一项所述的方法，其特征在于，所述方法还包括：在所述对话数据中存在分类结果不同的续轮对话的情况下，将出现次数最多的分类结果作为所述对话数据的分类结果。

7.根据权利要求1至5中任一项所述的方法，其特征在于，所述方法还包括：在所述对话数据为单轮对话数据或者多轮单次问答数据的情况下，根据提问的问题类型对得到所述对话数据的分类结

8.一种多轮对话模型的训练数据构建装置，其特征在于，包括：

9.一种电子设备，包括：

10.一种计算机程序产品，包括计算机程序/指令，该计算机程序/指令被处理器执行时实现如权利要求1-7中任一项所述方法的步骤。

...

【技术特征摘要】

1.一种多轮对话模型的训练数据构建方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述提问中所包含的关键词，得到所述续轮对话的分类结果，包括：

4.根据权利要求3所述的方法，其特征在于，在所述第一子处理分支中，根据所述提问所包含的关键词进行分类，包括：

5.根据权利要求3所述的方法，其特征在于，在所述第二子处理分支中，根据所述提问与上一轮回答的上下文关系和所包含的关键词进行分类，包括：

6.根据权利要求1至...

【专利技术属性】
技术研发人员：涂泽傲，贺宇，田意翔，齐天雨，姚子晗，李志，李明，
申请(专利权)人：深圳市星桐科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人