System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于大模型的客服对话摘要生成方法及可读存储介质技术_技高网

基于大模型的客服对话摘要生成方法及可读存储介质技术

技术编号:41011447 阅读:2 留言:0更新日期:2024-04-18 21:47
本发明专利技术公开了一种基于大模型的客服对话摘要生成方法及可读存储介质,包括:首先,收集目标客户和目标客服之间的沟通记录;然后,将这些沟通记录输入到预先训练好的客服对话摘要生成模型中,输出得到相应的目标客服对话摘要。值得注意的是,这个客服对话摘要生成模型是基于大模型进行训练得到的。这种方法有效地实现了从庞大的客服对话中自动生成有用的摘要,有助于提升客服工作效率和服务质量。

【技术实现步骤摘要】

本专利技术涉及人工智能,具体而言,涉及一种基于大模型的客服对话摘要生成方法及可读存储介质


技术介绍

1、随着互联网技术的发展,客服服务已经成为企业与用户沟通的重要渠道。然而,由于客服对话通常包含大量信息,并且对话内容复杂多样,这使得从对话中提取关键信息变得非常困难。传统的方法通常需要人工进行对话摘要,不仅耗时耗力,而且难以保证摘要的准确性和完整性。因此,如何通过自动化方式,从客服对话中生成高质量的摘要,是当前亟需解决的问题。


技术实现思路

1、本专利技术的目的在于提供一种基于大模型的客服对话摘要生成方法及可读存储介质。

2、第一方面,本专利技术实施例提供一种基于大模型的客服对话摘要生成方法,所述方法包括:

3、采集目标客户和目标客服的沟通记录;

4、将所述沟通记录输入预先训练完成的客服对话摘要生成模型中,输出得到所述沟通记录对应的目标客服对话摘要,所述客服对话摘要生成模型是基于大模型训练得到的。

5、在一种可能的实施方式中,所述客服对话摘要生成模型是通过以下方式训练得到的,包括:

6、获取样本沟通记录,并对所述样本沟通记录进行清洗;

7、将清洗后的所述样本沟通记录输入第一初始大模型进行训练,得到中间对话摘要训练结果;

8、基于所述中间对话摘要训练结果对第二初始大模型中进行知识蒸馏,得到所述客服对话摘要生成模型,其中,所述第一初始大模型的参数量超过所述第二初始大模型的参数量。

9、在一种可能的实施方式中,所述获取样本沟通记录,并对所述样本沟通记录进行清洗,包括:

10、对所述样本沟通记录进行语音转文本操作,并利用正则表达式对所述样本沟通记录进行清洗。

11、在一种可能的实施方式中,所述第一初始大模型为gpt-4大模型,所述将清洗后的所述样本沟通记录输入第一初始大模型进行训练,得到中间对话摘要训练结果,包括:

12、将清洗后的所述样本沟通记录输入gpt-4大模型进行训练,得到基础客服对话摘要生成模型;

13、将所述基础客服对话摘要生成模型作为所述中间对话摘要训练结果。

14、在一种可能的实施方式中,所述将清洗后的所述样本沟通记录输入gpt-4大模型进行训练,得到基础客服对话摘要生成模型,包括:

15、将清洗后的所述样本沟通记录输入gpt-4大模型,并构建提示词;

16、基于所述gpt-4大模型的icl能力,在所述提示词中注入多个任务示例,并输出任务结果,以使所述gpt-4大模型学习到任务所需的知识;

17、基于所述gpt-4大模型的cot能力,通过所述提示词引导所述gpt-4大模型输出具体任务的推理思维过程,以提升模型的输出准确率;

18、结合所述icl能力和所述cot能力进行训练,得到所述基础客服对话摘要生成模型。

19、在一种可能的实施方式中,所述第二初始大模型为预设开源大模型,所述基于所述中间对话摘要训练结果对第二初始大模型中进行知识蒸馏,得到所述客服对话摘要生成模型,包括:

20、将所述基础客服对话摘要生成模型作为教师模型,将所述预设开源大模型作为学生模型;

21、基于所述教师模型和所述学生模型的模型关系,将所述基础客服对话摘要生成模型的摘要知识通过知识蒸馏至所述预设开源大模型;

22、基于知识蒸馏后的所述预设开源大模型,得到所述客服对话摘要生成模型。

23、在一种可能的实施方式中,所述基于知识蒸馏后的所述预设开源大模型,得到所述客服对话摘要生成模型,包括:

24、利用p-tuningv2和lora训练法对所述预设开源大模型对应的指令训练集进行参数微调;

25、并基于微调完成的所述指令训练集对所述预设开源大模型进行训练,得到所述客服对话摘要生成模型。

26、第二方面,本专利技术实施例提供一种基于大模型的客服对话摘要生成装置,所述装置包括:

27、获取模块,用于采集目标客户和目标客服的沟通记录;

28、生成模块,用于将所述沟通记录输入预先训练完成的客服对话摘要生成模型中,输出得到所述沟通记录对应的目标客服对话摘要,所述客服对话摘要生成模型是基于大模型训练得到的。

29、第三方面,本专利技术实施例提供一种计算机设备,所述计算机设备包括处理器及存储有计算机指令的非易失性存储器,所述计算机指令被所述处理器执行时,所述计算机设备执行第一方面至少一种可能的实施方式中所述基于大模型的客服对话摘要生成方法。

30、第四方面,本专利技术实施例提供一种可读存储介质,所述可读存储介质包括计算机程序,所述计算机程序运行时控制所述可读存储介质所在计算机设备执行第一方面至少一种可能的实施方式中所述的基于大模型的客服对话摘要生成方法。

31、相比现有技术,本专利技术提供的有益效果包括:采用本专利技术公开的一种基于大模型的客服对话摘要生成方法及可读存储介质,通过收集目标客户和目标客服之间的沟通记录;然后,将这些沟通记录输入到预先训练好的客服对话摘要生成模型中,输出得到相应的目标客服对话摘要。值得注意的是,这个客服对话摘要生成模型是基于大模型进行训练得到的。这种方法有效地实现了从庞大的客服对话中自动生成有用的摘要,有助于提升客服工作效率和服务质量。

本文档来自技高网...

【技术保护点】

1.一种基于大模型的客服对话摘要生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述客服对话摘要生成模型是通过以下方式训练得到的,包括:

3.根据权利要求2所述的方法,其特征在于,所述获取样本沟通记录,并对所述样本沟通记录进行清洗,包括:

4.根据权利要求2所述的方法,其特征在于,所述第一初始大模型为GPT-4大模型,所述将清洗后的所述样本沟通记录输入第一初始大模型进行训练,得到中间对话摘要训练结果,包括:

5.根据权利要求4所述的方法,其特征在于,所述将清洗后的所述样本沟通记录输入GPT-4大模型进行训练,得到基础客服对话摘要生成模型,包括:

6.根据权利要求4所述的方法,其特征在于,所述第二初始大模型为预设开源大模型,所述基于所述中间对话摘要训练结果对第二初始大模型中进行知识蒸馏,得到所述客服对话摘要生成模型,包括:

7.根据权利要求6所述的方法,其特征在于,所述基于知识蒸馏后的所述预设开源大模型,得到所述客服对话摘要生成模型,包括:

8.一种基于大模型的客服对话摘要生成装置,其特征在于,所述装置包括:

9.一种计算机设备,其特征在于,所述计算机设备包括处理器及存储有计算机指令的非易失性存储器,所述计算机指令被所述处理器执行时,所述计算机设备执行权利要求1-7中任意一项所述基于大模型的客服对话摘要生成方法。

10.一种可读存储介质,其特征在于,所述可读存储介质包括计算机程序,所述计算机程序运行时控制所述可读存储介质所在计算机设备执行权利要求1-7中任意一项所述的基于大模型的客服对话摘要生成方法。

...

【技术特征摘要】

1.一种基于大模型的客服对话摘要生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述客服对话摘要生成模型是通过以下方式训练得到的,包括:

3.根据权利要求2所述的方法,其特征在于,所述获取样本沟通记录,并对所述样本沟通记录进行清洗,包括:

4.根据权利要求2所述的方法,其特征在于,所述第一初始大模型为gpt-4大模型,所述将清洗后的所述样本沟通记录输入第一初始大模型进行训练,得到中间对话摘要训练结果,包括:

5.根据权利要求4所述的方法,其特征在于,所述将清洗后的所述样本沟通记录输入gpt-4大模型进行训练,得到基础客服对话摘要生成模型,包括:

6.根据权利要求4所述的方法,其特征在于,所述第二初始大模型为预设开源大模型,所述基于...

【专利技术属性】
技术研发人员:蔡奕杰姜睿思华旭明尚璟铭谢淋丁超仁李嘉辉
申请(专利权)人:上海创帧软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1