System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能,尤其涉及一种对话数据生成方法、模型训练方法及相关装置。
技术介绍
1、对话数据生成是人工智能在人机交互场景下的一种常见任务。对于人机交互模型或人机交互机器人来说,其需要非常大量的对话数据进行对话训练,才能具备完善的对话能力,从而应对各种可能的对话场景。因此对于人机交互模型或人机交互机器人来说,大量的对话数据必不可少的。
2、而随着人们对人机交互模型或人机交互机器人性能的不断追求,从真实生活场景获取的对话数据量已经不能满足训练需求,而且在一些非公开领域,比如在心理咨询领域,对话数据具有一定的保密性,通常无法获取。因此,急需一种能够更快、更多地获取对话数据的技术方案。
技术实现思路
1、有鉴于此,本申请实施例致力于提供一种对话数据生成方法、模型训练方法及相关装置,能够实现对话数据自动生成,不仅提高了对话数据生成效率,满足对对话数据的数据量需求,还可以保证生成的对话数据的质量,且能够适应多领域、多场景的对话数据生成,灵活性高。
2、根据本申请实施例的第一方面,提供了一种对话数据生成方法,包括:
3、获取对话属性信息,所述对话属性信息至少包括对话角色、对话场景、对话流程阶段和对话目标,所述对话流程阶段包括实现所述对话目标所需经历的各个对话阶段;
4、根据所述对话属性信息,生成任务指令,所述任务指令用于指示接收该任务指令的对象生成符合所述对话属性信息的对话数据;
5、将所述任务指令输入预训练的大语言模型,以使所述
6、可选的,所述对话属性信息还包括各个对话流程阶段应用的沟通技巧,所述沟通技巧包括开放式提问、封闭式提问、情感反应、倾听、共情、指导中的至少一项。
7、可选的,所述对话属性信息还包括对话要求信息,所述对话要求信息包括对话语气要求、对话态度要求、隐私保护要求、对话长度要求中的至少一项。
8、可选的,所述根据所述对话属性信息,生成任务指令,包括:
9、根据所述对话属性信息,确定对话数据生成任务,所述对话数据生成任务包括生成符合所述对话属性信息的对话文本的任务;
10、至少根据所述对话数据生成任务,生成至少包含所述对话数据生成任务的任务指令。
11、可选的,在根据所述对话属性信息,生成任务指令的过程中,还包括:
12、根据所述对话属性信息,确定标签输出任务,所述标签输出任务包括按照设定格式在对话数据的设定位置输出设定标签的信息的任务,所述设定标签包括对话流程阶段标签、沟通技巧标签、沟通话题标签、用户画像标签中的至少一项;
13、至少根据所述对话数据生成任务,生成至少包含所述对话数据生成任务的任务指令,包括:
14、根据所述对话数据生成任务和所述标签输出任务,生成包含所述对话数据生成任务和所述标签输出任务的任务指令。
15、可选的,所述对话场景包括心理咨询对话场景;
16、所述对话流程阶段,包括进入与定向阶段、问题和个人探索阶段、目标与方案探讨阶段、行动转变阶段、评估与结束阶段。
17、可选的,所述根据所述对话属性信息,生成任务指令,包括:
18、根据所述对话属性信息,确定对话数据生成任务和标签输出任务;
19、其中,所述对话数据生成任务包括生成符合所述对话属性信息的对话文本的任务;所述标签输出任务包括第一标签输出任务和第二标签输出任务中的至少一项,所述第一标签输出任务用于在每一对话流程阶段的起始位置输出对话流程阶段标签,所述第二标签输出任务用于按照设定格式在对话数据的设定位置输出设定标签,所述设定标签包括沟通技巧标签、沟通话题标签、用户画像标签中的至少一项;
20、至少根据所述对话数据生成任务和所述标签输出任务,生成至少包含所述对话数据生成任务和所述标签输出任务的任务指令。
21、可选的,所述对话角色包括用户角色和心理咨询师角色;
22、在所述标签输出任务包括所述第二标签输出任务的情况下,所述第二标签输出任务用于按照设定格式、在输出所述心理咨询师的对话文本之前,输出设定标签。
23、可选的,所述至少根据所述对话数据生成任务和所述标签输出任务,生成至少包含所述对话数据生成任务和所述标签输出任务的任务指令,包括:
24、生成与所述对话数据生成任务和所述标签输出任务中的至少一项对应的任务执行示例;
25、生成包括所述对话数据生成任务、所述标签输出任务以及所述任务执行示例的任务指令。
26、根据本申请实施例的第二方面,提供了一种模型训练方法,包括;
27、获取对话数据,并利用所述对话数据构建对话训练样本数据,其中,所述对话数据通过如本申请实施例的第一方面中任意一项所述的对话数据生成方法而生成;
28、利用所述对话训练样本数据,对预先构建的对话模型进行对话训练;所述对话模型用于根据用户对话内容,生成用于响应所述用户对话内容的对话数据。
29、根据本申请实施例的第三方面,提供了一种对话数据生成方法,包括:
30、获取用户对话内容;
31、将所述用户对话内容输入预先训练的对话模型,得到与所述用户对话内容对应的对话数据;
32、其中,所述对话模型基于对话训练样本数据进行对话训练得到,所述对话训练样本数据通过如本申请实施例的第一方面中任意一项所述的对话数据生成方法生成的对话数据而构建得到。
33、根据本申请实施例的第四方面,提供了一种对话数据生成装置,包括:
34、信息获取单元,用于获取对话属性信息,所述对话属性信息至少包括对话角色、对话场景、对话流程阶段和对话目标,所述对话流程阶段包括实现所述对话目标所经历的各个对话阶段;
35、指令生成单元,用于根据所述对话属性信息,生成任务指令,所述任务指令用于指示接收该任务指令的对象生成符合所述对话属性信息的对话数据;
36、数据生成单元,用于将所述任务指令输入预训练的大语言模型,以使所述大语言模型按照所述任务指令生成对话数据。
37、根据本申请实施例的第五方面,提供了一种电子设备,包括存储器和处理器;
38、所述存储器与所述处理器连接,用于存储程序;
39、所述处理器用于通过运行所述存储器中的程序,实现如本申请实施例的第一方面、第二方面、第三方面中任意一项所述的方法。
40、根据本申请实施例的第六方面,提供了所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时,实现如本申请实施例的第一方面、第二方面、第三方面中任意一项所述的方法。
41、本申请提出的对话数据生成方法能够基于需要的对话数据的对话属性信息,生成用于指示生成符合该对话属性信息的对话数据的任务指令,然后将该任务指令输入预训练的大语言模型,借助预训练大语言模型的自然语言处理能力来自动本文档来自技高网...
【技术保护点】
1.一种对话数据生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述对话属性信息还包括各个对话流程阶段应用的沟通技巧,所述沟通技巧包括开放式提问、封闭式提问、情感反应、倾听、共情、指导中的至少一项。
3.根据权利要求1所述的方法,其特征在于,所述对话属性信息还包括对话要求信息,所述对话要求信息包括对话语气要求、对话态度要求、隐私保护要求、对话长度要求中的至少一项。
4.根据权利要求1至3中任意一项所述的方法,其特征在于,所述根据所述对话属性信息,生成任务指令,包括:
5.根据权利要求4所述的方法,其特征在于,在根据所述对话属性信息,生成任务指令的过程中,还包括:
6.根据权利要求1至3中任意一项所述的方法,其特征在于,所述对话场景包括心理咨询对话场景;
7.根据权利要求6所述的方法,其特征在于,所述根据所述对话属性信息,生成任务指令,包括:
8.根据权利要求7所述的方法,其特征在于,所述对话角色包括用户角色和心理咨询师角色;
9.根据权利要求7所述的方法,其特征
10.一种模型训练方法,其特征在于,包括;
11.一种对话数据生成方法,其特征在于,包括:
12.一种对话数据生成装置,其特征在于,包括:
13.一种电子设备,其特征在于,包括存储器和处理器;
14.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时,实现如权利要求1至11中任意一项所述的方法。
...【技术特征摘要】
1.一种对话数据生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述对话属性信息还包括各个对话流程阶段应用的沟通技巧,所述沟通技巧包括开放式提问、封闭式提问、情感反应、倾听、共情、指导中的至少一项。
3.根据权利要求1所述的方法,其特征在于,所述对话属性信息还包括对话要求信息,所述对话要求信息包括对话语气要求、对话态度要求、隐私保护要求、对话长度要求中的至少一项。
4.根据权利要求1至3中任意一项所述的方法,其特征在于,所述根据所述对话属性信息,生成任务指令,包括:
5.根据权利要求4所述的方法,其特征在于,在根据所述对话属性信息,生成任务指令的过程中,还包括:
6.根据权利要求1至3中任意一项所述的方法,其特征在于,所述对话场景包括心理咨询对话场景;
...
【专利技术属性】
技术研发人员:丁亮,沙晶,盛志超,王士进,刘聪,胡国平,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。