一种对话数据生成方法、系统、对话模拟器及存储介质技术方案

技术编号:41074037 阅读:17 留言:0更新日期:2024-04-24 11:31
本申请公开了一种对话数据生成方法、系统、对话模拟器及存储介质,属于人工智能技术领域,用以解决现有生成的对话数据质量差的问题。方法包括根据种子对话,确定种子对话中对话状态节点的有向状态图以及话术模拟的训练数据;根据有向状态图,确定对话状态流程;根据对话状态流程以及基于种子对话构建的训练数据所训练的模型,生成对话数据。本方法基于种子对话确定的对话状态流程符合真实场景的分布,话术风格与种子对话一致,保证最终生成的对话数据为高质量、符合真实对话场景的数据,从而使得基于高质量的对话数据训练得到的任务式对话系统,在接收到用户会话后,能够真实准确地决定对话策略。

【技术实现步骤摘要】

本申请属于人工智能,具体涉及一种对话数据生成方法、系统、对话模拟器及存储介质


技术介绍

1、在自然语言处理领域,对话系统的研究和开发日益受到重视。对话系统可以用于各种应用,例如虚拟助手、客户服务机器人、智能问答系统等。

2、传统流水线式(pipeline)的任务式对话系统一般接收到用户的会话后,对话理解模块(nlu)会识别用户的意图以及词槽等信息,然后对话管理模块(dm)会根据对话历史以及当前对话信息决定对话策略,例如,词槽填充、词槽澄清、api选择、api调用等过程,最终对话生成模块(nlg)会综合系统前面流程的信息生成系统回复。其中,对话理解、对话管理、以及对话生成模块通常由结合模型以及启发式规则的策略构成。

3、上述任务式对话系统的构建和训练通常需要大量高质量的标注数据,例如,需要不同类别的意图表达,词槽识别、以及多样性丰富的对话数据才能使得模型学习到真实的对话能力。

4、然而,目前对话数据生成方法中的对话状态大多采用启发式规则完成,会随机生成大量的对话数据,但随机生成的对话数据往往不符合真实对话分布,即生成的对本文档来自技高网...

【技术保护点】

1.一种对话数据生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据种子对话,确定种子对话中对话状态节点的有向状态图包括:

3.根据权利要求1所述的方法,其特征在于,根据所述有向状态图,确定对话状态流程包括:

4.根据权利要求3所述的方法,其特征在于,所述有向状态图还包括相连对话状态节点之间连接的权重,

5.根据权利要求4所述的方法,其特征在于,根据所述有向状态图,确定对话状态流程包括:

6.根据权利要求1所述的方法,其特征在于,所述对话状态流程的生成包括:

7.一种对话数据生成系统,其特...

【技术特征摘要】

1.一种对话数据生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据种子对话,确定种子对话中对话状态节点的有向状态图包括:

3.根据权利要求1所述的方法,其特征在于,根据所述有向状态图,确定对话状态流程包括:

4.根据权利要求3所述的方法,其特征在于,所述有向状态图还包括相连对话状态节点之间连接的权重,

5.根据权利要求4所述的方法,其特征在于,根据所述...

【专利技术属性】
技术研发人员:刘军文韩振宇胡丕栋俞佳
申请(专利权)人:西湖心辰杭州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1