【技术实现步骤摘要】
基于多轮交互的语料生成方法和装置
本专利技术涉及自然语言处理
,尤其涉及一种基于多轮交互的语料生成方法和装置。
技术介绍
随着计算机技术的发展,自然语言处理(NaturalLanguageProcessing,NLP)的人机交互中产生一种重要的交互方式-多轮对话,多轮对话中通常有两个或多个代理(Agent),通过自然语言的方式交替进行多轮交互,从而使得对话持续。多轮对话例如,在电商平台的用户和客服之间,通过语音、文字等方式进行多轮的沟通和交流,以达到解决某种问题的目的。在多轮交互建模的过程中,需要让参与者扮演对话中一方的角色,和交互系统进行对话,即,基于大量的语料生成对话数据训练模型,使得交互系统能够基于该对话数据训练模型为后台服务器生成准确的自动回复。相关技术中,让参与者扮演对话中一方的角色,和交互系统进行对话,在开始对话前可以分配至参与者一些说明,引导参与者开始并展开对话。这种方式下,语料生成的人力成本较高,效果不佳。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种基于多轮交互的语料生成方法, ...
【技术保护点】
一种基于多轮交互的语料生成方法,其特征在于,包括:依据马尔可夫链中节点之间的状态转移概率确定当前节点;执行绑定在所述当前节点上的动作事件,并执行与所述动作事件对应的消息模板事件;依据所述状态转移概率,执行所述马尔可夫链中的部分节点上的动作事件及对应的消息模板事件,以生成所述多轮交互的语料。
【技术特征摘要】
1.一种基于多轮交互的语料生成方法,其特征在于,包括:依据马尔可夫链中节点之间的状态转移概率确定当前节点;执行绑定在所述当前节点上的动作事件,并执行与所述动作事件对应的消息模板事件;依据所述状态转移概率,执行所述马尔可夫链中的部分节点上的动作事件及对应的消息模板事件,以生成所述多轮交互的语料。2.如权利要求1所述的基于多轮交互的语料生成方法,其特征在于,所述动作事件包括:用于生成用户侧语料的用户动作事件和用于生成系统侧语料的系统动作事件,所述执行预先绑定在所述当前节点上的动作事件,并执行与所述动作事件对应的消息模板事件,包括:从所述用户动作事件对应的多个消息模板事件中,随机确定第一目标消息模板事件;在所述用户动作事件携带有第一参数时,从所述第一目标消息模板事件所携带的多个参数取值中,随机确定所述第一参数的取值;基于所述第一参数的取值执行所述第一目标消息模板事件;从所述系统动作事件对应的多个消息模板事件中,随机确定第二目标消息模板事件;在所述系统动作事件携带有第二参数时,将所述第一参数的取值作为所述第二参数的取值;基于所述第二参数的取值执行所述第二目标消息模板事件。3.如权利要求2所述的基于多轮交互的语料生成方法,其特征在于,还包括:在所述用户动作事件未携带所述第一参数时,直接执行所述第一目标消息模板事件;或者,在所述系统动作事件未携带所述第二参数时,直接执行所述第二目标消息模板事件。4.如权利要求1-3任一项所述的基于多轮交互的语料生成方法,其特征在于,在所述依据马尔可夫链中节点之间的状态转移概率确定当前节点之前,还包括:根据外部指令对所述马尔可夫链中节点之间的状态转移概率进行配置;基于所述多轮交互的属性特征,确定所述多轮交互中可能的动作事件及对应的消息模板事件;将所述可能的动作事件绑定至所述马尔可夫链中的节点上。5.如权利要求2所述的基于多轮交互的语料生成方法,其特征在于,所述用户动作事件/所述系统动作事件包括:用于发送文本消息的第一类动作事件,以及用于调用应用程序API接口再发送所述文本消息的第二类动作事件。6.一种基于多轮交互的语料生成装置,其特征在于,包括:第一确定模块,用于依据马尔可夫...
【专利技术属性】
技术研发人员:胡一川,刘振国,曾旻,张海雷,汪冠春,
申请(专利权)人:上海奔影网络科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。