The invention belongs to the field of human-computer dialogue technology, and specifically involves an extension method of control dialogue management for the fusion of rules information. It aims to solve the problem of high cost and low efficiency when the data driven dialogue system is extended by reconstructing the interactive environment. The method includes: S1, based on interactive data, determination of the problem. The new user intention needs to be expanded, and the original language understanding module is extended; S2, based on the new user intention, constructs the new dialogue rules for the new user's intention; S3, based on the interactive data, the dialogue strategy of the original dialogue management module and the new dialogue rules, the constraints needed to be met in the new dialogue management module mapping space S4, based on the new dialog management module in S3, it maps the space required to satisfy the constraints, expands the original dialogue management module and generates a new dialogue management module. The invention can rapidly expand and efficiently iterate the data driven dialogue system according to user feedback.
【技术实现步骤摘要】
融合规则信息的可控制性对话管理扩展方法
本专利技术属于人机对话
,具体涉及一种融合规则信息的可控制性对话管理扩展方法。
技术介绍
任务型对话系统是在某一特定领域(餐馆,酒店或机票领域),通过自然语言交互的形式,辅助用户完成任务的人机交互系统。一般而言,任务型对话系统需要具有如下四个基本功能:语言理解、对话状态跟踪、对话策略和对话生成。其中,对话状态跟踪和对话策略模块一起被称为对话管理模块,是整个系统的核心部分。由于任务型对话系统能够以更加友好的方式帮助消费者达成目标。因此,人们投入了大量的精力去研究如何设计用户体验更好的对话系统。在目前商用的系统中,对话管理模块普遍采用基于规则的方式实现。开发者需手工编撰对话管理策略,定义出在不同对话上下文下,系统应该执行哪一个动作。这种方法虽然简单直观易于控制,但需要大量的人力和专业知识。最近几年,人们发现通过强化学习的方法可以利用用户提供的反馈信号自动地构建鲁棒的对话管理模块。这种方法避免了设计大量的规则。因此,这种基于数据驱动的设计模式受到了工业界的广泛关注。然而在设计商用系统时,开发者可以定义出所有合理的系统行为用于完成某一特定任务。系统能够处理的用户意图则需要在系统上线后,根据用户的需求不断地进行扩展。所以在商业开发中,为了使系统对之前没有考虑到的用户意图做出合理的反应,开发者需要对整个系统进行迭代式地扩展。虽然基于强化学习的方法在构建任务型对话系统上具有极大的优势,但由于数据驱动的对话管理模块是一个黑盒子,如果要对原有的对话管理模块进行扩展只能重新设计交互环境进行再训练。而交互环境的构建十分昂贵。因此,如 ...
【技术保护点】
1.一种融合规则信息的可控制性对话管理扩展方法,其特征在于,包括以下步骤:步骤S1,基于交互数据D,确定需要扩充的新用户意图,并对原语言理解模块进行扩展;步骤S2,基于步骤S1所选择的新用户意图,构建该新用户意图对应的新对话规则;步骤S3,基于步骤S1的交互数据、原对话管理模块的对话策略、步骤S2中得到的新对话规则,构建新对话管理模块映射空间所需满足的约束L;步骤S4,基于步骤S3中得到的新对话管理模块映射空间所需满足的约束L,对原对话管理模块进行扩展,生成新对话管理模块。
【技术特征摘要】
1.一种融合规则信息的可控制性对话管理扩展方法,其特征在于,包括以下步骤:步骤S1,基于交互数据D,确定需要扩充的新用户意图,并对原语言理解模块进行扩展;步骤S2,基于步骤S1所选择的新用户意图,构建该新用户意图对应的新对话规则;步骤S3,基于步骤S1的交互数据、原对话管理模块的对话策略、步骤S2中得到的新对话规则,构建新对话管理模块映射空间所需满足的约束L;步骤S4,基于步骤S3中得到的新对话管理模块映射空间所需满足的约束L,对原对话管理模块进行扩展,生成新对话管理模块。2.根据权利要求1所述的融合规则信息的可控制性对话管理扩展方法,其特征在于,所述“新对话管理模块映射空间所需满足的约束L”,具体为:L=λ1LD+λ2LD,θ+λ3LD,R其中,LD为新对话管理模块的行为与原对话管理模块的行为一致性约束;LD,θ为新对话管理模块的行为策略与原对话管理模块的行为策略一致性约束;LD,R为新对话管理模块的行为策略与定义的新对话规则符合性约束;λ1、λ2、λ3为预设的权值参数。3.根据权利要求2所述的融合规则信息的可控制性对话管理扩展方法,其特征在于,其中,θnew为新对话管理模块的模型参数;θ为原对话管理模块的模型参数;d为交互数据D中的对话样本;t为对话样本d的轮数;|As|为系统行为的个数对话规则中行为的个数;ht为第t轮对话的对话上下文;ak为新对话管理模块在当前对话上下文ht下的行为;at为原始系统在当前对话历史ht下的行为,π(·)为原对话管理模块;L是用于处理新用户意图而定义的对话规则的个数;hl为第l条规则中声明的对话上下文条件;al为...
【专利技术属性】
技术研发人员:王唯康,张家俊,李志飞,宗成庆,
申请(专利权)人:中国科学院自动化研究所,出门问问信息科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。