一种面向任务型对话系统的对话策略方法技术方案

技术编号:24168986 阅读:55 留言:0更新日期:2020-05-16 02:20
本发明专利技术公开了一种面向任务型对话系统的对话策略方法,应用在基于知识图谱的音乐智能搜索场景中,包括以下步骤:S1、针对特定领域构建马尔科夫决策模型;S2、利用贝尔曼方程计算状态值函数矩阵;S3、结合当前时刻的对话状态,匹配知识图谱和搜索知识库,得到满足用户目标的音乐结果;S4、对搜索结果进行属性信息熵计算;S5、对计算出来的属性信息熵进行分析;S6、通过状态转移矩阵计算出下一轮动作。本发明专利技术克服任务型对话系统中完全冷启动的困难,通过构建强化学习模型计算状态值函数矩阵,结合状态值函数矩阵的结果与该状态的属性信息熵,得到下一轮的动作,用更少的对话轮次完成知识搜索任务,具有很好的可用性。

【技术实现步骤摘要】
一种面向任务型对话系统的对话策略方法
本专利技术涉及任务型对话系统的基于知识图谱智能搜索领域,特别涉及一种面向任务型对话系统的对话策略方法。
技术介绍
随着人工智能相关技术的飞速发展,人与智能设备之间的交互方式趋于智能化,逐渐从传统的图形化交互(GraphicalUserInterface,GUI)向人机对话交互(ConversationalUserInterface)进行转变,即利用人工智能助理来帮助用户完成多项任务或多项服务。人机对话系统可以从功能上划分为非任务型(non-task-oriented)和任务型(task-oriented)的对话系统两大类。任务型对话系统又称为目标驱动型(goaldriven)对话系统,例如客服机器人、机票预订系统等,它们为用户提供特定领域的服务,旨在帮助用户完成购物、订机票等任务。这类人机对话系统能够大大降低人力成本,简化人机交互过程,提高应用的智能程度,因此具有广泛的研究和应用价值。在任务型对话系统中,用户与系统进行多轮对话,从而完成特定的任务。在多轮对话的基于知识图谱的智能搜索领域,系统需要通过本文档来自技高网...

【技术保护点】
1.一种面向任务型对话系统的对话策略方法,其特征在于,包括以下步骤:/nS1、针对垂直领域中的基于知识图谱的搜索型对话系统,构建马尔科夫决策模型;/nS2、根据步骤S1,利用贝尔曼方程获取状态值函数矩阵;/nS3、结合当前时刻的对话状态,匹配知识图谱和搜索知识库,得到满足用户目标的结果;/nS4、对搜索结果进行属性信息熵计算;/nS5、对计算出来的属性信息熵进行分析;/nS6、通过状态转移矩阵得出下一轮系统的动作。/n

【技术特征摘要】
1.一种面向任务型对话系统的对话策略方法,其特征在于,包括以下步骤:
S1、针对垂直领域中的基于知识图谱的搜索型对话系统,构建马尔科夫决策模型;
S2、根据步骤S1,利用贝尔曼方程获取状态值函数矩阵;
S3、结合当前时刻的对话状态,匹配知识图谱和搜索知识库,得到满足用户目标的结果;
S4、对搜索结果进行属性信息熵计算;
S5、对计算出来的属性信息熵进行分析;
S6、通过状态转移矩阵得出下一轮系统的动作。


2.根据权利要求1所述的一种面向任务型对话系统的对话策略方法,其特征在于,所述步骤S1具体包括以下步骤:
S11、根据对话中槽的个数,定义该领域下的五元组(s,a,p,r,γ),其中s是含终止状态的所有状态、a是所有动作、p是状态转移概率、r是奖励函数、γ是0~1区间的折扣因子;
S12、自定义例子,在数据库进行搜索,根据数据库搜索结果定义对话的终止状态。


3.根据权利要求1所述的一种面向任务型对话系统的对话策略方法,其特征在于,所述步骤S2具体是在马尔科夫决策过程中,状态s的状态值函数为其回报的期望,即v(s)=E[Gt|St=s],其中Gt为t时刻在状态s时的回报,St为t时刻采取的动作,根据状态值函数的贝尔曼方程迭代计算状态值函数矩阵v(s),其中,π(a|s)表示策略在给定状态下行为的概率分布、表示在状态为s时执行动作a所得到的的即时回报、γ为折扣因子、表示在当前时刻状态为s时,采取动作a,下一时刻状态转为s′的概率,vπ(s′)为下一状态s′的状态值函数,A表示所有动作a的集合。


4.根据权利要求1所述的一种面向任务型对话系统的对话策略方法,其特征在于,所述步骤S3具体包括以下步骤:
S31、接受来自对话系统中的自然语言理解模块的输出的三元组,即领域识别、意图识别、槽-值对,获得单...

【专利技术属性】
技术研发人员:赵阳洋王振宇王佩
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1