一种基于深度模型融合的多轮对话建模方法技术

技术编号:24888840 阅读:40 留言:0更新日期:2020-07-14 18:16
本发明专利技术提供了一种基于深度模型融合的多轮对话建模方法,包括一个知识嵌入模型与一个语言嵌入模型,两个模型共同预测下一个对话状态;在预测阶段,当接收到一句用户文本输入时,当前对话状态与n

【技术实现步骤摘要】
一种基于深度模型融合的多轮对话建模方法
本专利技术涉及学习模型
,具体是一种基于深度模型融合的多轮对话建模方法。
技术介绍
近几年来,随着人工智能的飞速发展,世界上出现了许多语音对话机器人,用于手机助手、智能客服、语音导航、智能音箱等场景。这些语音交互系统的核心模块一般包括语音识别、语言理解、对话管理等模块。其中对话管理模型负责追踪整个对话过程状态的变化,控制对话走向,是多轮对话能否正确、顺畅进行的关键所在。对于对话建模,主要有以下几种:(1)基于人工模板的对话系统基于人工模板的技术通过人工设定对话场景,并对每个场景写一些针对性的对话模板,模板描述了用户可能的问题以及对应的答案模板。将聊天限制到特定场景或者特定的话题,并且使用一组模板规则来生成响应。(2)基于检索的对话系统基于检索技术的聊天机器人则使用是类似搜索引擎的方法,事先存储好对话库并建立索引,根据用户问句,在对话库中进行模糊匹配找到最合适的应答内容。(3)基于深度学习的对话生成模型深度学习技术在对话生成中的应用主要是面向开放域聊天机本文档来自技高网...

【技术保护点】
1.一种基于深度模型融合的多轮对话建模方法,其特征在于:包括一个知识嵌入模型与一个语言嵌入模型,两个模型共同预测下一个对话状态;/n在预测阶段,当接收到一句用户文本输入时,当前对话状态与n

【技术特征摘要】
1.一种基于深度模型融合的多轮对话建模方法,其特征在于:包括一个知识嵌入模型与一个语言嵌入模型,两个模型共同预测下一个对话状态;
在预测阶段,当接收到一句用户文本输入时,当前对话状态与nhistory-1个之前的状态被向量化,作为模型输入,模型进行计算并预测出一个action作为系统应答;在训练阶段,则将对话的自然过程组织为对话故事,进一步进行训练。


2.根据权利要求1所述的一种基于深度模型融合的多轮对话建模方法,其特征在于:场景,组织领域知识,基础领域知识被表示为:



其中,I为场景中用户可能的意图;E为场景涉及到的实体;S为对话过程中需要填充的语义槽,用于存储用户在对话中提供的关键信息;A为机器端可执行的动作。


3.根据权利要求1所述的一种基于深度模型融合的多轮对话建模方法,其特征在于:
知识嵌入模型采用类transformer模型,领域知识经过一个featurizer层之后得到特征矩阵,特征矩阵通过编码层得到知识嵌入矩阵,之后进入模型融合层。


4.根据权利要求2所述的知识嵌入模型,其特征在于:对于featurizer层:每个对话故事分为若干个时间步的对话状态,单个时间步对话状态为将对话状态元素的onehot编码连接起来,形成特征向量:
Vstate=Concat(VI,VE,VS,VA)
其中,VI,VE,VS,VA分别为上述领域知识模型中对应I,E,S,A的onehot向量;
对话故事则为将每个时间步的对话状态进行堆叠而得到的特征矩阵:



编码层有n个相同的多头注意力层组成,每个多头注意力层由两个子层组成,分别为多头注意力机制与全连接前馈神经网络组成,并且每...

【专利技术属性】
技术研发人员:周奕周波王天宇张堃李文俊
申请(专利权)人:杭州博拉哲科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1