一种基于记忆网络的多轮对话下的意图识别方法技术

技术编号：19479930 阅读：669 留言：0更新日期：2018-11-17 10:31

本发明专利技术公开了一种基于记忆网络的多轮对话下的意图识别方法，主要采用循环神经网络，记忆网络和注意力机制结合的神经网络模型。本发明专利技术首先将语言数学化处理，然后利用循环神经网络对每轮的对话进行编码，得到对话的编码向量，再利用外部存储器保存历史对话信息，通过注意力机制从记忆中选择与该轮对话意图相关的历史对话信息，从而得到历史信息的编码向量，对于当前的对话编码向量和历史的对话编码向量，利用一个控制门，判断是否在分类器中引入历史信息，得到最终用于分类的编码信息，利用多标签的分类器，得到每轮对话的意图。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于记忆网络的多轮对话下的意图识别方法
本专利技术属于自然语言处理的对话领域，涉及一种记忆网络的神经网络学习方法。
技术介绍
随着人们生活水平不断的提高，人工智能设备的出现其实满足了大众心理的“小刚需”，如人工智能设备之一的智能音响。通过语音控制播放音乐，或者躺在冬天的被窝里关灯等等智能服务，其都在一定程度上大大的便捷了人们的生活。2017年国内智能音箱市场的爆发式增长惊人，2017年的销售数据足以表明智能音箱在国内的受欢迎程度。这一年是智能音箱市场增长最快的一年，不少品牌通过自身的软件或者硬件优势快速赢得市场。当然成功的背后，这个市场并非看起来那么顺利，还有很多技术还未成熟。单轮对话下的任务处理还存在诸多的瓶颈，而多轮对话下的服务和需要克服的问题还没有引起广大研究人员的重视。对话系统最早被提出是在1950年，艾伦·图灵(AlanTuring)提出了一种方法来测试一台机器的智能水平，这个机器被普遍称为图灵测试或模仿游戏。在图灵测试中，一台机器被要求与人交谈。机器的智能水平取决于机器如何能够欺骗人类评估者，使其相信机器是基于文本响应的人类。目前主要有以下三种对话系统：1)闲聊系统2)基于框架的目标导向系统3)交互式问答系统(QA)。由于人类交流时，酝酿语言的过程较短，句法结构比较简单，多用短句和省略形式等习惯，对话的内容很难单轮对话中交代清楚。这就导致上述的三大对话系统都必须满足多轮对话的刚性需要。记忆网络是一类神经网络模型，可以通过操作内存中的内容(存储、取回、过滤和重用)来进行自然语言推理。记忆网络已被成功地应用于很多自然语言任务中了，例如问答系统，...

【技术保护点】
1.一种基于记忆网络的多轮对话下的意图识别方法，其特征在于，该方法包括以下步骤：A、利用公开文本数据库提供的接口获取用于训练词向量模型的语料库，对所述语料库经过文本预处理后，训练词向量模型，得到文本数据中词语对应的词向量集合V，每个词向量表示为Vi，所述词向量模型采用共现矩阵和GloVe模型学习词向量，具体过程如下：1)基于语料库构建词的共现矩阵X，：使用窗口将整个语料库遍历一遍，将整个语料库中，单词i和单词j共同出现在一个窗口中的次数作为共现矩阵X的元素Xij，即可得到共现矩阵X；2)根据下式构建训练词向量模型的目标函数：

【技术特征摘要】
1.一种基于记忆网络的多轮对话下的意图识别方法，其特征在于，该方法包括以下步骤：A、利用公开文本数据库提供的接口获取用于训练词向量模型的语料库，对所述语料库经过文本预处理后，训练词向量模型，得到文本数据中词语对应的词向量集合V，每个词向量表示为Vi，所述词向量模型采用共现矩阵和GloVe模型学习词向量，具体过程如下：1)基于语料库构建词的共现矩阵X，：使用窗口将整个语料库遍历一遍，将整个语料库中，单词i和单词j共同出现在一个窗口中的次数作为共现矩阵X的元素Xij，即可得到共现矩阵X；2)根据下式构建训练词向量模型的目标函数：其中J为目标函数的值，f(x)是权重函数，x表示词频，xmax为自定义的最大词频，f(Xi,j)为元素Xi,j的权重，Vi，Vj分别是单词i和单词j的词向量，bi，bj是单词i和单词j的偏置参数，元素Xij表示为整个语料库中，单词i和单词j共同出现在一个窗口中的次数，N为语料库的词汇表的大小，T为矩阵转置；B、读取文本数据，并将其处理成网络模型能够接受的量化数据，具体步骤如下：1)读入对话文本数据，给每个词编号，建立包含编号-词语映射的词典D，编号从1开始；2)根据训练好的词向量模型，对应词典D，找到每个编号下对应的词语在词向量模型中的词向量vi，建立词向量矩阵P，词向量矩阵P的每一行P[i]存储词向量vi,词向量矩阵P的第一行P[0]存储一个元素全为零的词向量；3)按照词序生成每轮对话文本ui的编号向量bi，编号向量bi的元素为词语的编号，编号向量bi采用固定长度L，不足长度的位置补零；4)根据编号向量bi构建编号矩阵B，编号矩阵B的每一行B[i]采用One-hotRepresentation表示向量，这个向量的维度是词典D的大小，其中只有一个维度的值为1，其他元素为0，这个值为1的维度就是编号向量bi的对应编号；5)生成输入矩阵I，即网络模型能够接受的量化数据如下：I＝B*P；C、将每轮对话的文本内容利用长短时记忆网络LSTM编码成对应的编码向量，遍历对话集合，每轮对话ui都作为一个输入，生成每轮对话ui的对应编码向量si；si＝LSTM(ui)D、构建每个对话的编码向量si的历史记忆信息矩阵Mi。，具体过程如下：1)原始对话文本数据中包含多个对话片段{T1,T2,T3,…,Ta}，对于每一个对话片段Ti中包含多轮对话[u0,…,ub]，其中a表示文本数据中的对话片段个数，b表示每个对话片段中对话信息的轮数；设置一个历史...

【专利技术属性】
技术研发人员：杨成彪，吴刚，
申请(专利权)人：南京柯基数据科技有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人