一种基于多模态词向量的生成式对话系统编码方法及编码器技术方案

技术编号：22817272 阅读：19 留言：0更新日期：2019-12-14 13:12

本发明专利技术公开了一种基于多模态词向量的生成式对话系统编码方法及编码器。本方法为：1)根据当前语料与单词的上下文语境训练多模态词向量，其中每个单词生成多个词向量；2)使用双向LSTM神经网络与词向量对问句进行编码，然后将每个单词对应的前向神经网络的隐层状态与后向神经网络的隐层状态进行拼接作为该单词的上下文表示；3)将该单词的上下文表示与该单词的每一词向量分别计算相关度得分，取得分最高的词向量作为该单词的词向量；4)使用LSTM与该问句的各单词词向量对该问句进行编码，得到该问句的分布表示；5)对该问句的分布进行随机采样得到该问句的编码。本发明专利技术提高了句子编码的精准性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多模态词向量的生成式对话系统编码方法及编码器
本专利技术涉及一种基于多模态词向量的生成式对话系统编码方法及编码器，属于计算机软件

技术介绍
传统编码器已经可以很好对句子语义和语序等信息进行表示。然而该编码所使用的词向量通常是one-hot或word2vec等单一词向量，在这种词向量表示法中，一个单词通常只有一个词向量进行表示。然而在很多时候，一个单词的语义往往因为上下文的不同而有所改变。如“Iwouldliketobuyappleratherthanandriod”,在这句话里apple的意思是苹果手机，“Appleandpearareallmyfavoritefruits.”这里的苹果则是水果的意思。而这种基于单一词向量的编码方式对这种一词多义的情况很难做出区分，从而影响编码的精度，进而影响回复的生成质量。在实际情况中，一个问题通常会对应多种回复。然而因为传统的编码器总是将句子编码为一个固定长度的向量，因此解空间中通常只有一种回复被生成作为问题的答案。并且由于天然语料中通用性回复出现的频率较高，导致了解空间中被选中的解往往是通用性回复。传统的编码方法不能根据单词的上下文语义进行改变。
技术实现思路
本专利技术旨在提出一种基于多模态词向量的生成式对话系统编码方法及编码器，本专利技术提高了句子编码的精准性，从而为编码端生成高质量的回复打下良好的基础。本专利技术的技术关键点在于：1)提出一种基于词级别注意力机制的单词向量生成方法，使得单词的词向量与单词...

【技术保护点】
1.一种基于多模态词向量的生成式对话系统编码方法，其步骤包括：/n1)根据当前语料与单词的上下文语境训练多模态词向量，其中每个单词生成多个词向量，每个词向量分别对应单词不同方面的意思；/n2)使用双向LSTM神经网络与步骤1)得到的词向量对问句进行编码，然后将每个单词对应的前向神经网络的隐层状态与后向神经网络的隐层状态进行拼接作为该单词的上下文表示；/n3)将该单词的上下文表示与该单词的每一词向量分别计算相关度得分，取得分最高的词向量作为该单词的词向量；/n4)使用LSTM与该问句的各单词词向量对该问句进行编码，得到该问句的分布表示；/n5)对步骤4)得到的该问句的分布进行随机采样得到该问句的编码。/n

【技术特征摘要】
1.一种基于多模态词向量的生成式对话系统编码方法，其步骤包括：
1)根据当前语料与单词的上下文语境训练多模态词向量，其中每个单词生成多个词向量，每个词向量分别对应单词不同方面的意思；
2)使用双向LSTM神经网络与步骤1)得到的词向量对问句进行编码，然后将每个单词对应的前向神经网络的隐层状态与后向神经网络的隐层状态进行拼接作为该单词的上下文表示；
3)将该单词的上下文表示与该单词的每一词向量分别计算相关度得分，取得分最高的词向量作为该单词的词向量；
4)使用LSTM与该问句的各单词词向量对该问句进行编码，得到该问句的分布表示；
5)对步骤4)得到的该问句的分布进行随机采样得到该问句的编码。

2.如权利要求1所述的方法，其特征在于，使用multimodal词向量模型对当前语料进行训练多模态词向量，构建词向量矩阵；其中，语料中每一单词训练得到k个词向量。

3.如权利要求1或2所述的方法，其特征在于，步骤4)中，将问句编码为其对应解空间的均值与方差，得到问句的一组正态分布形式；然后步骤5)中，对该问句的正态分布形式进行随机采样得到问句的编码。

4.如权利要求1所述的方法，其特征在于，步骤2)中，首先使用双向LSTM对问句进行编码，然后将前向和后向神经网络的每一步进行拼接得到问句中每个单词的下文表示，然后利用注意力机制对每个单词的上下文表示进行挑选，得到与单词的上下文相关的词向量。

5.如权利要求4所述的方法，其特征在于，利用注意力机制对每个单词的上下文表示进行挑选的方法为：
21)计算每一个单词的上下文表示；
22)使用全连接神经网络计算单词的上下文表示与对应单词每个词向量的相关度...

【专利技术属性】
技术研发人员：林政，付鹏，刘欢，王伟平，
申请(专利权)人：中国科学院信息工程研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人