基于动态窗口自注意力机制提取语义特征的槽填充方法技术

技术编号：21432198 阅读：33 留言：0更新日期：2019-06-22 11:55

本发明专利技术公开了一种基于动态窗口自注意力机制提取语义特征的槽填充方法，用于口语对话系统中提取用户话语的语义槽，步骤如下：将文本数据中的句子切分为词；将切分句子得到的词用词嵌入向量表示；选定一个窗口大小，对每个词计算该词需选择当前窗口内的具体信息，进一步得到当前词的上下文特征；对每个词，用该词的上下文特征和词向量，根据自注意力机制计算当前词的融合特征；对于每个词，将当前词的融合特征和当前词向量输入双向循环神经网络中进行分类，输出结果。本发明专利技术提出的动态窗口的方法先计算出上下文特征中哪些是不需要的，筛选掉不需要的特征，然后再通过自注意力机制提取剩余更有价值的特征之间的关系，得到最终的输入特征表示。

全部详细技术资料下载

【技术实现步骤摘要】
基于动态窗口自注意力机制提取语义特征的槽填充方法
本专利技术涉及口语对话系统中的自然语言理解
，具体涉及一种基于动态窗口自注意力机制提取语义特征的槽填充方法。
技术介绍
槽填充是口语对话系统中自然语言理解模块的重要组成部分，旨在提取用户话语中一些比较重要的“语义槽”信息。槽填充性能的好坏，不仅对影响着自然语言理解的准确与否，也影响着整个对话系统中的后续模块的性能。提升槽填充的性能，可以让系统提取到用户话语中更准确的信息，让系统更好的和用户交互，提升用户的服务体验。在如今越来越多口语系统的不断发展下，槽填充也有着重要的实践和应用价值。在槽填充的输入的特征提取方面，国内外目前的方法都是将词向量特征或者字符向量特征输入到模型进行分类(具体参见：BingLiuandIanLane.“Attention-BasedRecurrentNeuralNetworkModelsforJointIntentDetectionandSlotFilling”,InProceedingsofINTERSPEECH.pp.685-689,2016.)，没有进一步提取更好的输入特征。词向量或者字符向量可以在一定程度上表示文本的语义信息，但是直接输入模型并不能提取到很好的特征表示。一些人使用卷积神经网络(CNN)提取输入的上下文特征(具体参见：HeikeAdel,BenjaminRothandHinrichSchütze:“ComparingConvolutionalNeuralNetworkstoTraditionalModelsforSlotFilling”,InProceed...

【技术保护点】
1.一种基于动态窗口自注意力机制提取语义特征的槽填充方法，其特征在于，所述的槽填充方法包括下列步骤：S1、将文本数据中的每个句子切分为词；S2、将切分句子得到的词w＝(w1,w2,…wT)用词嵌入向量

【技术特征摘要】
1.一种基于动态窗口自注意力机制提取语义特征的槽填充方法，其特征在于，所述的槽填充方法包括下列步骤：S1、将文本数据中的每个句子切分为词；S2、将切分句子得到的词w＝(w1,w2,…wT)用词嵌入向量表示，其中T为词的个数，S3、选定一个窗口大小L，对于每个词，利用当前词的词嵌入向量计算该词需要选择当前窗口内的信息，得到当前词的上下文特征表示其中t为当前词的下标；S4、对于每一个词，利用该词的上下文特征表示和词向量根据自注意力机制计算当前词的融合特征表示S5、对于每一个词，将当前词的融合特征表示和词向量输入到双向循环神经网络中进行分类，输出结果。2.根据权利要求1所述的基于动态窗口自注意力机制提取语义特征的槽填充方法，其特征在于，所述的步骤S3包括：S31、将当前词的词嵌入向量和窗口内词的词嵌入向量输入到下式中，产生动态窗口概率分布分布每个元素其中，函数matmul(·)代表矩阵乘法，S32、在训练和测试时分别利用计算得到变量1≤t≤L-1，maskt的值为1时表示选中第t个词，maskt的值为0时表示没有选中第t个词；S33、利用得到经过筛选后的窗口内的词表示也即是当前词的上下文特征表示。其中，⊙为对应元素相乘二元运算符。3.根据权利要求2所述的基于动态窗口自注意力机制提取语义特征的槽填充方法，其特征在于，所述的步骤S32中，在训练时实施过程如下：从分布Gumbel(0,1)＝-log(-log(Uniform(0,1)))中产生随机变量定义每个为g的第t维的切片向量,其...

【专利技术属性】
技术研发人员：马千里，闫江月，田帅，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人