一种意图识别方法和意图识别装置制造方法及图纸

技术编号：24354700 阅读：20 留言：0更新日期：2020-06-03 02:18

本发明专利技术公开了一种意图识别方法和意图识别装置，方法部分包括：获取待识别句子；通过嵌入层将所述待识别句子转化得到第一向量、第二向量和第三向量；分别对所述第一向量和第二向量进行线性映射，得到第一映射向量和第二映射向量；根据所述第一映射向量获取第一注意力向量，并根据第二映射向量获取第二注意力向量；根据所述第一注意力向量获取第一句子向量，并根据所述第二注意力向量获取第二句子向量；根据所述第一句子向量和所述第二句子向量获取目标句子向量；将所述目标句子向量输入Bert模型的线性层进行意图识别，获取意图识别结果。

A method and device of intention recognition

全部详细技术资料下载

【技术实现步骤摘要】
一种意图识别方法和意图识别装置
本专利技术涉及自然语言处理与神经网络
，尤其涉及一种意图识别方法和意图识别装置。
技术介绍
Transformer模型是谷歌Google公司开发的一种自然语言处理模型(NaturalLanguageProcessing，简称NLP)，是NLP发展的一个重要的创新。Bert模型(BidirectionalEncoderRepresentationsfromTransformers)则基于所述Transformer模型的编码器(encoder)结构，编码器包括多个编码层，一个编码层包括自注意力(self-attention)层、相加&归一化层和全连接前馈神经网络层，而自注意力层由N个ScaledDotProductAttention(SDPA)组件经过堆叠而成，即SDPA为所述Bert模型的组成组件，Bert模型中通过嵌入层对输入句子转化为特征向量后，再通过自注意力机制中的SDPA组件对待识别的句子进行分析并进行最后的意图识别。其中，传统的SDPA组件中，通过如下方式对输入句子进行相关处理得到可以进行意图识别的句子向量：Q＝K＝V＝embedding(sen)；vec＝linear(sum(Attention(Q,K,V),dim＝0))；其中，sen表示输入句子，vec表示最后得到的用于意图识别的句子向量，矩阵Q、矩阵K和矩阵V是输入句子经过嵌入层(embedding)后的向量得到，可见，在传统的SDPA组件中，由于矩阵Q等于矩阵K，矩阵Q与...

【技术保护点】
1.一种意图识别方法，其特征在于，包括：/n获取待识别句子；/n通过嵌入层将所述待识别句子转化得到第一向量、第二向量和第三向量；/n分别对所述第一向量和第二向量进行线性映射，得到第一映射向量和第二映射向量；/n根据所述第一映射向量获取第一注意力向量，并根据第二映射向量获取第二注意力向量；/n根据所述第一注意力向量获取第一句子向量，并根据所述第二注意力向量获取第二句子向量；/n根据所述第一句子向量和所述第二句子向量获取目标句子向量；/n将所述目标句子向量输入Bert模型的线性层进行意图识别，获取意图识别结果。/n

【技术特征摘要】
1.一种意图识别方法，其特征在于，包括：
获取待识别句子；
通过嵌入层将所述待识别句子转化得到第一向量、第二向量和第三向量；
分别对所述第一向量和第二向量进行线性映射，得到第一映射向量和第二映射向量；
根据所述第一映射向量获取第一注意力向量，并根据第二映射向量获取第二注意力向量；
根据所述第一注意力向量获取第一句子向量，并根据所述第二注意力向量获取第二句子向量；
根据所述第一句子向量和所述第二句子向量获取目标句子向量；
将所述目标句子向量输入Bert模型的线性层进行意图识别，获取意图识别结果。

2.根据权利要求1所述的意图识别方法，其特征在于，所述根据所述第一映射向量获取第一注意力向量，并根据第二映射向量获取第二注意力向量，包括：
将所述第一映射向量，与所述第二映射向量的转置进行点乘得到第一关注度，并将所述第二映射向量，与所述第一映射向量的转置进行点乘得到第二关注度；
分别对所述第一关注度和第二关注度进行归一化处理，得到第一目标关注度和第二目标关注度；
将所述第一目标关注度与所述第三向量进行点乘得到第一注意力向量，并将所述第二目标关注度与所述第三向量进行点乘得到第二注意力向量。

3.根据权利要求2所述的意图识别方法，其特征在于，所述将所述第一映射向量，与所述第二映射向量的转置进行点乘得到第一关注度，包括：
将所述第一映射向量，与所述第二映射向量的转置进行点乘得到第一数值；
将所述第一数值除以缩放因子后得到所述第一关注度，其中，所述dK为所述第二向量的维度；
所述将所述第二映射向量，与所述第一映射向量的转置进行点乘得到第二关注度，包括：
将所述第二映射向量，与所述第一映射向量的转置进行点乘得到第二数值；
将所述第二数值除于缩放因子所述后得到所述第二关注度。

4.根据权利要求1所述的意图识别方法，其特征在于，所述根据所述第一注意力向量获取第一句子向量，并根据所述第二注意力向量获取第二句子向量，包括：
对所述第一注意力向量的第N维进行累加得到所述第一句子向量；

【专利技术属性】
技术研发人员：黄日星，熊友军，
申请(专利权)人：深圳市优必选科技股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人