多种注意力机制的实体识别方法、装置、设备及存储介质制造方法及图纸

技术编号：36192409 阅读：15 留言：0更新日期：2022-12-31 21:11

本发明专利技术涉及人工智能技术，揭露了一种多种注意力机制的实体识别方法，包括：构建实体识别模型架构；将语义向量输入至实体识别模型架构中，得到第一特征向量；将语义向量输入至卷积神经网络层中，输出第二特征向量，将第二特征向量输入至门控机制层，得到第三特征向量；将语义向量输入至注意力机制层，得到注意力权重向量；将第一特征向量、第三特征向量及注意力权重向量进行融合，得到融合特征向量；计算融合特征向量的特征概率，利用特征概率对实体语句进行识别。此外，本发明专利技术还涉及区块链技术，实体语句可存储于区块链的节点。本发明专利技术还提出一种多种注意力机制的实体识别装置、设备以及介质。本发明专利技术可以提高实体识别的效率。本发明专利技术可以提高实体识别的效率。本发明专利技术可以提高实体识别的效率。

全部详细技术资料下载

【技术实现步骤摘要】
多种注意力机制的实体识别方法、装置、设备及存储介质

[0001]本专利技术涉及人工智能
，尤其涉及一种多种注意力机制的实体识别方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]在自然语言处理中，命名实体识别一直占据很重要的一部分，命名实体识别(Named Entity Recognition,NER)是一种识别文本中实体的位置以及类别的任务，对于规则性的数据，采用模板正则处理方法，对于非规则的数据，需要采用模型进行识别。
[0003]现有的命名实体识别方法多为建立统计学习模型或者深度学习模型并进行模型的训练，最后得到命名实体识别的结果。实际应用生产中，进行命名实体识别时实时性要求高，硬件的开销大，仅考虑识别结果的准确性，可能导致对实体识别的硬件要求过低，从而对进行实体识别的效率较低。

技术实现思路

[0004]本专利技术提供一种多种注意力机制的实体识别方法、装置及计算机可读存储介质，其主要目的在于解决进行实体识别的效率较低的问题。
[0005]为实现上述目的，本专利技术提供的一种多种注意力机制的实体识别方法，包括：
[0006]利用预设的双向长短期记忆网络层、预设的卷积神经网络层、预设的门控机制层及预设的注意力机制层构建实体识别模型架构；
[0007]获取预设的实体语句，将所述实体语句进行向量转换，得到语义向量；
[0008]将所述语义向量输入至所述实体识别模型架构中双向长短期记忆网络层进行特征提取，得到第一特征向量；
[0009]...

【技术保护点】

【技术特征摘要】
1.一种多种注意力机制的实体识别方法，其特征在于，所述方法包括：利用预设的双向长短期记忆网络层、预设的卷积神经网络层、预设的门控机制层及预设的注意力机制层构建实体识别模型架构；获取预设的实体语句，将所述实体语句进行向量转换，得到语义向量；将所述语义向量输入至所述实体识别模型架构中双向长短期记忆网络层进行特征提取，得到第一特征向量；将所述语义向量输入至所述实体识别模型架构中卷积神经网络层进行特征提取，输出第二特征向量，将所述第二特征向量输入至所述实体识别模型架构中门控机制层，得到第三特征向量；将所述语义向量输入至所述实体识别模型架构中注意力机制层，得到注意力权重向量；将所述第一特征向量、所述第三特征向量及所述注意力权重向量进行融合，得到融合特征向量；利用预设的激活函数计算所述融合特征向量的特征概率，利用所述特征概率对所述实体语句进行识别。2.如权利要求1所述的多种注意力机制的实体识别方法，其特征在于，所述利用预设的双向长短期记忆网络层、预设的卷积神经网络层、预设的门控机制层及预设的注意力机制层构建实体识别模型架构，包括：将所述双向长短期记忆网络层、所述卷积神经网络及所述注意力机制层作为第一层次；将所述卷积神经网络层与所述门控机制层进行相连，得到第二层次；根据所述第一层次及所述第二层次构建所述实体识别模型架构。3.如权利要求1所述的多种注意力机制的实体识别方法，其特征在于，所述将所述语义向量输入至所述实体识别模型架构中双向长短期记忆网络层进行特征提取，得到第一特征向量，包括：按照正序的规则将所述语义向量输入至所述双向长短期记忆网络层中，得到正序特征向量；按照逆序的规则将所述语义向量输入至所述双向长短期记忆网络层中，得到逆序特征向量；将所述正序特征向量及所述逆序特征向量进行融合，得到所述第一特征向量。4.如权利要求1所述的多种注意力机制的实体识别方法，其特征在于，所述将所述第二特征向量输入至所述实体识别模型架构中门控机制层，得到第三特征向量，包括：利用如下的公式根据所述第二特征向量计算所述门控机制层的输出特征向量：其中，h
l
(x)为第l层的输出特征向量，X为所述第二特征向量，W为所述门控机制层中的卷积核，V为所述门控机制层中的卷积核，b为所述门控机制层学习的参数，c为所述门控机制层学习的参数；将所述输出特征向量作为所述第三特征向量。
5.如权利要求1所述的多种注意力机制的实体识别方法，其特征在于，所述将所述语义向量输入至所述实体识别模型架构中注意力机制层，得到注意力权重向量，包括：将所述语义向量划分为询问向量、匹配向量及价值向量；利用如下的注意力公式根据所述询问向量、所述匹配向量及所述价值向量计...

【专利技术属性】
技术研发人员：邹倩霞，徐亮，
申请(专利权)人：深圳壹账通智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人