命名实体识别方法、装置、终端设备及存储介质制造方法及图纸

技术编号:24685370 阅读:39 留言:0更新日期:2020-06-27 08:29
本申请适用于计算机技术领域,提供了命名实体识别方法,包括:获取待识别文本,并将待识别文本转换为n×k维的第一矩阵;对第一矩阵进行多层卷积层卷积,其中对所述多层卷积层中卷积核的通道数为m的最后一层卷积层进行4次卷积操作,得到4个并行的n×m维的第二矩阵;对4个第二矩阵中的3个第二矩阵进行注意力权重自适应后得到n×m维的第三矩阵,将第三矩阵与剩余的1个第二矩阵进行矩阵加法,输出n×m维的第四矩阵;对第四矩阵进行分类,输出待识别文本对应的实体标注;根据实体标注,输出待识别文本对应的命名实体。通过在卷积层中引入注意力机制,有效降低数据冗余,减少模型参数量,加快命名实体识别模型的识别速度。

Named entity identification method, device, terminal equipment and storage medium

【技术实现步骤摘要】
命名实体识别方法、装置、终端设备及存储介质
本申请属于计算机
,尤其涉及命名实体识别方法、装置、终端设备及存储介质。
技术介绍
命名实体识别是从一段自然语言文本中识别出具有特点意义的实体的过程。目前,命名实体识别模型主要分为传统深度学习模型以及语言模型,传统深度学习模型主要以循环神经网络为主,该类模型的速度受限于其循环特性而导致识别速度慢。而语言模型是一种经过多任务训练的综合语言模型,但该类模型的参数量较大也导致识别速度慢。申请内容本申请实施例提供了命名实体识别方法、装置、终端设备及存储介质,可以解决现有命名实体识别模型识别速度慢的问题。第一方面,本申请实施例提供了一种命名实体识别方法,包括:获取待识别文本,并将所述待识别文本转换为n×k维的第一矩阵,其中所述n为所述待识别文本的字符数,所述k为预设的所述待识别文本对应的字向量维度;对所述第一矩阵进行多层卷积层卷积,其中对所述多层卷积层中卷积核的通道数为m的最后一层卷积层进行4次卷积操作,得到4个并行的n×m维的第二矩阵;对4个所述第二矩阵中本文档来自技高网...

【技术保护点】
1.一种命名实体识别方法,其特征在于,所述方法包括:/n获取待识别文本,并将所述待识别文本转换为n×k维的第一矩阵,其中所述n为所述待识别文本的字符数,所述k为预设的所述待识别文本对应的字向量维度;/n对所述第一矩阵进行多层卷积层卷积,其中对所述多层卷积层中卷积核的通道数为m的最后一层卷积层进行4次卷积操作,得到4个并行的n×m维的第二矩阵;/n对4个所述第二矩阵中的3个所述第二矩阵进行注意力权重自适应后,得到n×m维的第三矩阵,将所述第三矩阵与剩余的1个所述第二矩阵进行矩阵加法,输出n×m维的第四矩阵;/n对所述第四矩阵进行分类,输出所述第四矩阵对应的多个实体标注的概率,并根据多个所述概率确...

【技术特征摘要】
1.一种命名实体识别方法,其特征在于,所述方法包括:
获取待识别文本,并将所述待识别文本转换为n×k维的第一矩阵,其中所述n为所述待识别文本的字符数,所述k为预设的所述待识别文本对应的字向量维度;
对所述第一矩阵进行多层卷积层卷积,其中对所述多层卷积层中卷积核的通道数为m的最后一层卷积层进行4次卷积操作,得到4个并行的n×m维的第二矩阵;
对4个所述第二矩阵中的3个所述第二矩阵进行注意力权重自适应后,得到n×m维的第三矩阵,将所述第三矩阵与剩余的1个所述第二矩阵进行矩阵加法,输出n×m维的第四矩阵;
对所述第四矩阵进行分类,输出所述第四矩阵对应的多个实体标注的概率,并根据多个所述概率确定所述待识别文本对应的实体标注;
根据所述待识别文本对应的实体标注,输出所述待识别文本对应的命名实体。


2.如权利要求1所述的命名实体识别方法,其特征在于,所述将所述待识别文本转换为n×k维的第一矩阵之后,还包括:
向所述n×k维的第一矩阵加入预设的g维的位置向量,得到n×(k+g)维的加入位置向量的第一矩阵。


3.如权利要求1所述的命名实体识别方法,其特征在于,所述对所述第一矩阵进行多层卷积层卷积,其中对所述多层卷积层中卷积核的通道数为m的最后一层卷积层进行4次卷积操作,得到4个并行的n×m维的第二矩阵,包括:
对所述第一矩阵进行预设的i层卷积层卷积后,得到n×m维的第五矩阵,所述i层卷积层中每层卷积层的卷积核的通道数为m;
通过预设的第一卷积核为j×m维的卷积层对所述第五矩阵进行4次卷积,输出4个并行的n×m维的所述第二矩阵,所述第一卷积核的通道数为m。


4.如权利要求3所述的命名实体识别方法,其特征在于,所述对所述第一矩阵进行预设的i层卷积层卷积后,得到n×m维的第五矩阵,包括:
通过第二卷积核为1×k维的第1层卷积层对所述第一矩阵进行卷积,输出n×m维的第六矩阵,所述第二卷积核的通道数为m;
对所述第五矩阵进行第2层卷积层至第i层卷积层卷积后,输出n×m维的第五矩阵,其中所述第2层卷积层至第i层卷积层的卷积核均为所述第一卷积核。


5.如权利要求1所述的命名实体识别方法,其特征在于,所述对4个所述第二矩阵中的3个所述第二矩阵进行注意力权重自适应后得到的n×m维第三矩阵,将所述第三矩阵与剩余的1个所述第二矩阵进行矩阵加法,得到n×m维的第四矩阵...

【专利技术属性】
技术研发人员:陈桢博金戈徐亮
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1