命名实体识别方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:37250234 阅读:12 留言:0更新日期:2023-04-20 23:28
本发明专利技术公开了一种命名实体识别方法、装置、设备及计算机可读存储介质。所示方法包括:将目标文本序列输入边特征提取模型,得到目标特征图,目标特征图包括目标文本序列中两两文本单元之间的边特征;根据目标特征图预测得到预测邻接矩阵,并根据预测邻接矩阵查找预测邻接矩阵对应的实体有向图中的环;根据查找到的环中所包括的各个文本单元组成目标文本序列中的实体。本发明专利技术实现了一种通用于普通命名实体、嵌套命名实体和非连续命名实体的命名实体识别方案。识别方案。识别方案。

【技术实现步骤摘要】
命名实体识别方法、装置、设备及计算机可读存储介质


[0001]本专利技术涉及文本处理
,尤其涉及一种命名实体识别方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]命名实体识别主要是对文本中的某种类型的词语进行识别如人名、地址等,它属于信息抽取研究领域,并对其下游任务如文本理解、信息检索、摘要、问答等起到重要作用。命名实体通常分为普通命名实体、嵌套命名实体和非连续命名实体,普通命名实体指的是实体之间没有重叠,且实体是文本当中的一段连续片段,嵌套命名实体指的是实体之间存在重叠,非连续命名实体指的是实体由文本中若干不相连的片段组成。
[0003]目前大部分方法都是针对其中某个类型的实体进行特殊设计,如通过序列标注的方法解决普通实体识别,通过片段预测的方法来解决嵌套实体识别,缺乏针对各种不同类型实体的通用的实体识别方法。

技术实现思路

[0004]本专利技术的主要目的在于提供一种命名实体识别方法、装置、设备及计算机可读存储介质,实现了一种通用于普通命名实体、嵌套命名实体和非连续命名实体的命名实体识别方案。
[0005]为实现上述目的,本专利技术提供一种命名实体识别方法,所述方法包括以下步骤:
[0006]获取目标文本序列;
[0007]将所述目标文本序列输入至边特征提取模型进行特征提取得到目标特征图,其中,所述目标特征图包括所述目标文本序列中两两文本单元之间的边特征,所述边特征提取模型是预先采用训练数据集训练得到的,所述训练数据集包括训练文本序列和所述训练文本序列对应的实体有向图的标注邻接矩阵,所述训练文本序列对应的实体有向图为以所述训练文本序列中各个文本单元为节点,以所述训练文本序列中组成实体的各个文本单元在实体中的前后相邻关系为边的有向图,且实体中的最后一个文本单元和第一个文本单元被定义为具有所述前后相邻关系;
[0008]根据所述目标特征图预测得到预测邻接矩阵,并根据所述预测邻接矩阵查找所述预测邻接矩阵对应的实体有向图中的环;
[0009]根据所述查找到的环中所包括的各个文本单元组成所述目标文本序列中的实体。
[0010]可选地,所述边特征提取模型包括第一特征投影层和第二特征投影层,所述将所述目标文本序列输入至边特征提取模型进行特征提取得到目标特征图的步骤包括:
[0011]将所述目标文本序列中各个文本单元分别进行转换得到文本嵌入表示;
[0012]将各所述文本嵌入表示分别输入至所述第一特征投影层和所述第二特征投影层进行投影,得到所述目标文本序列中各个文本单元分别对应的第一投影特征和第二投影特征;
[0013]对于所述目标文本序列中的任一第一文本单元和任一第二文本单元,根据所述第一文本单元对应的所述第一投影特征和所述第二文本单元对应的所述第二投影特征,计算得到所述第一文本单元与所述第二文本单元之间的二元关系特征;
[0014]根据所述目标文本序列中各文本单元之间的所述二元关系特征构建所述目标特征图。
[0015]可选地,所述根据所述第一文本单元对应的所述第一投影特征和所述第二文本单元对应的所述第二投影特征,计算得到所述第一文本单元与所述第二文本单元之间的二元关系特征的步骤包括:
[0016]将所述第一文本单元对应的所述第一投影特征和所述第二文本单元对应的所述第二投影特征进行拼接,得到所述第一文本单元与所述第二文本单元之间的聚合特征;
[0017]根据所述第一文本单元在所述目标文本序列中的位置构建所述第一文本单元对应的第一旋转矩阵,根据所述第二文本单元在所述目标文本序列中的位置构建所述第二文本单元对应的第二旋转矩阵;
[0018]将所述第一文本单元对应的所述第一投影特征采用所述第一旋转矩阵进行旋转得到第一旋转特征,将所述第二文本单元对应的第二投影特征采用所述第二旋转矩阵进行旋转得到第二旋转特征;
[0019]计算所述第一旋转特征和所述第二旋转特征之间的相关性,得到所述第一文本单元与所述第二文本单元之间的距离特征;
[0020]根据所述聚合特征和所述距离特征得到所述第一文本单元与所述第二文本单元之间的二元关系特征。
[0021]可选地,所述边特征提取模型包括第三特征投影层、第四特征投影层和第五特征投影层,所述将所述目标文本序列输入至边特征提取模型进行特征提取得到目标特征图的步骤包括:
[0022]将所述目标文本序列中各个文本单元分别进行转换得到文本嵌入表示;
[0023]将各所述文本嵌入表示分别输入至所述第三特征投影层、第四特征投影层和第五特征投影层进行投影,得到所述目标文本序列中各个文本单元分别对应的第三投影特征、第四投影特征和第五投影特征;
[0024]对于所述目标文本序列的各个文本单元中的任一第三文本单元、任一第四文本单元和任一第五文本单元,根据所述第三文本单元对应的所述第三投影特征、所述第四文本单元对应的所述第四投影特征、所述第五文本单元对应的所述第五投影特征进行三元仿射,得到所述第三文本单元、所述第四文本单元和所述第五文本单元之间的三元关系特征;
[0025]根据所述目标文本序列中各文本单元之间的所述三元关系特征构建所述目标特征图。
[0026]可选地,所述边特征提取模型包括初始边特征提取层和边特征加强层,所述边特征加强层包括至少一个卷积层,所述将所述目标文本序列输入至边特征提取模型进行特征提取得到目标特征图的步骤包括:
[0027]将所述目标文本序列输入至所述初始边特征提取层进行特征提取得到初始特征图,其中,所述初始特征图包括所述目标文本序列中两两文本单元之间的初始边特征;
[0028]将所述初始特征图输入至所述边特征加强层进行边特征加强,得到目标特征图。
[0029]可选地,所述将所述目标文本序列输入至边特征提取模型进行特征提取得到目标特征图的步骤之前,还包括:
[0030]将所述训练文本序列输入待训练的所述边特征提取模型进行特征提取,得到训练特征图,其中,所述训练特征图包括所述训练文本序列中两两文本单元之间的边特征;
[0031]对于所述训练文本序列中的任意一个第六文本单元,根据所述训练特征图计算得到所述第六文本单元分别所在的各种长度的环的第一数量;
[0032]根据所述标注邻接矩阵计算得到所述第六文本单元分别所在的各种长度的环的第二数量;
[0033]根据所述训练文本序列中各个文本单元对应计算得到的所述第一数量与所述第二数量之间的误差,计算得到所述训练文本序列对应的环预测损失;
[0034]至少根据所述训练数据集中各所述训练文本序列对应的所述环预测损失对待训练的所述边特征提取模型进行一轮参数更新;
[0035]在对待训练的所述边特征提取模型进行至少一轮的参数更新后,得到训练完成的所述边特征提取模型。
[0036]可选地,所述根据所述训练特征图计算得到所述第六文本单元分别所在的各种长度的环的第一数量的步骤包括:
[0037]取所述预测特征图中对角线上本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种命名实体识别方法,其特征在于,所述方法包括以下步骤:获取目标文本序列;将所述目标文本序列输入至边特征提取模型进行特征提取得到目标特征图,其中,所述目标特征图包括所述目标文本序列中两两文本单元之间的边特征,所述边特征提取模型是预先采用训练数据集训练得到的,所述训练数据集包括训练文本序列和所述训练文本序列对应的实体有向图的标注邻接矩阵,所述训练文本序列对应的实体有向图为以所述训练文本序列中各个文本单元为节点,以所述训练文本序列中组成实体的各个文本单元在实体中的前后相邻关系为边的有向图,且实体中的最后一个文本单元和第一个文本单元被定义为具有所述前后相邻关系;根据所述目标特征图预测得到预测邻接矩阵,并根据所述预测邻接矩阵查找所述预测邻接矩阵对应的实体有向图中的环;根据所述查找到的环中所包括的各个文本单元组成所述目标文本序列中的实体。2.如权利要求1所述的命名实体识别方法,其特征在于,所述边特征提取模型包括第一特征投影层和第二特征投影层,所述将所述目标文本序列输入至边特征提取模型进行特征提取得到目标特征图的步骤包括:将所述目标文本序列中各个文本单元分别进行转换得到文本嵌入表示;将各所述文本嵌入表示分别输入至所述第一特征投影层和所述第二特征投影层进行投影,得到所述目标文本序列中各个文本单元分别对应的第一投影特征和第二投影特征;对于所述目标文本序列中的任一第一文本单元和任一第二文本单元,根据所述第一文本单元对应的所述第一投影特征和所述第二文本单元对应的所述第二投影特征,计算得到所述第一文本单元与所述第二文本单元之间的二元关系特征;根据所述目标文本序列中各文本单元之间的所述二元关系特征构建所述目标特征图。3.如权利要求2所述的命名实体识别方法,其特征在于,所述根据所述第一文本单元对应的所述第一投影特征和所述第二文本单元对应的所述第二投影特征,计算得到所述第一文本单元与所述第二文本单元之间的二元关系特征的步骤包括:将所述第一文本单元对应的所述第一投影特征和所述第二文本单元对应的所述第二投影特征进行拼接,得到所述第一文本单元与所述第二文本单元之间的聚合特征;根据所述第一文本单元在所述目标文本序列中的位置构建所述第一文本单元对应的第一旋转矩阵,根据所述第二文本单元在所述目标文本序列中的位置构建所述第二文本单元对应的第二旋转矩阵;将所述第一文本单元对应的所述第一投影特征采用所述第一旋转矩阵进行旋转得到第一旋转特征,将所述第二文本单元对应的第二投影特征采用所述第二旋转矩阵进行旋转得到第二旋转特征;计算所述第一旋转特征和所述第二旋转特征之间的相关性,得到所述第一文本单元与所述第二文本单元之间的距离特征;根据所述聚合特征和所述距离特征得到所述第一文本单元与所述第二文本单元之间的二元关系特征。4.如权利要求1所述的命名实体识别方法,其特征在于,所述边特征提取模型包括第三特征投影层、第四特征投影层和第五特征投影层,所述将所述目标文本序列输入至边特征
提取模型进行特征提取得到目标特征图的步骤包括:将所述目标文本序列中各个文本单元分别进行转换得到文本嵌入表示;将各所述文本嵌入表示分别输入至所述第三特征投影层、第四特征投影层和第五特征投影层进行投影,得到所述目标文本序列中各个文本单元分别对应的第三投影特征、第四投影特征和第五投影特征;对于所述目标文本序列的各个文本单元中的任一第三文本单元、任一第四文本单元和任一第五文本单元,根据所述第三文本单元对应的所述第三投影特征、所述第四文本单元对应的所述第四投影特征、所述第五文本单元对应的所述第五投影特征进行三元仿射,得到所述第三文本单元、所述第四文本单元和所述第五文本单元之间的三元关系特征;根据所述目标文本序列中各文本单元之间的所述三元关系特征构建所述目标特征图。5.如权利要求1所述的命名实体识别方法,其特征在于,所述边特征提取模型包括初始边特征提取层和...

【专利技术属性】
技术研发人员:李鹏飞
申请(专利权)人:上海高德威智能交通系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1