命名实体识别方法、设备、装置和计算机可读存储介质制造方法及图纸

技术编号:26172214 阅读:26 留言:0更新日期:2020-10-31 13:48
本发明专利技术实施例公开了一种命名实体识别方法、设备、装置和计算机可读存储介质,该方法包括:将文本中的词语映射为向量;对所述向量进行处理,得到所述文本中词语的上下文表示;确定出与所述上下文表示相关的标签转移关系,根据所确定的标签转移关系,为所述文本中词语确定出标签序列。如此,在本发明专利技术实施例中,可以确定出与上下文信息相关的标签转移关系;这种动态地确定标签转移关系的方式,可以根据不同的上下文对标签的跳转进行更细致的建模,有助于优化标签跳转以及路径选择,进而可以提高推断标签序列的准确性和可靠性。

Named entity recognition method, device, device and computer-readable storage medium

【技术实现步骤摘要】
命名实体识别方法、设备、装置和计算机可读存储介质
本专利技术涉及自然语言处理领域,特别涉及一种命名实体识别方法、设备、装置和计算机可读存储介质。
技术介绍
目前,可以采用多种方式实现命名实体识别,例如,可以基于神经网络得到文本中词语的上下文表示,然后根据标签转移关系,推断出文本中词语的合理的标签序列;然而,相关技术中,标签转移关系是与上下文信息无关的,不能反映上下文信息,进而,推断出的标签序列的准确性和可靠性较低。
技术实现思路
为解决上述技术问题,本专利技术实施例期望提供一种命名实体识别方法、设备、装置和计算机可读存储介质。本专利技术的技术方案是这样实现的:本专利技术实施例提供了一种命名实体识别方法,所述方法包括:将文本中的词语映射为向量;对所述向量进行处理,得到所述文本中词语的上下文表示;确定出与所述上下文表示相关的标签转移关系,根据所确定的标签转移关系,为所述文本中词语确定出标签序列。本专利技术实施例中,所述确定出与所述上下文表示相关的标签转移关系,包括:根据所述上下文表示,确定本文档来自技高网...

【技术保护点】
1.一种命名实体识别方法,其特征在于,所述方法包括:/n将文本中的词语映射为向量;/n对所述向量进行处理,得到所述文本中词语的上下文表示;/n确定出与所述上下文表示相关的标签转移关系,根据所确定的标签转移关系,为所述文本中词语确定出标签序列。/n

【技术特征摘要】
1.一种命名实体识别方法,其特征在于,所述方法包括:
将文本中的词语映射为向量;
对所述向量进行处理,得到所述文本中词语的上下文表示;
确定出与所述上下文表示相关的标签转移关系,根据所确定的标签转移关系,为所述文本中词语确定出标签序列。


2.根据权利要求1所述的方法,其特征在于,所述确定出与所述上下文表示相关的标签转移关系,包括:
根据所述上下文表示,确定出条件随机场CRF模型中使用的转移矩阵;所述转移矩阵用于表征与所述上下文表示相关的标签转移关系;
相应地,根据所确定的标签转移关系,为所述文本中词语确定出标签序列,包括:
利用所述CRF模型,并根据所述转移矩阵,为所述文本中的词语确定出标签序列。


3.根据权利要求2所述的方法,其特征在于,所述根据所述上下文表示,确定出CRF模型中使用的转移矩阵,包括:
对所述上下文表示相关的标签转移关系进行建模,得到独立转移矩阵;对共性的标签转移关系进行建模,得到共享转移矩阵;根据所述共享转移矩阵和所述独立转移矩阵,得到所述CRF模型中使用的转移矩阵。


4.根据权利要求3所述的方法,其特征在于,所述根据所述共享转移矩阵和所述独立转移矩阵,得到所述CRF模型中使用的转移矩阵,包括:
将所述共享转移矩阵和所述独立转移矩阵进行点乘,得到所述CRF模型中使用的转移矩阵。


5.一种命名实体识别设备,其特征在于,所述设备包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,
所述处理器用于运行所述计算机程序时,执行以下步骤:
将文本中的词语映射为向量;
对所述向量进行处理,得到所述文本...

【专利技术属性】
技术研发人员:唐海庆童超杨希
申请(专利权)人:中移苏州软件技术有限公司中国移动通信集团有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1