【技术实现步骤摘要】
命名实体识别的方法和装置
[0001]本说明书涉及自然语言处理领域,尤其涉及一种命名实体识别的方法和装置。
技术介绍
[0002]命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是指识别文本中具有特定意义的实体,最常见的四个实体类型是:PER(人物),LOC(地点),ORG(组织),或 GPE(地缘政治实体(geo
‑
political entity))。命名实体标注是命名实体识别的第一步,命名实体标注是通过不同的标签,将文本中的命名实体与非实体分别进行标注,而命名实体识别则是在标注好的文本中识别出命名实体及其实体类型。命名实体标注可以采用不同的实体标注模式,而针对采用不同实体标注模式标注后的文本,在进行命名实体识别时,识别的准确率不同。
技术实现思路
[0003]有鉴于此,本说明书提供一种命名实体识别的方法与装置。
[0004]具体地,本说明书是通过如下技术方案实现的:根据本申请的第一方面,提供一种命名实体识别的方法,该方法中预先存 ...
【技术保护点】
【技术特征摘要】
1.一种命名实体识别的方法,其特征在于,预先存储有命名实体识别模型、文本类型和实体标注模式三者之间的映射关系,所述方法包括:获取待进行命名实体识别的目标文本,并确定所述目标文本的文本类型;确定对所述目标文本进行命名实体识别的目标命名实体识别模型;在所述映射关系中查找与所述目标文本类型和所述目标命名实体识别模型对应的实体标注模式作为目标实体标注模式;采用所述目标实体标注模式对所述目标文本进行命名实体标注,得到目标标注结果;将所述目标标注结果输入所述目标命名实体识别模型,得到所述目标文本的命名实体识别结果。2.根据权利要求1所述的方法,其特征在于,所述映射关系的构建方法包括:获取不同文本类型的样本文本在不同实体标注模式下的标注结果;针对每种命名实体识别模型,基于已训练的该种命名实体识别模型和所述标注结果确定每种文本类型的样本文本在各不同实体标注模式下的命名实体识别效果;针对每种文本类型,根据相同实体标注模式下属于该文本类型的样本文本的所述命名实体识别效果确定所述命名实体识别模型对采用所述实体标注模式标注的该类型文本进行命名实体识别的综合识别效果;确定综合识别效果符合效果约束条件的实体标注模式,并保存该实体标注模式与所述文本类型和所述命名实体识别模型三者之间的映射关系。3.根据权利要求2所述的方法,其特征在于,所述基于已训练的该种命名实体识别模型和所述标注结果确定每种文本类型的样本文本在各不同实体标注模式下的命名实体识别效果,包括:针对每种文本类型的样本文本,将所述样本文本的在不同实体标注模式下的标注结果分别输入已训练的对应所述文本类型和所述实体标注模式的该种命名实体识别模型,得到所述命名实体模型输出的对应所述实体标注模式的命名实体识别结果;确定所述命名实体识别结果与所述样本文本的真实命名实体识别结果之间的差异作为所述样本文本在对应实体标注模式下的命名实体识别效果。4.根据权利要求2所述的方法,其特征在于,所述获取不同文本类型的样本文本在不同实体标注模式下的标注结果,...
【专利技术属性】
技术研发人员:张超华,魏海巍,刘凯,
申请(专利权)人:共道网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。