【技术实现步骤摘要】
命名实体名称标准化的方法和装置、电子设备和存储介质
[0001]本申请属于计算机
,具体涉及一种命名实体名称标准化的方法和装置、电子设备和存储介质。
技术介绍
[0002]随着互联网技术的持续发展,自然语言处理(如文本处理)技术已成为计算机
与人工智能领域中的一个重要方向,且已被广泛应用;其中,命名实体识别(Named Entity Recognition,NER)是其他自然语言处理任务的基础任务,所谓的命名实体识别是指从文本中识别具有实体意义的词语(如提取句子中的人名、地名以及机构名等)。识别出的命名实体是后续多种场景的应用基础,基于此,如何保证这些识别的命名实体名称标准化的准确率,成为了研究的热点。
[0003]公开于该
技术介绍
部分的信息仅仅旨在增加对本申请的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
技术实现思路
[0004]本申请的目的在于提供一种命名实体名称标准化的方法,其用于解决现有技术中命名实体名称标准化的准确率不高的 ...
【技术保护点】
【技术特征摘要】
1.一种命名实体名称标准化的方法,其特征在于,所述方法包括:基于命名实体原词从标准词库中召回初始命名实体标准词,其中,所述初始命名实体标准词具有与所述命名实体原词的第一相似度;预测与所述命名实体原词对应标准词的预测数量,其中,所述预测数量小于等于所述召回的初始命名实体标准词数量;基于所述第一相似度,从所述召回的初始命名实体标准词中确定预测数量的命名实体标准词。2.根据权利要求1所述的命名实体名称标准化的方法,其特征在于,所述预测数量大于等于2,且所述预测数量小于所述召回的初始命名实体标准词数量;所述方法还包括:基于所述召回的初始命名实体标准词确定若干标准词组,其中,所述标准词组中分别包括预测数量的初始命名实体标准词;分别计算所述标准词组与所述命名实体原词的第二相似度;基于所述第一相似度和第二相似度,从所述标准词组中确定所述命名实体原词的目标标准词组;将所述目标标准词组中的初始命名实体标准词确定为命名实体标准词。3.根据权利要求2所述的命名实体名称标准化的方法,其特征在于,分别计算所述标准词组与所述命名实体原词的第二相似度,具体包括:获取所述标准词组与命名实体原词的字符交集;基于所述字符交集和命名实体原词的字符数量,计算所述第二相似度。4.根据权利要求3所述的命名实体名称标准化的方法,其特征在于,基于所述字符交集和命名实体原词的字符数量,计算所述第二相似度,具体包括:将所述字符交集与命名实体原词的字符数量比,确定为所述第二相似度。5.根据权利要求2所述的命名实体名称标准化的方法,其特征在于,基于所述第一相似度和第二相似度,从所述标准词组中确定所述命名实体原词的目标标准...
【专利技术属性】
技术研发人员:赵周剑,王永明,刘荣兵,
申请(专利权)人:浙江太美医疗科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。