【技术实现步骤摘要】
实体的识别方法及装置、存储介质、电子设备
[0001]本申请涉及一种自然语言处理
,尤其涉及一种实体的识别方法及装置、存储介质、电子设备。
技术介绍
[0002]实体识别是指在文本中识别已被预先定义好的特殊对象,如人名、地址、组织等,此时,结合自然语言处理技术,可以用于识别不同的互联网智能产品。例如,应用至智能家居中,通过实体识别确定智能家居设备实体。
[0003]目前,现有的实体识别通常基于常规群体的命名标记进行实体识别算法训练,以对文本进行分词后识别实体的。但是,由于基于常规群体的命名标记得到的实体识别模型无法满足各种应用场景下的实体识别需求,如对于此前常规群体中未出现的词语或者用户自定义词语,现有的实体识别模型无法准确识别,导致存在大量分词错误以及分词歧义的情况,从而导致实体识别准确性较差。
技术实现思路
[0004]有鉴于此,本申请提供了一种实体的识别方法及装置、存储介质、电子设备,用于解决现有技术中的实体识别准确性较差的问题。
[0005]为达上述之一或部分或全部目的或是其他目 ...
【技术保护点】
【技术特征摘要】
1.一种实体的识别方法,其特征在于,包括:基于已训练的实体识别模型对获取的待处理文本进行实体识别,得到所述待处理文本的第一实体识别结果;根据目标分词策略对所述待处理文本进行分词处理,得到所述待处理文本的第二实体识别结果;所述目标分词策略具有识别文本中的自定义词的能力;若所述第一实体识别结果和/或所述第二实体识别结果包括自定义词,则基于所述第一实体识别结果和第二实体识别结果,确定所述待处理文本中的目标实体。2.根据权利要求1所述的方法,其特征在于,所述根据目标分词策略对所述待处理文本进行分词处理,得到所述待处理文本的第二实体识别结果包括:按照分词词典对所述待处理文本进行分词,得到分词结果;基于所述目标分词策略将所述分词结果与自定义词库中的各自定义词进行匹配,确定第二实体识别结果。3.根据权利要求1所述的方法,其特征在于,所述基于所述第一实体识别结果和第二实体识别结果,确定所述待处理文本中的目标实体包括:获取所述自定义词的评估权重;基于所述评估权重对所述第一实体识别结果进行评估,得到所述第一实体识别结果的第一评估结果,并基于所述评估权重对所述第二实体识别结果进行评估,得到所述第二实体识别结果的第二评估结果;根据所述第一评估结果与所述第二评估结果,从所述第一实体识别结果、所述第二实体识别结果中确定所述待处理文本中的目标实体。4.根据权利要求3所述的方法,其特征在于,所述基于所述评估权重对所述第二实体识别结果进行评估,得到所述第二实体识别结果的第二评估结果包括:获取所述自定义词的使用间隔时长,并根据所述使用间隔时长确定所述自定义词的时间衰减信息;基于所述评估权重、所述时间衰减信息对所述第二实体识别结果进行评估,得到第二实体识别结果的第二评估结果。5.根据权利要求3所述的方法,其特征在于,所述第一评估结果用于表征对所述第一实体识别结果进行评估所得到的数值化内容,所述第二评估结果用于表征对所述第二实体识别结果进行评估所得到的的数值化内容,所述根据所述第一评估结果与所述第二评估结果,从所述第一实体识别结果、所述第二实体识别结果中确定所述待处理文本中的目标实体包括:若所述第一评估结果大于所述第二评估结果,则将所述第一实体识别结果确定为目标实体;若所述第一评估结果小于所述第二评估结果,则将所述第二实体识别结果...
【专利技术属性】
技术研发人员:严海锐,
申请(专利权)人:深圳绿米联创科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。