机器人、实体识别方法、装置和存储介质制造方法及图纸

技术编号:38923337 阅读:40 留言:0更新日期:2023-09-25 09:32
本申请涉及一种机器人、实体识别方法、装置和存储介质。该方法包括:获取待识别语句中目标实体的词向量;将目标实体的词向量分别与预设的多个实体库中每个实体库中的词向量进行相似度比对,得到目标实体的词向量与预设的多个实体库中每个实体库中的词向量之间的相似度值;根据目标实体的词向量与预设的多个实体库中每个实体库中的词向量之间的相似度值,从预设的多个实体库中确定目标实体库;根据目标实体库的类别标签,确定目标实体的识别结果。其中,预设的多个实体库中每个实体库对应一个类别标签。该方法无需从待识别语句中直接识别目标实体的类别,不依赖大规模的标注语料。基于多个实体库可以快速识别目标实体的类别,提高了实体识别速率。提高了实体识别速率。提高了实体识别速率。

【技术实现步骤摘要】
机器人、实体识别方法、装置和存储介质


[0001]本申请涉及自然语言处理
,特别是涉及一种机器人、实体识别方法、装置和存储介质。

技术介绍

[0002]实体识别是自然语言处理的一个基础任务,其目的是识别语料中人名、地名、组织机构名等实体。
[0003]相关技术中,可以通过深度学习模型来进行实体识别任务,且在进行实体识别任务时需要先采用大量的标注语料对模型进行训练,使得模型在训练的过程中尽可能多地从标注语料中学习各实体的特征,进而采用训练好的模型对待识别语句进行实体识别,得到对应的实体识别结果。
[0004]然而,深度学习模型进行实体识别时,依赖于大规模的标注语料,导致实体识别成本高,难度大。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够降低实体识别成本的机器人、实体识别方法、装置和存储介质。
[0006]第一方面,本申请提供了一种实体识别方法,该方法包括:
[0007]获取待识别语句中目标实体的词向量;
[0008]将目标实体的词向量分别与预设的多个实体库中本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种机器人,其特征在于,所述机器人包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:获取待识别语句中目标实体的词向量;将所述目标实体的词向量分别与预设的多个实体库中每个实体库中的词向量进行相似度比对,得到所述目标实体的词向量与所述预设的多个实体库中每个实体库中的词向量之间的相似度值;所述预设的多个实体库中每个实体库对应一个类别标签;根据所述目标实体的词向量与所述预设的多个实体库中每个实体库中的词向量之间的相似度值,从所述预设的多个实体库中确定目标实体库;根据所述目标实体库的类别标签,确定所述目标实体的识别结果。2.根据权利要求1所述的机器人,其特征在于,所述根据所述目标实体的词向量与所述预设的多个实体库中每个实体库中的词向量之间的相似度值,从所述预设的多个实体库中确定目标实体库,包括:根据所述目标实体的词向量与所述预设的多个实体库中每个实体库中的词向量之间的相似度值,计算所述预设的多个实体库中每个实体库中的词向量与所述目标实体的词向量之间的相似度值大于或等于预设的相似度阈值的词向量数量,作为所述预设的多个实体库中每个实体库对应的第一相似度数量;根据所述预设的多个实体库中每个实体库对应的第一相似度数量和预设的实体数量阈值,从所述预设的多个实体库中筛选出目标实体库。3.根据权利要求2所述的机器人,其特征在于,所述根据所述预设的多个实体库中每个实体库对应的第一相似度数量和预设的实体数量阈值,从所述预设的多个实体库中筛选出目标实体库,包括:根据所述预设的多个实体库中每个实体库对应的第一相似度数量和预设的实体数量阈值,从所述预设的多个实体库中筛选出第一相似度数量大于或等于预设的实体数量阈值的实体库,作为候选实体库;根据所述候选实体库对应的第一相似度数量,从所述候选实体库中选择第一相似度数量最大的候选实体库作为目标实体库。4.根据权利要求1

3任一项所述的机器人,其特征在于,所述获取待识别语句中目标实体的词向量,包括:通过预设的实体抽取模型,从所述待识别语句中抽取所述目标实体的字符向量;对所述目标实体的字符向量进行加权和处理,得到所述待识别语句中目标实体的词向量。5.根据权利要求4所述的机器人,其特征在于,所述从所述待识别语句中抽取所述目标实体的字符向量,包括:基于预设的命名实体标注方法从所述待识别语句中抽取所述目标实体的字符向量。6.根据...

【专利技术属性】
技术研发人员:喻祥左珑谭泽辛
申请(专利权)人:深圳市普渡科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1