【技术实现步骤摘要】
基于人工智能的命名实体识别方法、装置、设备及介质
[0001]本专利技术适用于人工智能领域,尤其涉及一种基于人工智能的命名实体识别方法、装置、设备及介质。
技术介绍
[0002]命名实体识别在智能对话系统、情感分析、事件抽取、知识图谱等多个应用领域均占据重要的地位。
[0003]传统命名实体识别是基于实体词典来匹配文本中的命名实体,但是由于人类语言的多变性和使用场景的复杂性,新的实体层出不穷,可能会带来识别歧义,导致命名实体识别准确率较低。
[0004]为了解决上述问题,现有命名实体识别模型通过时刻更新训练数据来更新模型参数,以保证模型能够准确识别出新出现的实体和出现歧义的实体,但是这种方法费时费力,且由于训练数据更新质量的参差,难以在保证实时性的同时获得良好的识别效果。
[0005]因此,在命名实体识别领域中,如何在保证实时性的同时提高命名实体识别结果的准确性,成为亟待解决的问题。
技术实现思路
[0006]有鉴于此,本专利技术实施例提供了一种基于人工智能的命名实体识别方法、装置、设 ...
【技术保护点】
【技术特征摘要】
1.一种基于人工智能的命名实体识别方法,其特征在于,所述命名实体识别方法包括:获取待处理文本,在预设的实体字典中对所述待处理文本进行匹配识别,匹配得到字典识别结果,所述字典识别结果包括与所述待处理文本关联的N个目标实体,以及各个所述目标实体对应的M
i
个实体类型,其中,i=1,2,
…
,N,i为实体编号;采用预设分隔符对所述待处理文本和所述字典识别结果进行拼接处理,得到目标字符序列;采用预训练好的命名实体分类模型对所述目标字符序列进行分类,得到命名实体识别结果。2.根据权利要求1所述的命名实体识别方法,其特征在于,所述在预设的实体字典中对所述待处理文本进行匹配识别,匹配得到字典识别结果,包括:所述实体字典中包括各个预设实体以及各个所述预设实体对应的M
i
个实体类型;对所述待处理文本进行分词处理,得到K个待识别词项;对各个所述待识别词项与所述实体字典中各个所述预设实体进行相似度匹配,根据相似度匹配结果确定N个目标实体,以及各个所述目标实体对应的M
i
个实体类型,其中,K为大于N的正整数。3.根据权利要求1所述的命名实体识别方法,其特征在于,所述采用预设分隔符对所述待处理文本和所述字典识别结果进行拼接处理,得到目标字符序列,包括:所述预设分隔符包括第一分隔符、第二分隔符和第三分隔符;采用所述第一分隔符,对各个所述目标实体以及对应的M
i
个实体类型进行拼接,获取各个所述目标实体对应的第一拼接结果;采用所述第二分隔符,对N个所述目标实体对应的第一拼接结果进行拼接,获取第二拼接结果;采用所述第三分隔符,对所述待处理文本和所述第二拼接结果进行拼接,获取目标字符序列。4.根据权利要求1所述的命名实体识别方法,其特征在于,所述采用预训练好的命名实体分类模型对所述目标字符序列进行分类,得到命名实体识别结果,包括:所述预训练好的命名实体分类模型包括预训练好的编码器和预训练好的全连接层,所述预训练好的全连接层包括预训练好的线性变换层和归一化指数函数;将所述目标字符序列输入至所述预训练好的编码器进行特征提取,得到目标编码序列;将所述目标编码序列输入至所述预训练好的全连接层,根据所述预训练好的线性变换层将所述目标编码序列变换为目标分类向量,根据所述归一化指数函数对所述目标分类向量进行归一化处理,得到目标概率向量;根据所述目标概率向量确定各个所述目标实体的实际实体类型,得到命名实体识别结果。5.根据权利要求4所述的命名实体识别方法,其特征在于,所述编码器和所述全连接层的训练过程包括:获取样本文本,在预设的实体字典中对所述样本文本进行匹配识别,匹配得到样本字典识别结果,所述样本字典识别结果包括与所述样本文本关联的N个样本实体,以及各个所
述样本实体对应的M
i
个实体类型;采用预设分隔符对所述样本文本和所述样本字典识别结果进行拼接处理,得到样本字符序列;将所述样本字符序列...
【专利技术属性】
技术研发人员:马龙,孙泽烨,蒋佳惟,李炫,
申请(专利权)人:中国平安人寿保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。