【技术实现步骤摘要】
命名实体识别方法、装置、电子设备及可读存储介质
[0001]本专利技术涉及人工智能技术,尤其涉及一种命名实体识别方法、装置、电子设备及可读存储介质。
技术介绍
[0002]随着互联网技术的发展,利用搜索引擎进行信息索引逐渐成为了人们生活中重要的一部分,但是搜索引擎进行信息索引时,为了保证搜索的准确率需要对待搜索文本进行命名实体识别,命名实体识别的准确度直接关乎搜索的准确度,因此,命名实体识别也越来越受到人们的重视。
[0003]但是现有的命名实体识别大多利用分词工具直接对待识别文本进行分词,导致分词准确率较低,当分词准确率低时,属性标注的准确率更低,从而导致命名实体识别的准确率低。
技术实现思路
[0004]本专利技术提供一种命名实体识别方法、装置、电子设备及计算机可读存储介质,其主要目的在于提高命名实体识别的准确率。
[0005]为实现上述目的,本专利技术提供的一种命名实体识别方法,包括:
[0006]接收待识别文本,对所述待识别文本中的每个字符进行向量转换,得到字向量;
[ ...
【技术保护点】
【技术特征摘要】
1.一种命名实体识别方法,其特征在于,所述方法包括:接收待识别文本,对所述待识别文本中的每个字符进行向量转换,得到字向量;利用预构建的标准词典对所述待识别文本进行分词处理,得到多个分词词语;获取所述分词词语的属性标签,对所述属性标签进行向量转化,得到标签向量;将每个所述字向量与所述标签向量进行向量拼接,得到对应的拼接字向量,并将所有的所述拼接字向量进行组合,得到拼接字向量序列;对每个所述拼接字向量进行特征提取,得到对应的特征向量;对每个所述特征向量进行向量属性识别,根据识别的结果及所述拼接字向量序列对所述待识别文本中的每个字符进行字符属性识别,得到对应的字符属性;根据所述字符属性对所述待识别文本进行分词和属性标注,得到命名实体识别的结果。2.如权利要求1所述的命名实体识别方法,其特征在于,所述利用预构建的标准词典对所述待识别文本进行分词处理,得到多个分词词语,包括:利用预设的分词工具对所述待识别文本进行分词,得到初始分词结果;根据所述标准词典对所述初始分词结果中的词语进行最长匹配,得到多个所述分词词语。3.如权利要求1所述的命名实体识别方法,其特征在于,所述获取所述分词词语的属性标签,包括:利用所述分词词语构建属性文本查询语句;利用所述属性文本查询语句查询预设的词语属性表中所述分词词语对应的属性文本,得到属性标签。4.如权利要求1所述的命名实体识别方法,其特征在于,所述对所述属性标签进行向量转化,得到标签向量,包括:将所述属性标签中的每个字符转化为向量,得到标签字向量;根据所有所述标签字向量进行计算,得到所述标签向量。5.如权利要求1所述的命名实体识别方法,其特征在于,所述将每个所述字向量与所述标签向量进行向量拼接,得到对应的拼接字向量,并将所有的所述拼接字向量进行组合,得到拼接字向量序列,包括:选取所述字向量对应字符所属的分词词语,得到字符分词词语;选取所述字符分词词语对应的所述标签向量,得到目标标签向量;将所述字向量与对应的所述目标标签向量进行纵向拼接,得到所述拼接字向量;将每个所述拼接字向量按照对应的字符在所述待识别文本中的先后顺序进行组合,得到所述拼接字向量序列。6.如权利要求1所述的命名实体识别方法,其特征在于,所述利用预设属性识别模型识别根据所述目标字向量序列中每个向量的属性,根据识别的向量的属性对所述待识别...
【专利技术属性】
技术研发人员:冯豆豆,
申请(专利权)人:平安国际智慧城市科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。