【技术实现步骤摘要】
文本处理方法、装置、电子设备及存储介质
[0001]本专利技术涉及人工智能算法在电力系统应用的
,尤其涉及一种文本处理方法、装置、电子设备及存储介质。
技术介绍
[0002]随着人工智能技术、大数据技术、物联网技术的不断发展以及智能电网的不断更新建设,对电力系统信息的智能化管理提出了新的要求和方向。智能电网在日常的建设和运行中,积累了海量的信息,其中包括配电网设备的数据知识、机理知识、经验知识等配电网运维异构知识等等。
[0003]目前,大部分数据信息往往都只是存储在系统中,导致了数据利用率低、管理效率低、检索难度高等问题。另一方面,电网大部分信息是以自然语言的形式进行描述,而且每个工作人员的文字表达习惯各不相同,增加了计算机对信息的理解难度。
技术实现思路
[0004]本专利技术提供了一种文本处理方法、装置、电子设备及存储介质,以实现提高文本实体识别准确率和识别效率的效果,将文本序列的上下文语义特征和语法特征进行结合,提升了模型的性能和鲁棒性。
[0005]根据本专利技术的一方面,提供 ...
【技术保护点】
【技术特征摘要】
1.一种文本处理方法,其特征在于,包括:获取包括待识别实体的待处理文本;基于目标文本识别模型对所述待处理文本进行识别处理,确定与所述待识别实体对应的识别结果,其中,所述目标文本识别模型中包括至少一个目标子模型,所述至少一个目标子模型包括语义特征提取子模型、上下文特征提取子模型、序列特征提取子模型、语法特征提取子模型以及关系分类子模型;所述识别结果中包括所述待识别实体的实体识别结果和/或实体关系识别结果。2.根据权利要求1所述的方法,其特征在于,还包括:获取待处理的原始信息,其中,所述原始信息中包括至少一种信息表现形式信息;基于预先设置的信息预处理方式对所述原始信息进行预处理,得到待处理文本,其中,所述信息预处理方式包括去重、去噪、分句以及分词中的至少一种。3.根据权利要求1所述的方法,其特征在于,所述目标文本识别模型中每个目标子模型的连接关系,包括:所述语义特征提取子模型的输出为所述上下文特征提取子模型的输入;所述上下文特征提取子模型的输出为所述序列特征提取子模型的输入;所述上下文特征提取子模型的输出为所述语法特征提取子模型的输入;所述序列特征提取子模型的输出和所述语法特征提取子模型的输出为所述关系分类子模型的输入。4.根据权利要求3所述的方法,其特征在于,所述基于目标文本识别模型对所述待处理文本进行识别处理,确定与所述待识别实体对应的识别结果,包括:基于所述语义特征提取子模型提取所述待处理文本中每个词语的语义特征,得到语义特征矩阵;基于所述上下文特征提取子模型提取所述语义特征矩阵的上下文特征,得到上下文特征矩阵;基于所述序列特征提取子模型对所述上下文特征矩阵进行处理,得到第一特征矩阵;以及,基于所述语法特征提取子模型对所述上下文特征矩阵进行处理,得到第二特征矩阵;基于所述关系分类子模型对所述第一特征矩阵和第二特征矩阵进行处理,得到与所述待识别实体对应的识别结果。5.根据权利要求4所述的方法,其特征在于,所述基于所述语义特征提取子模型提取所述待处理文本中每个词语的语义特征,得到语义特征矩阵,包括:基于所述语义特征提取子模型中的词向量模块对所述待处理文本进行处理,得到与所述待处理文本对应的词特征矩阵;以及,基于所述语义特征提取子模型中预先部署的位置向量查找表对所述待处理文本进行处理,得到与所述待处理文本对应的相对位置特征矩阵;以及,基于所述语义特征提取子模型中预先部署的词性向量查找表对所述待处理文本进行处理,得到与所述待处理文本对应的词性特征矩阵...
【专利技术属性】
技术研发人员:黄裕春,张晏玉,雷才嘉,佟佳俊,黄文栋,贾巍,童家鹏,范杏元,龚贤夫,李水天,
申请(专利权)人:广东电网有限责任公司广州供电局,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。