【技术实现步骤摘要】
电力计量的命名实体识别方法、装置和计算机设备
[0001]本申请涉及命名实体识别
,特别是涉及一种电力计量的命名实体识别方法、装置、计算机设备和存储介质。
技术介绍
[0002]随着知识图谱的日益普及,人们对知识图谱的需求越来越大。针对电力计量知识图谱,构建前往往需要从电力计量文本中准确识别并提取电力计量的命名实体。在传统技术中,深度学习模型在电力计量中得到了广泛的应用,例如通过长短时记忆神经网络(LSTM)、卷积神经网络等识别电力计量的命名实体。
[0003]然而,在中文的电力计量报告中,大量电力计量命名实体的名称较为相似,而传统的命名实体识别方法无法对其进行准确识别,导致电力计量命名实体的识别准确率低。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种电力计量的命名实体识别方法、装置、计算机设备和存储介质。
[0005]一种电力计量的命名实体识别方法,所述方法包括:
[0006]获取用于描述电力计量信息的待识别语料中多个词语各自对应的词向量;
[00 ...
【技术保护点】
【技术特征摘要】
1.一种电力计量的命名实体识别方法,其特征在于,所述方法包括:获取用于描述电力计量信息的待识别语料中多个词语各自对应的词向量;将多个词向量输入到训练好的编码器,通过所述编码器获取每个词向量对应的高斯分布的分布特征;基于多个词向量对应的分布特征,生成词向量特征;将所述词向量特征输入到预设的条件随机场,根据所述条件随机场输出的标注结果,确定所述待识别语料中的命名实体。2.根据权利要求1所述的方法,其特征在于,所述基于多个词向量对应的分布特征,生成词向量特征,包括:对多个词向量对应的分布特征进行组合,生成第一参考特征集合和第二参考特征集合;所述第一参考特征集合中的每个元素为一词向量;所述第二参考特征集合中的每个元素为相邻的词向量对;将所述第一参考特征集合和第二参考特征集合输入到训练好的双向长短时记忆网络,通过所述双向长短时记忆网络获取所述第一参考特征集合对应的独立特征和所述第二参考集合对应的关联性特征;对所述独立特征和所述关联性特征进行特征融合,得到词向量特征。3.根据权利要求2所述的方法,其特征在于,所述对多个词向量对应的分布特征进行组合,生成第二参考特征集合,包括:确定多个分布特征对应的排列顺序;所述排列顺序与待识别语料中各个词语的排列顺序对应;根据所述排列顺序,获取多组相邻的分布特征,得到多组分布特征对;采用多组分布特征对生成第二参考特征集合。4.根据权利要求1所述的方法,其特征在于,还包括:获取预先构建的电力计量语料库;所述电力计量语料库包括多条用于描述电力计量信息的语料;采用预设的分词模型对电力计量语料库中的语料进行分词,得到多个用于描述电力计量信息的词语;基于得到的多个词语对初始化的词向量模型进行训练,得到训练好的词向量模型,所述训练好的词向量模型用于获取电力计量语料中词语对应的词向量。5.根据权利要求4所述的方法,其特征在于,还包括:通过训练好的词向量模型,获取用于描述电力计量信息的多个词语各自对应的第一词向量;将所述第一词向量输入到待训练的编码器,通过所述编码器获取所述第一词向量对应高斯分布的第一分布特征;将所述第一分布特征输入到待训练的解码器,通过所述解码器基于所述第一分布特征获取预测词向量;基于所述第一词向量、预测词向量和损失函数,调整...
【专利技术属性】
技术研发人员:梁洪浩,伍少成,姜和芳,陈晓伟,
申请(专利权)人:深圳供电局有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。