【技术实现步骤摘要】
一种基于卷积注意力网络的电力计量实体识别模型的分类方法
本专利技术涉及电网知识图谱构建相关的
,特别是涉及一种基于卷积注意力网络的电力计量实体识别模型及相应的分类方法。
技术介绍
随着信息化技术发展,电力计量领域积累了大量的电能量数据,却缺少有效处理大数据的方法。通过构建电力领域知识图谱,可以将庞大而零散的电力计量大数据化零为整,为电力企业的决策和发展提供更为全面有效的指导。同时,用户在使用以知识图谱为基础的各类业务应用时能获得更快的检索效率与更高的检索精准度,有效提升电力用户服务质量。命名实体识别(NamedEntityRecognition,NER)是知识图谱构建流程中不可或缺的一环。目前基于神经网络的中文实体识别模型在很大程度上依赖词级嵌入和外部词典集,这些模型的质量可能会受到不同的词嵌入表示形式和词典功能的影响。而针对电力专业领域的实体识别技术则存在以下困难点:1)命名实体通常是专有名词,若没有足够的标注,则很难正确学习词语表示;2)大型专业词典对于实际的实体识别系统而言非常昂贵,因为它将花费大 ...
【技术保护点】
1.一种基于卷积注意力网络的电力计量实体识别模型的分类方法,其特征在于,所述方法包括以下步骤:/n1)划分了5大类电力计量命名实体,分别为:/n计量数据:将表示用于统计相关电力数据的参数标注为计量数据实体,由计量监测获取;/n计量技术:将与电力计量相关的某种具体技术方法或技术行为标注为计量技术;/n电力设备:将表示电力计量相关的物体、装置标注为电力对象实体;/n电力单位:将表示电力计量相关的人员、地区、机构单位标注为电力单位实体;/n电力现象:将以某类实体在电力计量过程中产生的客观情况标注为电力现象;/n2)准备电力计量语料库:语料库内的所有电力计量文本,按照步骤1)分类标 ...
【技术特征摘要】
1.一种基于卷积注意力网络的电力计量实体识别模型的分类方法,其特征在于,所述方法包括以下步骤:
1)划分了5大类电力计量命名实体,分别为:
计量数据:将表示用于统计相关电力数据的参数标注为计量数据实体,由计量监测获取;
计量技术:将与电力计量相关的某种具体技术方法或技术行为标注为计量技术;
电力设备:将表示电力计量相关的物体、装置标注为电力对象实体;
电力单位:将表示电力计量相关的人员、地区、机构单位标注为电力单位实体;
电力现象:将以某类实体在电力计量过程中产生的客观情况标注为电力现象;
2)准备电力计量语料库:语料库内的所有电力计量文本,按照步骤1)分类标准进行实体标注,按照该统一标准标注,可以将语料中各类数据、单位、电气术语名称的命名格式进行相对统一的规范;
3)构建字符特征嵌入层:电力计量实体识别模型使用词嵌入将输入序列转化为低维度的稠密向量化表示,并将每句话中的字符向量序列作为一组数据传入卷积注意层。
2.如权利要求1所述的一种基于卷积注意力网络的电力计量实体识别模型的分类方法,其特征在于,所述步骤3)中,构建卷积注意层:卷积注意层的目的是对输入字符序列进行编码,并在局部上下文中对有意义的相关字符进行隐式分组;在通过卷积注意层提取局部上下文特征后,将其输入至BiGRU层;
构建全局注意力机制的BiGRU层:采用由两个单向的、方向相反的门控循环单元GRU组成的BiGRU神经网络模型,其输出由这两个GRU的状态共同决定,通过BiGRU计算每个电力计量实体所在语句中的各个字符嵌入,可以使当前字符的输出能与前一字符的状态和后一字符的状态都产生联系,更有利于文本深层次特征的提取;
构建CRF层:在BiGRU层后应用全局自注意力机制层来更好地处理句子级别的信息,最后,在这两层的联合输出结果后衔接一个标准的CRF层,通过正则化的极大似然估计来得到条件概率模型,以预测每个字符的最终标签。
3.如权利要求2所述的一种基于卷积注意力网络的电力计量实体识别模型的分类方法,其特征在于,所述步骤3)中,卷积注意层提取局部上下文特征:卷积注意层的目的是对输入字符序列进行编码,并在局部上下文中对有意义的相关字符进行隐式分组;对于CNN中窗口大小为k的每个窗口,首先将位置嵌入连接到每个字符嵌入中,以帮助保持局部窗口上下文中的顺序关系;嵌入位置的维数等于窗口大小k,字符所在位置的初始值为1,其他位置的初始值为0;因此,联合嵌入的维度数为de=dch+ddic+dpos+dseg;
然后,在窗口内应用一个局部注意来捕捉中心字符和每个上下文标记之间的关系,然后是一个带有池化层的CNN,将隐藏维度设置为dh,对于第j个字符,局部注意力集中于所有的级联嵌入作为窗口...
【专利技术属性】
技术研发人员:王鑫,李瀚斌,郑河荣,宗珂,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。