一种基于NTBC-net算法的电力分词模型制造技术

技术编号:43249323 阅读:18 留言:0更新日期:2024-11-08 20:33
本发明专利技术提供一种基于NTBC‑net算法的电力分词模型,由数字上下文强化编码,具有重要性的全局特征编码,具有重要性的局部特征编码和NTBC‑net输出部分组成,所述数字上下文强化编码先判断输入文本中是否包含数字,如包含则对数字信息进行增强表示,所述具有重要性的全局特征编码包括BiSTM模块和自注意力模块1,所述具有重要性的局部特征编码包括CNN模块和自注意力模块2,所述NTBC‑net输出部分利用条件随机场处理得到文本中每个字的标签结果,本发明专利技术将电力知识相关长句切分为头实体和意图两部分,同时对电力语句内的数字信息采取数字上下文强化编码,为电力知识图谱的匹配提供了便利。

【技术实现步骤摘要】

本专利技术涉及电力分词模型的,具体说是涉及一种基于ntbc-net算法的电力分词模型。


技术介绍

1、目前,变电站防止电气误操作功能比较单一,且颗粒度较粗。如一次设备“五防”技术,运维人员通过微机防误系统根据调度指令及倒闸操作票在模拟盘上对一次设备的状态变换进行预演,并将模拟操作步骤按顺序传至电脑钥匙,与现场的设备防误锁具的精确配合,从而在一定程度上防止误操作。然而现有方法还存在一些问题,传统实体识别模型准确度不足,在编码过程中考虑不全面且在特定的电力领域文本编码过程中并未考虑其特殊性。因此,传统模型未能更准确完成定义的电力分词任务。

2、在电力领域,数字信息对判断缺陷程度很重要。传统模板匹配方法中没有分词过程,要求整句匹配,匹配度要求比较高,模板设计比较复杂,且传统语义相似度方法同样因为语句过长导致误差增大,匹配难度增大。综上,传统方法存在的问题均归各于语句过长导致复杂度的提升,准确度的下降。因此,引入电力分词方法,切分较长的语句,将一个长句切分成头实体部分以及除头实体以外的部分,为电力知识图谱的匹配提取了便利。

<br/>

本文档来自技高网...

【技术保护点】

1.一种基于NTBC-net算法的电力分词模型,其特征在于,由数字上下文强化编码,具有重要性的全局特征编码,具有重要性的局部特征编码和NTBC-net输出部分组成,所述具有重要性的全局特征编码包括:BiLSTM模块和自注意力模块1,所述具有重要性的局部特征编码包括:CNN模块和自注意力模块2。

2.根据权利要求1所述的一种基于NTBC-net算法的电力分词模型,其特征在于,所述数字上下文强化编码先判断输入文本中是否包含数字,如包含则对数字信息进行增强表示。

3.根据权利要求1所述的一种基于NTBC-net算法的电力分词模型,其特征在于,所述BiLSTM模块使用Bi...

【技术特征摘要】

1.一种基于ntbc-net算法的电力分词模型,其特征在于,由数字上下文强化编码,具有重要性的全局特征编码,具有重要性的局部特征编码和ntbc-net输出部分组成,所述具有重要性的全局特征编码包括:bilstm模块和自注意力模块1,所述具有重要性的局部特征编码包括:cnn模块和自注意力模块2。

2.根据权利要求1所述的一种基于ntbc-net算法的电力分词模型,其特征在于,所述数字上下文强化编码先判断输入文本中是否包含数字,如包含则对数字信息进行增强表示。

3.根据权利要求1所述的一种基于ntbc-net算法的电力分词模型,其特征在于,所述bilstm模块使用bilstm学习前向和后向隐藏层状态特征序列,实现对全局特征的编码工作。

4.根据权利要求1所述的一种基于ntbc-net算法的电力分词模型,其特征在于,所述自注意力模块1接收bilstm模块获得的全局特征向量,在每一个词之间进行注意力计算,而后将经自注意力计算后的结果与bilstm输出的结果做残差链接,求和后过标准化层,将标准化后的...

【专利技术属性】
技术研发人员:汪勋婷徐斌高博汤伟丁津津袁伟博李圆智张小红
申请(专利权)人:国网安徽省电力有限公司电力科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1