一种基于文本向量化的故障停电抢修事中处置参考方法技术

技术编号:28225140 阅读:20 留言:0更新日期:2021-04-28 09:57
本发明专利技术提供一种基于文本向量化的故障停电抢修事中处置参考方法,包括以下步骤:步骤一:已处置故障停电事件及其处置方案数据获取;步骤二:已处置故障停电事件描述文本预处理与分词;步骤三:停电事件描述文本向量化表示;步骤四:停电事件描述文本语义相似度计算及处置方案推送:采用余弦相似度计算新增待处置故障停电事件与存量已处置故障停电事件的描述文本向量语义相似度,当相似度超过设定阈值时,将存量已处置故障停电事件的处置方案推送给作业人员作为参考。本发明专利技术能够识别与新增待处置故障停电事件描述文本语义相似度较高的存量已处置故障停电事件,将其处置方案与处理时长等信息提供给作业人员作为参考,可提高事件处置效率。事件处置效率。事件处置效率。

【技术实现步骤摘要】
一种基于文本向量化的故障停电抢修事中处置参考方法


[0001]本专利技术涉及电网故障抢修领域,具体是一种基于文本向量化的故障停电抢修事中处置参考方法。

技术介绍

[0002]电网企业已经建立起了面向流程管理的配网故障抢修管理平台,其中事件管理是抢修平台功能的重要组成部分,在故障抢修处置方面发挥了显著的作用。故障抢修平台事件管理最主要的工作就是故障报修及故障抢修处理工单的流转,不断重复建单、派单、转单、解决、关闭这一过程,从而在日常维护工作中积累了大量事件工单。这些大量的历史工单中有很多都是重复发生或者类似的事件,当前因没有将这些历史工单有效地利用起来,从而使客服或作业人员很多时间都耽搁在这种重复繁杂的工作中。
[0003]文献[1]提出了一种提升配电网恢复效率的抢修策略优化方法,该方法以系统损失电量最小为目标构建抢修策略优化模型,并利用贪心算法求解得到提升配电网恢复效率的优化抢修策略,并以IEEE 33节点配电网系统为算例进行了仿真及验证。文献[2]分析了当前配电网故障抢修中存在的主要问题,从管理角度提出了提高配网故障抢修效率的具体策略。文献[3]提出了一种基于用户画像技术和故障诊断技术的计量装置故障抢修主动服务预警模型,利用K

Means聚类方法构建用户画像模型,利用极端梯度提升XGBoost算法构建计量装置故障识别模型,进而建立计量装置故障抢修主动服务预警模型。文献[4]通过对影响电网故障抢修的主要因素进行分析,提出了相关电网故障定位及抢修时间的主要技术手段,并提出了基于故障行波传输路径及分支判定矩阵的电网故障定位方法。文献[5]建立了电力系统在多故障情况下的多目标抢修策略优化模型,针对配电网接线呈辐射状的特点,提出了一种遗传拓扑混合算法作为寻优策略,算例结果证明了该混合智能算法的有效性和鲁棒性。文献[6]建立了多故障抢修与供电恢复的联合优化模型,通过故障抢修顺序和停电负荷恢复路径的交互影响和反复迭代,最终得到最优的抢修计划和各个阶段最优的供电恢复策略。
[0004]快速处置是故障抢修管理的重要目标之一,尤其对一线人员,当接到故障报修时能够在建单的过程中就能快速地从历史信息中找到对当前事件有益的参考信息,对事件的快速处置将起到很大的帮助。
[0005]参考文献:
[0006][1]杨隆,李长城,罗伟,等.提升配电网恢复效率的抢修策略优化研究[J].浙江电力,2020.
[0007][2]马峻峰.浅谈提高配网故障的抢修效率的措施[J].科技资讯,2020.
[0008][3]殷新博,唐旭东,王数,等.计量装置故障抢修主动服务预警模型研究[J].信息技术,2020.
[0009][4]刘洋,白东海,贺卫华,等.基于缩短故障定位及抢修时间的决策方法研究[J].机械电子,2020.
[0010][5]张晶伟,张粒子,黄弦超.基于遗传拓扑混合算法的配电网多故障抢修策略[J].电力系统自动化,2008.
[0011][6]黄弦超,杨雨,范闻博.配电网多故障抢修与供电恢复联合优化模型[J].电力系统自动化,2014.

技术实现思路

[0012]本专利技术的目的在于针对现有技术的不足,提供一种基于文本向量化的故障停电抢修事中处置参考方法。
[0013]为了实现上述目的,本专利技术采用了以下技术方案:
[0014]一种基于文本向量化的故障停电抢修事中处置参考方法,包括如下步骤:
[0015]步骤一:已处置故障停电事件及其处置方案数据获取:从生产管理系统配网抢修管控模块获取已处置故障停电事件描述文本及与已处置故障停电事件对应的抢修处置方案,所述已处置故障停电事件描述文本包含已处置故障停电事件的停电编号、停电类型、线路名称、停电原因、停电范围;
[0016]步骤二:已处置故障停电事件描述文本预处理与分词:对已处置故障停电事件的停电原因等关键描述文本信息,进行冗余信息、非法字符剔除等预处理,结合Python的jieba内置的词典与停电地址要素库对停电原因、停电范围进行分词,整合后表示成已处置故障停电事件描述文本特征词集;
[0017]步骤三:停电事件描述文本向量化表示:采用词频-逆文本频率指数算法(TF

IDF)将已处置故障停电事件描述文本特征词集转换成向量化形式,即生成已处置故障停电事件的描述文本向量;
[0018]步骤四:停电事件描述文本语义相似度计算及处置方案推送:针对新增待处置故障停电事件,首先查询该设备历史故障停电事件记录,判断是否存在因同类原因导致故障重复发生,若存在则直接调取其历史处置方案并参考;若不存在,则采用余弦相似度计算新增待处置故障停电事件与已处置故障停电事件的描述文本向量的语义相似度,当相似度超过设定阈值时,将已处置故障停电事件所对应的处置方案推送给作业人员作为参考。
[0019]进一步的,步骤三中词频-逆文本频率指数算法(TF

IDF)如式(1)所示:
[0020][0021]式中,w
i,j
为权重,tf
i,j
为特征词t
j
在文档d
i
中的词频TF(Term Frequency),idf
j
为特征词t
j
在整个文档集合D={d1,d2,

d
k
}中的逆向文档频率IDF(Inverse Document Frequency),n
i,j
为特征词t
j
在文档d
i
中出现次数,k为文档总数,为特征词t
j
在文档集合D={d1,d2,

d
k
}中出现总次数,n
j
为特征词t
j
所出现文件数。
[0022]进一步的,步骤四中,采用余弦相似度计算新增待处置故障停电事件与已处置故障停电事件的描述文本向量的语义相似度,具体步骤为:
[0023]假定两个文本的特征向量分别表示为和
并且它们之间的夹角为θ,则两个向量的余弦相似度由式(2)表示:
[0024][0025]进一步的,步骤四中根据实际经验将所述阈值设置在0.7

0.8之间。
[0026]本专利技术的技术效果与优点:
[0027]本专利技术采用词频-逆文本频率指数算法(TF

IDF)将故障停电事件描述文本特征词集转换成向量化形式,可以有效避免传统词表示的“维数灾难”问题,而且词与词之间的语义关联性可以通过向量距离计算;本专利技术所提方法能够识别与新增待处置故障停电事件描述文本语义相似度较高的存量已处置故障停电事件,将其处置方案与处理时长等信息推送给作业人员,提高事件处置效率。
附图说明
[0028]图1是本专利技术一种基于文本向量化的故障停电抢修事中处置参考方法的流程示意图。
具体实施方式
[0029]为使本专利技术实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于文本向量化的故障停电抢修事中处置参考方法,其特征在于:包括如下步骤:步骤一:已处置故障停电事件及其处置方案数据获取:从生产管理系统配网抢修管控模块获取已处置故障停电事件描述文本及与已处置故障停电事件对应的抢修处置方案,所述已处置故障停电事件描述文本包含已处置故障停电事件的停电编号、停电类型、线路名称、停电原因、停电范围;步骤二:已处置故障停电事件描述文本预处理与分词:对已处置故障停电事件的关键描述文本信息,进行冗余信息、非法字符剔除预处理,结合Python的jieba内置的词典与停电地址要素库对停电原因、停电范围进行分词,整合后表示成已处置故障停电事件描述文本特征词集;步骤三:停电事件描述文本向量化表示:采用词频-逆文本频率指数算法(TF

IDF)将已处置故障停电事件描述文本特征词集转换成向量化形式,即生成已处置故障停电事件的描述文本向量;步骤四:停电事件描述文本语义相似度计算及处置方案推送:针对新增待处置故障停电事件,首先查询该设备历史故障停电事件记录,判断是否存在因同类原因导致故障重复发生,若存在则直接调取其历史处置方案并参考;若不存在,则采用余弦相似度计算新增待处置故障停电事件与已处置故障停电事件的描述文本向量的语义相似度,当相似度超过设定阈值时,将已处置故障停电事件所对应的处置方案推送给作业人员作为参考。2.如权利要求1所述的基于文本向量化的故障停电抢修事中处置参考方法,其特征在于:步骤三中词频-逆文本频率指数...

【专利技术属性】
技术研发人员:蔡德福周鲲鹏曹侃王文娜刘海光王莹饶渝泽陈汝斯叶畅余笑东王涛周楚闫秉科万黎陈永昕
申请(专利权)人:国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1