一种配网抢修时长预测方法技术

技术编号:25638545 阅读:33 留言:0更新日期:2020-09-15 21:30
本发明专利技术涉及一种配网抢修时长预测方法,其包括如下步骤:引入客户报修诉求工单文本信息并进行数据预处理,将工单文本中的非结构化数据转换为结构化数据,并通过朴素贝叶斯模型进行分类,筛选真实故障报修工单;依据筛选故障报修工单,获取对应配网抢修数据建立聚类细分模型,确定不同类别的标杆时长区间,划分故障紧急等级;结合用户基本信息,根据细分结果,结合故障发生当日的气象因素建立GBDT回归预测模型,预测新上报抢修工作时长;本发明专利技术整个分析过程无需大量人员参与,节约人力财力的同时利用文本挖掘技术将抢修单、投诉工单进行分类,筛选故障报修信息,提高了分析结果的准确性。

【技术实现步骤摘要】
一种配网抢修时长预测方法
本专利技术属于配电网领域,具体涉及一种配网抢修时长预测方法。
技术介绍
配网故障的发生严重影响电网公司供电可靠性,凭借现有方法能够有效降低故障发生率,但是还不能达到完全避免配网故障的水平。因此,如何提高故障抢修效率引起越来越多的关注,成为急需解决的问题。现有提升配网抢修效率的方法主要从故障抢修效益、配网自动化、故障应急预案等方面进行研究,对配网抢修时长的研究尚少。但是,配网抢修时长对提高抢修效率起着极其重要的作用,因此,本专利技术提出一种配网故障抢修时长预警方法。
技术实现思路
本专利技术所要解决的技术问题是提供一种配网抢修时长预测方法,以解决当前配网抢修作业效率不高、复电时间不明确,电力用户对电网供电满意度不高的问题,构建基于配网抢修时长的抢修效率提升方法。本专利技术所采用的技术方案是:一种配网抢修时长预测方法,其包括如下步骤:(1)引入客户报修诉求工单文本信息并进行数据预处理,将工单文本中的非结构化数据转换为结构化数据,并通过朴素贝叶斯模型进行分类,筛选真实故障报修工单;(2)依据筛选故障报修工单,获取对应配网抢修数据建立聚类细分模型,确定不同类别的标杆时长区间,划分故障紧急等级;(3)结合用户基本信息,根据细分结果,结合故障发生当日的气象因素建立GBDT回归预测模型,预测新上报抢修工作时长。进一步的,所述客户报修诉求工单文本信息来源于95598系统受理用户的故障报修单。进一步的,配网抢修数据的因素包括一级分类、二级分类、三级分类、派工用时、到达现场用时、工单处理时长以及抢修总时长。进一步的,所述数据预处理基于文本分词的标点符号处理、同义词处理以及停用词处理。进一步的,利用自然语言处理技术,将工单文本中的非结构化数据转换为结构化数据,所述自然语言技术是基于分词结果,依据工单--主题--分词关系,通过训练生成倾向于同时出现在多个同类型工单文档中的主题,以便进行下一步文本分类。进一步的,所述朴素贝叶斯模型基于客户工单的主题计算该工单为某一主题内容的概率,通过选定的朴素贝叶斯算法构建分类模型,最终实现给定投诉工单的自动分类。进一步的,所述聚类细分模型是基于kmeans的快速聚类,随机选取K个对象作为初始的聚类中心,计算每个对象与各个种子聚类中心之间的距离,并把每个对象分配给距离它最近的聚类中心,如此迭代,直至各类中心不发生变化。进一步的,所述标杆时长区间是分类模型结果中不同故障类别中的置信区间。进一步的,所述用户基本信息包括用户姓名以及通信联系方式,主要用于及时反馈预测停送电信息。进一步的,所述GBDT回归预测模型通过迭代预测上次预测值和实际值的残差,构建多个弱学习器CART树,要求模型预测的样本损失尽可能的小,最后结果即是所有预测值之和。本专利技术的积极效果为:1、本专利技术整个分析过程无需大量人员参与,节约人力财力的同时利用文本挖掘技术将抢修单、投诉工单进行分类,筛选故障报修信息,提高了分析结果的准确性。2、本专利技术融合了95598、用采系统以及降雨量、湿度、温度等外部数据,打破数据专业孤岛,使得海量数据得到了有效利用。3、现有提升配网抢修效率的方法主要从故障抢修效益、配网自动化、故障应急预案等方面进行研究,对配网抢修时长的研究尚少。但是,配网抢修时长对提高抢修效率起着极其重要的作用,本专利技术从该角度对配网抢修效率提升提出新的方法。4、本专利技术配网报修工单进行处理时,制定不同类型的抢修作业设定抢修标杆时长,对比各类抢修作业理论抢修时长,优先抢修时间短的抢修作业,提升配网抢修作业整体效率。5、本专利技术将预测抢修作业时长通过通讯方式提供给电力客户,提高了配网抢修透明度,与传统抢修作业相对,提高了客户满意度。附图说明图1为本专利技术文本数据预处理流程图;图2为本专利技术实施例工单分词示例表;图3为本专利技术实施例轮廓系数随K的变化图;图4为本专利技术实施例配网抢修时长真实值与预测值结果对比图;图5为本专利技术配网抢修预测短信示意图。具体实施方式本专利技术基于用户报修抢修工单文本数据与配网抢修时长数据,提出了一种配网抢修时长预测方法。本专利技术首先获取95598系统中的报修单数据,利用LDA主题模型自然语言处理技术实现抢修单文本的快速分类,并筛选故障报修类工单,减轻人工分类的工作量;然后结合配网抢修数据,建立聚类细分模型,细分故障紧急等级,确定不同类别的标杆时长区间,优先抢修标杆时长短的报修工单,优化配网抢修顺序,并对超过该类配网抢修标杆时长的作业进行超时预警,提高故障抢修效率;最后利用用户基本信息,根据细分结果,结合故障发生当日的温度、湿度、降水量等气象因素建立GBDT回归预测模型,预测新上报抢修工作时长,及时为用户提供抢修进度及停送电信息,保证抢修情况的透明度,提升客户满意度。进一步的,所述客户报修诉求工单文本信息来源于95598系统受理用户的故障报修单,对客户的报修诉求内容主题内容及迫切程度,进行分析汇总,提取出有用的数据,反映真实的客户报修诉求信息。进一步的,所述配网抢修数据主要反映了改抢修工作的基本状况,包括一级分类、二级分类、三级分类、派工用时、到达现场用时、工单处理时长、抢修总时长等特征。进一步的,所述数据预处理是基于文本数据的分词,其步骤为:Step1:引入95598客户系统中的抢修工单;Step2:利用电力词库,将工单语句分词,变为多个词的组合;Step3:利用停用词库,将词组合中的大量语气词,符号,无意义生词去掉;Step4:利用同义词词库,将意思相似的词语合并为一个,最终导出分词结果。进一步的,所述自然语言技术是基于分词结果,依据TF-IDF是一种常用的加权技术,用于反映某个词或短句在某篇文档的重要性。思想是如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类,其计算公式为:TF-IDF=TF(x)*IDF(x)其中:count(x)表示词x在文本中的个数,count表示该文本总的分词个数。N代表语料库中文本的总数,而N(x)代表语料库中包含词x的文本总数。进一步的,所述朴素贝叶斯模型基于客户工单的主题计算该工单为某一主题内容的概率,通过选定的朴素贝叶斯算法构建分类模型,最终实现给定投诉工单的自动分类,以便进行工单筛选,其步骤在于:Step1:建立分类标签集合,本专利技术中分类标签有12项y1,y2,...,y12,如频繁停电、电器损坏、短消息订阅、供电质量等。Step2:计算各抢修单对应于各分类标签y1的概率P(y1|x)。P(y1|x)=P(y1|x1)+P(y1|x2)+...+P(y1|xi)其中P(y1|xi):抢修单内第i个分词对应第一类分类标签的概率,表示为概率即为分词的特征属性本文档来自技高网...

【技术保护点】
1.一种配网抢修时长预测方法,其特征在于其包括如下步骤:/n引入客户报修诉求工单文本信息并进行数据预处理,将工单文本中的非结构化数据转换为结构化数据,并通过朴素贝叶斯模型进行分类,筛选真实故障报修工单;/n依据筛选故障报修工单,获取对应配网抢修数据建立聚类细分模型,确定不同类别的标杆时长区间,划分故障紧急等级;/n结合用户基本信息,根据细分结果,结合故障发生当日的气象因素建立GBDT回归预测模型,预测新上报抢修工作时长。/n

【技术特征摘要】
1.一种配网抢修时长预测方法,其特征在于其包括如下步骤:
引入客户报修诉求工单文本信息并进行数据预处理,将工单文本中的非结构化数据转换为结构化数据,并通过朴素贝叶斯模型进行分类,筛选真实故障报修工单;
依据筛选故障报修工单,获取对应配网抢修数据建立聚类细分模型,确定不同类别的标杆时长区间,划分故障紧急等级;
结合用户基本信息,根据细分结果,结合故障发生当日的气象因素建立GBDT回归预测模型,预测新上报抢修工作时长。


2.根据权利要求1所述的一种配网抢修时长预测方法,其特征在于所述客户报修诉求工单文本信息来源于95598系统受理用户的故障报修单。


3.根据权利要求1所述的一种配网抢修时长预测方法,其特征在于配网抢修数据的因素包括一级分类、二级分类、三级分类、派工用时、到达现场用时、工单处理时长以及抢修总时长。


4.根据权利要求1所述的一种配网抢修时长预测方法,其特征在于所述数据预处理基于文本分词的标点符号处理、同义词处理以及停用词处理。


5.根据权利要求1所述的一种配网抢修时长预测方法,其特征在于利用自然语言处理技术,将工单文本中的非结构化数据转换为结构化数据,所述自然语言技术是基于分词结果,依据工单--主题--分...

【专利技术属性】
技术研发人员:李翀付文杰刘林青段子荷李梦宇李杰琳
申请(专利权)人:国网河北省电力有限公司电力科学研究院国网河北能源技术服务有限公司国家电网有限公司
类型:发明
国别省市:河北;13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1