一种统一标准的试验数据结构体系的构建方法技术

技术编号:30022361 阅读:21 留言:0更新日期:2021-09-11 06:45
本发明专利技术公开了一种统一标准的试验数据结构体系的构建方法,该方法为:提取文本要素数据特征,结合并行计算技术,基于各类设备建立标准数据结构模型,形成数据标准体系,构建新的标准试验数据库。本发明专利技术基于统一标准的试验数据结构体系,提取要素数据特征,结合并行计算技术,基于各类设备建立标准数据结构模型,形成数据标准体系,构建新的标准试验数据库,为后续进行的智能数据诊断分析与策略制定提供充分的数据支撑。供充分的数据支撑。供充分的数据支撑。

【技术实现步骤摘要】
一种统一标准的试验数据结构体系的构建方法


[0001]本专利技术涉及试验数据结构构建
,具体涉及一种统一标准的试验数据结构体系的构建方法。

技术介绍

[0002]电力设备预防性试验是电力设备运行和维护工作中一个重要环节,是保证电力设备安全运行的有效手段之一。多年来,电力企业的高压电力设备基本上都是按照标准DL/T596—1996《电力设备预防性试验规程》的要求进行试验的,目前南网已发布最新新的《电力设备检修试验规程》CSG

2017006,它能够准确地诊断出电气设备的运行状况,对及时发现、诊断设备风险起到重要作用。
[0003]由于目前6+1生产管理系统的作业指导书模块可任意定制,并且省电网公司、地市局、班组各不相同,同时旧数据结构存储多样,与新的试验数据结构差异大,难以转换并统一,总体造成易录入难取出的问题。

技术实现思路

[0004]本专利技术要解决的技术问题是:提供一种统一标准的试验数据结构体系的构建方法,以解决现有技术中存在的技术问题。
[0005]本专利技术采取的技术方案为:一种统一标准的试验数据结构体系的构建方法,该方法为:提取文本要素数据特征,结合并行计算技术,基于各类设备建立标准数据结构模型,形成数据标准体系,构建新的标准试验数据库。
[0006]上述一种统一标准的试验数据结构体系的构建方法包括以下具体步骤:步骤1:从生产管理系统获取试验数据结构体系模型:梳理所有设备在做预防性试验相关的作业指导书,从生产系统获取梳理出来的作业指导书模板和预防性试验数据;步骤2:构建基于统一标准的试验数据结构体系模型:从生产系统获取的作业指导书模板和预防性试验数据,构成作业指导书模板;分析从生产系统获取的作业指导书模板,并根据实际需要对模板进行完善,形成统一标准模板;同时对于设备出厂交接的试验数据模板,从厂商获取(在做出厂交接试验的时候,厂商会有一个出厂交接试验word模板,同时模板中填写设备出厂交接试验数据)试验数据模板并在系统中生成交接试验版本模板,最终由作业指导书模板、统一标准模板和试验数据模板构建基于统一标准的试验数据结构体系模型。
[0007]步骤3:试验数据补录:对于外部系统缺失的试验数据需要在试验数据挖掘智能作业管控系统中进行补录,补录是在基于统一标准的试验数据结构体系模型中选择相应的作业指导书模板,根据已定制的模板在系统中实现试验数据补录功能。
[0008]上述文本数据特征提取方法为:从基于统一标准的试验数据机构体系模型中通过数据接口获取文本数据,采用文档频数特征选择算法技术,找到出现次数较多的字段,形成数据标准体系。
[0009]上述文档频数特征选择算法为:在训练文本集中对每个特征计算它的文档频数,若该项的DF 值小于某个阈值则将其删除,若其DF值大于某个阈值也将其去掉。
[0010]上述并行计算技术为:用多个处理器来协同求解同一问题,即将被求解的问题分解成若干个部分,各部分均由一个独立的处理机来并行计算。
[0011]本专利技术的有益效果:与现有技术相比,本专利技术基于统一标准的试验数据结构体系,提取要素数据特征,结合并行计算技术,基于各类设备建立标准数据结构模型,形成数据标准体系,构建新的标准试验数据库,为后续进行的智能数据诊断分析与策略制定提供充分的数据支撑。
附图说明
[0012]图1是本专利技术的流程图。
具体实施方式
[0013]下面结合具体的实施例对本专利技术进行进一步介绍。
[0014]实施例1:一种统一标准的试验数据结构体系的构建方法,该方法为:提取文本要素数据特征,结合并行计算技术,基于各类设备建立标准数据结构模型,形成数据标准体系,构建新的标准试验数据库。
[0015]上述一种统一标准的试验数据结构体系的构建方法包括以下具体步骤:步骤1:从生产管理系统获取试验数据结构体系模型:梳理所有设备在做预防性试验相关的作业指导书,从生产系统获取梳理出来的作业指导书模板和预防性试验数据;步骤2:构建基于统一标准的试验数据结构体系模型:从生产系统获取的作业指导书模板和预防性试验数据,构成作业指导书模板;分析从生产系统获取的作业指导书模板,并根据实际需要对模板进行完善,形成统一标准模板;同时对于设备出厂交接的试验数据模板,从厂商获取(在做出厂交接试验的时候,厂商会有一个出厂交接试验word模板,同时模板中填写设备出厂交接试验数据)试验数据模板并在系统中生成交接试验版本模板,最终由作业指导书模板、统一标准模板和试验数据模板构建基于统一标准的试验数据结构体系模型。
[0016]步骤3:试验数据补录:试验数据挖掘智能作业管控系统中的试验数据源头有两个:1)对于外部系统已经存在的试验数据直接通过接口从外部系统获取,主要包括从以前旧系统中一次性拿到历史试验数据,从生产系统中每天获取实时试验数据。
[0017]2)对于外部系统缺失的试验数据需要在试验数据挖掘智能作业管控系统中进行补录,补录是在基于统一标准的试验数据结构体系模型中选择相应的作业指导书模板,根据已定制的模板在系统中实现试验数据补录功能。
[0018]上述文本数据特征提取方法为:从基于统一标准的试验数据机构体系模型中通过数据接口获取文本数据,采用文档频数特征选择算法技术,找到出现次数较多的字段,形成数据标准体系。
[0019]文档频数(Document Frequency, DF)是最为简单的一种特征选择算法,它指的是在整个数据集中有多少个文本包含这个单词。在训练文本集中对每个特征计一算它的文档
频次,并且根据预先设定的阑值去除那些文档频次特别低和特别高的特征。文档频次通过在训练文档数量中计算线性近似复杂度来衡量巨大的文档集,计算复杂度较低,能够适用于任何语料,因此是特征降维的常用方法。
[0020] 在训练文本集中对每个特征计算它的文档频数,若该项的DF 值小于某个阈值则将其删除,若其DF值大于某个阈值也将其去掉。因为他们分别代表了“没有代表性”和“没有区分度”2 种极端的情况。DF 特征选取使稀有词要么不含有用信息,要么太少而不足以对分类产生影响,要么是噪音,所以可以删去。DF 的优点在于计算量很小,而在实际运用中却有很好的效果。缺点是稀有词可能在某一类文本中并不稀有,也可能包含着重要的判断信息,简单舍弃,可能影响分类器的精度。
[0021]文档频数最大的优势就是速度快,它的时间复杂度和文本数量成线性关系,所以非常适合于超大规模文本数据集的特征选择。不仅如此,文档频数还非常地高效,在有监督的特征选择应用中当删除90%单词的时候其性能与信息增益和x2 统计的性能还不相上下。DF 是最简单的特征项选取方法,而且该方法的计算复杂度低, 能够胜任大规模的分类任务。
[0022]但如果某一稀有词条主要出现在某类训练集中,却能很好地反映类别的特征,而因低于某个设定的阈值而滤除掉,这样就会对分类精度有一定的影响。
[0023]并行计算(Parallel Computing)是指同时使用多种计算本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种统一标准的试验数据结构体系的构建方法,其特征在于:该方法为:提取文本要素数据特征,结合并行计算技术,基于各类设备建立标准数据结构模型,形成数据标准体系,构建新的标准试验数据库。2.根据权利要求1所述的一种统一标准的试验数据结构体系的构建方法,其特征在于:该方法包括以下具体步骤:步骤1:从生产管理系统获取试验数据结构体系模型:梳理所有设备在做预防性试验相关的作业指导书,从生产系统获取梳理出来的作业指导书模板和预防性试验数据;步骤2:构建基于统一标准的试验数据结构体系模型:从生产系统获取的作业指导书模板和预防性试验数据,构成作业指导书模板;分析从生产系统获取的作业指导书模板,并根据实际需要对模板进行完善,形成统一标准模板;同时对于设备出厂交接的试验数据模板,从厂商获取试验数据模板并在系统中生成交接试验版本模板,最终由作业指导书模板、统一标准模板和试验数据模板构建基于统一标准的试验数据结构体系模型;步骤3:试验数据补录:对于外部系统缺失的试验数据需要在试验数据挖掘智能作业管控系统中进行补录,补录是在基于统一标准的试验数据结构体系模型中选择相应的作业指导书模板,根据已定制的模板在系统中实现试验数据补录功能。3.根据权利要求1所述的一种统一标准的试验数据结构体系的构建方法,其特征在于:文本数据特征提...

【专利技术属性】
技术研发人员:赵超文屹吕黔苏张迅王冕黄军凯范强陈沛龙李欣吴建蓉丁江桥
申请(专利权)人:贵州电网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1