一种分布式光伏运营工单数据采集分析方法技术

技术编号:38542922 阅读:43 留言:0更新日期:2023-08-19 17:10
本发明专利技术涉及数据处理技术领域,提出了一种分布式光伏运营工单数据采集分析方法,包括:获取每条工单数据的核心词汇和其他词汇;并获取工单数据不同工单类型的标注系数;根据工单数据中每个工单类型的核心词特征获取工单数据对工单类型的第一系数权重;在工单数据中找到核心词的描述词,根据核心词的描述词之间的特征获取核心词的第二系数权重;根据第一系数权重、第二系数权重,核心词数量以及工单类型的标注系数获取工单类型的修正标注系数;根据每个工单类型的修正标注系数完成分布式光伏运营工单数据的分析。本发明专利技术可以纠正工单类型、并增加运维活动的监测效率。并增加运维活动的监测效率。并增加运维活动的监测效率。

【技术实现步骤摘要】
一种分布式光伏运营工单数据采集分析方法


[0001]本专利技术涉及数据处理
,具体涉及一种分布式光伏运营工单数据采集分析方法。

技术介绍

[0002]随着智能电网建设的推进,其规划、运行和维护产生的数据量呈指数增长,这些海量的电力数据对生产、经营和安全运行起着重要作用。光伏运营工单数据是记录和管理光伏发电系统运维和维护过程中产生的相关工作任务和信息的数据。基于数据分析结果,可以进行故障诊断和趋势分析,找出系统的薄弱环节和常见故障模式,以制定相应的改进措施。当前大多数的工单数据并没有得到有效利用,由于其中大部分属于半结构化和非结构化的文本数据,很难被机器识别并利用,伴随各种新型光伏系统的并网,使电力运行的不确定性极大的提高,产生巨量的报修、投诉、查询、反馈、服务的工单数据。但由于人工和自动化设备报表存在一定误差,且实际运维情况存在复杂性,使得工单数据的标注类型与实际报表类型不符,造成工作效率的浪费和服务器调用负载,降低监测调整运维活动的效率。

技术实现思路

[0003]本专利技术提供一种分布式光伏运营工单数据采集分析方法,以本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种分布式光伏运营工单数据采集分析方法,其特征在于,该方法包括以下步骤:获取每条工单数据的核心词汇和其他词汇;获取每条工单数据的预设工单类型,并根据预设工单类型获取工单数据对于不同工单类型的标注系数;根据每条工单数据中每个工单类型的核心词的数量和字符长度获取工单数据对工单类型的第一系数权重;在每条工单数据中找到每个核心词的描述词,根据核心词的描述词之间的特征获取核心词的第二系数权重;根据工单数据对工单类型的第一系数权重、核心词的第二系数权重,每一个工单类型的核心词数量以及每个工单类型的标注系数获取每个工单类型的修正标注系数;根据每个工单类型的修正标注系数获取主要分类完成分布式光伏运营工单数据的分析。2.根据权利要求1所述的一种分布式光伏运营工单数据采集分析方法,其特征在于,所述获取每条工单数据的核心词汇和其他词汇的方法为:对每条工单数据使用结巴分词,得到核心词、助词、数字以及补充词,其中补充词是所有词性中除了核心词、助词、数字外的所有词汇。3.根据权利要求1所述的一种分布式光伏运营工单数据采集分析方法,其特征在于,所述根据每条工单数据中每个工单类型的核心词的数量和字符长度获取工单数据对工单类型的第一系数权重的方法为:将获取到的词汇中的助词记为无效词,除了助词之外的词汇统称为有效词,获取所有有效词的字符长度,根据每条工单数据中每个工单类型下对应的核心词数量与所有工单类型下对应的核心词数量的比值与每条工单数据中每个工单类型下对应的核心词的字符长度与有效词的字符长度的比值获取工单数据对工单类型的第一系数权重。4.根据权利要求3所述的一种分布式光伏运营工单数据采集分析方法,其特征在于,所述根据每条工单数据中每个工单类型下对应的核心词数量与所有工单类型下对应的核心词数量的比值与每条工单数据中每个工单类型下对应的核心词的字符长度与有效词的字符长度的比值获取工单数据对工单类型的第一系数权重的方法为:式中,表示第i条工单数据中第k个工单类型的核心词,表示第i条工单数据中第k个工单类型的核心词的数量,表示第i条工单数据中第k个工单类型中第c个核心词, 表示第i条工单数据中第k个工单类型中第c个核心词的字符长度,表示第i条工单数据中的无效词, 表示第i条工单数据中所有无效词的数量,表示第i条工单数据中的第j个无效词,表示第i条工单...

【专利技术属性】
技术研发人员:张佳祺周信行徐凌寒曹苾玥齐丹丹
申请(专利权)人:广东电网有限责任公司广州供电局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1