【技术实现步骤摘要】
本专利技术属于数据预处理,具体涉及一种发电领域时序数据清洗方法、系统、介质及设备。
技术介绍
1、随着发电领域数字化的飞速发展,时序数据分析应用在发电领域具备了客观基础。数据集作为数据分析的基础,直接决定了数据分析的准确性和有效性,然而受电力设备故障、信息传输中断和异常信号干扰等因素影响,采集到的时序数据会出现一定的异常值和缺失值。缺失或失真的时序数据会造成数据的统计特征和分布特征发生变化,使数据的可信区间增大、置信度降低,导致后期针对发电时序数据的分析应用精准度存在偏差,因此需要对发电领域时序数据进行清洗,补全缺失数据,为后续的数据分析应用提供基础。
2、大数据时代,数据质量成为关键因素,而在工业领域的检测数据中,大部分是时序数据,因此对时序数据的高效管理是提高各领域生产效率的关键。时序数据的管理中,需要对时序数据进行清洗,以确保数据分析的准确性和决策有效性。目前对时序数据进行清洗的方式通常是通过单一清洗策略进行清洗。然而,由于时序数据的类型众多,通过单一清洗策略的清洗方式,会导致时序数据的清洗的适用度降低。
...
【技术保护点】
1.一种发电领域时序数据清洗方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的发电领域时序数据清洗方法,其特征在于,时序数据集的特征向量Feature具体为:
3.根据权利要求1所述的发电领域时序数据清洗方法,其特征在于,使用孤立森林算法进行异常值检测并将异常值标记为缺失值。
4.根据权利要求3所述的发电领域时序数据清洗方法,其特征在于,异常值检测具体为:
5.根据权利要求4所述的发电领域时序数据清洗方法,其特征在于,异常数据分数s(x,ψ)计算如下:
6.根据权利要求1所述的发电领域时序数据清洗方法
...【技术特征摘要】
1.一种发电领域时序数据清洗方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的发电领域时序数据清洗方法,其特征在于,时序数据集的特征向量feature具体为:
3.根据权利要求1所述的发电领域时序数据清洗方法,其特征在于,使用孤立森林算法进行异常值检测并将异常值标记为缺失值。
4.根据权利要求3所述的发电领域时序数据清洗方法,其特征在于,异常值检测具体为:
5.根据权利要求4所述的发电领域时序数据清洗方法,其特征在于,异常数据分数s(x,ψ)计算如下:
<...【专利技术属性】
技术研发人员:邓楷文,王毅,庞武华,王智微,陈丰,肖勇,
申请(专利权)人:西安热工研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。