The invention discloses a method for selecting energy consumption characteristics of central air conditioning based on large data. The energy consumption operation data of central air conditioning are collected in advance and preprocessed. According to the pre-processed energy consumption data feature set, Boruta feature selection algorithm and lasso regression algorithm are used to create their own energy consumption feature subsets, and extract the important features affecting the research objectives. For two different kinds of methods, feature subsets are selected. Combining with expert opinions, feature fusion is carried out by using intersection classification method, and the final key features are obtained. The invention adopts two main methods of feature selection: lasso regression algorithm and boruta feature selection algorithm. The essential difference of the algorithm is obvious, which avoids the limitation of the single method, effectively solves the problem of large data redundancy, and reduces the complexity of the data model of central air conditioning energy consumption.
【技术实现步骤摘要】
一种基于大数据的中央空调能耗特征选择方法
本专利技术涉及中央空调节能研究的
,涉及大数据背景下的数据挖掘方法,具体涉及一种基于大数据的中央空调能耗特征选择方法。
技术介绍
进入21世纪以来,建筑自动化系统(buildingautomationsystem,BAS)为实施建筑系统性能诊断和优化提供了必需的信息技术平台。BAS中存储着庞大的建筑实际运行数据,但这些数据很少得到充分的利用。在中央空调系统运行能耗计量中,积累了大量高维的实时能耗数据,常规方法难以发现和总结这些数据蕴含的知识。数据挖掘作为一项新兴的多学科技术,使高非线性系统建模有了新的曙光,特别是数据挖掘技术在中央空调领域的应用研究也越来越多。在中央空调能耗研究中,其中重要一项是中央空调系统能耗特变量。目前,针对各个中央空调系统的不同,中央空调系统能耗因素也不同,缺乏一套普适的中央空调能耗特征选择方法。
技术实现思路
中央空调系统能耗特征变量研究中,能耗模型涉及多参数问题,包括外部参数和内部参数。建立一套可靠而普适的基于数据挖掘技术的中央空调能耗特征选框架,对运行节能策略意义重大。本专利技术提供一种基于大数据的中央空调能耗特征提取方法,减少大数据的冗余性,在常规能耗内部特征上加入外部特征,实现更精确的能耗特征模型。本专利技术通过下述技术方案实现:一种基于大数据的中央空调能耗特征选择方法,包括以下步骤:步骤一、采用专家意见对特征数据集进行初步筛选;步骤二、对经过初步筛选的特征数据集进行预处理;步骤三、基于预处理后的特征集,采用boruta特征选择算法提取新的特征子集1;步骤四、基于预处理后的特征集, ...
【技术保护点】
1.一种基于大数据的中央空调能耗特征选择方法,其特征在于,包括以下步骤:步骤一、采用专家意见对特征数据集进行初步筛选;步骤二、对经过初步筛选的特征数据集进行预处理;步骤三、基于预处理后的特征集,采用boruta特征选择算法提取新的特征子集1;步骤四、基于预处理后的特征集,采用lasso特征选择算法提取新的特征子集2;步骤五、基于步骤三得到的特征子集1和步骤四得到的特征子集2,结合专家意见,采用交集归类的方法得到中央空调能耗关键特征集合。
【技术特征摘要】
1.一种基于大数据的中央空调能耗特征选择方法,其特征在于,包括以下步骤:步骤一、采用专家意见对特征数据集进行初步筛选;步骤二、对经过初步筛选的特征数据集进行预处理;步骤三、基于预处理后的特征集,采用boruta特征选择算法提取新的特征子集1;步骤四、基于预处理后的特征集,采用lasso特征选择算法提取新的特征子集2;步骤五、基于步骤三得到的特征子集1和步骤四得到的特征子集2,结合专家意见,采用交集归类的方法得到中央空调能耗关键特征集合。2.根据权利要求1所述的一种基于大数据的中央空调能耗特征选择方法,其特征在于,所述步骤二的预处理具体包括以下步骤:步骤2.1,设定约束范围,剔除异常值;步骤2.2,使用决策树得到系统稳定条件下的运行数据;步骤2.3,间隔5分钟取数据均值,去掉重复点;步骤2.4,合并数据,并进行数据扩增;步骤2...
【专利技术属性】
技术研发人员:李碧军,史翔,何彬,陈耕,
申请(专利权)人:四川泰立智汇科技有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。