【技术实现步骤摘要】
基于支持向量机和深度强化学习的建筑空调温度控制方法
[0001]本专利技术属于建筑智能控制领域,具体涉及一种基于支持向量机和深度强化学习的建筑空调温度控制方法。
技术介绍
[0002]目前,大型建筑的室内温度的智能控制方法通常考虑用户舒适度等用户体验反馈情况,并作为室内最优温度求解模型的影响因素之一,如公开号为CN115574440A的中国专利技术申请“基于监控视频数据的高校教学楼暖通空调智能调控方法”先确定基于学生群体平均热舒适度的室内最佳温度后,进行教室暖通空调实时智能调控。然而,用户舒适度等用户体验反馈具有实时性,且室内最佳温度的最优化模型通常具有较高复杂度,实时求解室内最佳温度的最优化模型具有难度。因此,现有技术的将用户舒适度等用户反馈的控制与室内最佳温度的求解混为一谈的温度控制方法影响了实时性,不能实时的根据用户反馈对温度控制过程进行即时调整,限制了用户体验度的提高。
[0003]强化学习(Reinforcement Learning,RL),通过智能体(Agent)与动态、未知环境交互,并获得最大回报的一类在线学习方法,强化学习中的Q
‑
Learning方法通过借助采样得到的数据进行策略评估与策略改进,从而使得智能体学到最佳策略,但Q
‑
Learning基于查询表更新值,计算复杂度会随着状态空间的维度增加而增大。因此考虑引入神经网络来摆脱维度灾问题。深度学习具有较强的感知能力,但是缺乏一定的决策能力。而强化学习具有决策能力,但对感知问题没有太好的效果。
...
【技术保护点】
【技术特征摘要】
1.基于支持向量机和深度强化学习的建筑空调温度控制方法,其特征在于,包括以下步骤:步骤1:分析确定影响空调温度控制效果的影响因素;步骤2:根据空调温控的影响因素,采集建筑空调温控的样本数据;步骤3:采用支持向量机,建立建筑空调最佳设定温度即空调最优控制温度的预测模型,并求解得到各种不同的建筑室内温度调控情形下的空调最优控制温度;步骤3.1:利用支持向量机寻找超平面,对建筑空调温控的样本数据进行分割,分割的原则是使超平面分割后的样本集合的间隔最大化;步骤3.2:采取核函数法,将建筑空调温控的样本数据从原始空间映射到高维空间,使得样本在高维空间中线性可分;步骤3.3:将空调最优控制温度的求解问题作为多分类问题求解,设针对各种不同的建筑室内温度调控情形总共有M个空调最优控制温度,则需要利用支持向量机进行M
‑
1次分类,即进行M
‑
1次求解n维最优化问题,n表示空调温度控制样本参数的维度;步骤4:建立建筑空调温度控制过程的状态空间,将建筑空调温度控制过程分解为温控控制过程的前、后时刻的状态迁移,针对当前状态设定空调温度即为当前状态的动作,并对不同时刻的状态下采取的动作建立奖励函数即动作价值,利用神经网络建模得到动作价值,训练得到最优的神经网络的权重及偏置参数,最大化奖励函数;步骤5:采用步骤4得到的状态空间和动作的奖励函数,结合步骤3得到的各种不同的建筑室内温度调控情形下的空调最优控制温度,启动空调,对建筑室内温度进行实时调控。2.根据权利要求1所述的建筑空调温度控制方法,其特征在于,步骤3.2中,核函数计算式如下:K(x,x')=<φ(x),φ(x')>式中φ(x)、φ(x')分别表示样本数据x、x'映射到高维空间后的特征向量;K(x,x')表示样本数据x、x'的核函数值。3.根据权利要求2所述的建筑空调温度控制方法,其特征在于,步骤3中,结合步骤3.2引入的核函数,得到最优化模型如下:引入的核函数,得到最优化模型如下:0≤α
i
≤Ci=1,
…
,l式中x
i
代表输入变量,其分量为对应特征及属性,在此代表空调温控的影响因素,y
i
为输出指标,即对应数据所属的类别,l表示样本数,向量α=(α1,α2,
…
,α
n
)为拉格朗日乘子且α
i
≥0;C为正常量用于对拉格朗日乘子的约束;求解上述二次规划问题,可得最优解α
*
,则有
式中ω
*
,b
*
为所求分类超平面的参数;进一步构造决策函数,实现输入样本的分类,f(x)=sgn(ω
*
x+b
*
)式中f(x)表示决策函数,sgn()为符号函数,输出样本的类别。4.根据权利要求3所述的建筑空调温度控制方法,其特征在于,步骤4中,针对预测得到的...
【专利技术属性】
技术研发人员:赵璐,许磊磊,殷超,孙浩,黎晖,彭杰涛,李坤,龚清,张志鹏,刘文洲,程亮,刘艳,汤立坤,陈科,付茂源,李明翔,马朝科,吕建国,
申请(专利权)人:中交武汉智行国际工程咨询有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。