【技术实现步骤摘要】
基于同策蒙特卡罗算法的室内环境舒适度改善方法
本专利技术属于室内环境改善领域,尤其涉及一种基于同策蒙特卡罗算法的室内环境舒适度改善方法。
技术介绍
室内环境对人体的舒适度有着决定性作用,经济发展和生活水平不断提高使得室内环境问题日益突出。据国内外学者研究发现,若室内环境质量得以改善,其室内工作人员的效率将提高15%~20%。而在室内环境中,室内的热湿环境、光环境和空气品质对人的影响尤为突出。因此通过对室内设备进行调节控制提高室内热湿环境、光环境和空气品质也就意味着提高了在室人员的舒适度。在研究控制建筑内相关系统时,常见的方法如模糊控制、PID控制等。这些传统方法在控制较为复杂的系统或多个被控对象时存在收敛速度慢或者收敛性能较差等缺点。
技术实现思路
本专利技术提出了一种基于同策蒙特卡罗(on-policymontecarlo,OMC)算法的控制器,用于控制建筑内的相关设备。在提供室内人员最基本环境需求的同时提高室内环境舒适度,蒙特卡罗算法是强化学习里的一种算法,通过状态和动作得到奖赏值从而评估策略 ...
【技术保护点】
1.一种基于同策蒙特卡罗算法的室内环境舒适度改善方法,其特征在于,包括如下步骤:/nS1、建立奖赏函数以及状态转移函数;/nS2、初始化动作值函数Q(s
【技术特征摘要】
1.一种基于同策蒙特卡罗算法的室内环境舒适度改善方法,其特征在于,包括如下步骤:
S1、建立奖赏函数以及状态转移函数;
S2、初始化动作值函数Q(st,at)、学习率α和折扣率γ,其中s是状态参数,由室内温度Tr、室内二氧化碳浓度ρt、室内照度It、室内湿度Ht和实时能耗Et构成;a是动作参数,由空调系统动作、照明系统动作、加湿器和除湿器动作和通风系统动作构成;
S3、对于每个情节,设置情节的参数包括N=4000个单位时间步,令t=0,也就是使各个状态和动作性参数保持初始状态;
S4、在每个情节中每个时间步的运行包括对当前状态st,计算出在该时刻下动作因素at;当采取这个时刻的动作时,根据建立的状态转移函数计算该状态的转移情况,得出下一刻相应的状态st+1;然后根据上述建立的奖赏函数公式,计算出在当前状态st和动作因素at下的奖赏值rt;
S5、判断终止条件:对观察所有状态因素下的动作值函数的值判断是否是预设值,若不满足则返回到步骤S3进行新的情节的运行,若满足则结束循环。
2.根据权利要求1所述的基于同策蒙特卡罗算法的室内环境舒适度改善方法,其特征在于,在步骤S1中:建立奖赏函数如公式(1)~(5)、状态转移函数如公式(6)~(10):
r=-ω1(T)-ω2(h)-ω3(I)-ω4(CO2)(5)
T(t+1)=T(t)-[(-1)AC/2×Tc×(1-0.2×VS)](6)
h(t+1)=h(t)+0.1×H-0.1×DH(8)
ρ(t+1)=ρ(t)-0.2×VS(9)
I(t+1)=I(t)+(-1)L%2×0.1×L(10);
其中,环境状态s=[T1,h1,ρ1,I1]这几个参数组成,见式(1)到式(5);
在式(1)中,Ts是设置的最舒适温度,Tm...
【专利技术属性】
技术研发人员:涂春光,
申请(专利权)人:深圳市建滔科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。