基于Q学习的智能楼宇温度控制方法技术

技术编号:13516892 阅读:42 留言:0更新日期:2016-08-12 05:03
本发明专利技术公开了一种基于Q学习的智能楼宇温度控制方法,包括:相关参数初始化;开启全局迭代,初始化评价网络权值;开启局部迭代,利用Q学习算法训练评价网络,修正网络权值,其中评价网络用来近似最优性能指标函数,并利用该评价网络权值评测当前温度控制系统的性能,通过执行流程选择最优控制策略,最小化一次全局迭代的总成本;判断当前局部迭代是否完成,若否,则返回局部迭代,否则更新迭代性能指标函数和控制律,以获得最优解;判断当前全局迭代是否满足收敛精度,若否,则返回全局迭代,否则根据最优性能指标函数获得最优控制策略,并计算总成本。由此,本发明专利技术可以不断地学习、调整和适应外界环境在未来的不确定的变化以提高系统的性能。

【技术实现步骤摘要】
201610221709

【技术保护点】
一种基于Q学习的智能楼宇温度控制方法,其特征在于,所述方法包括:S1:初始化参数;S2:进行全局迭代,根据迭代控制序列更新迭代性能指标函数,以获得最优性能指标函数;S3:进行局部迭代,利用Q学习算法训练评价网络,修正所述评价网络的权值,并利用所述最优性能指标函数得到最优控制策略;S4:判断当前局部迭代是否完成,如果尚未完成,则返回局部迭代步骤,否则更新迭代性能指标函数和控制律,以获得最优性能指标函数;S5:判断当前全局迭代是否满足收敛精度,如果满足收敛精度,根据最优性能指标函数获得最优控制策略,并计算总成本。

【技术特征摘要】

【专利技术属性】
技术研发人员:魏庆来李本凯刘德荣
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1