【技术实现步骤摘要】
201610221709
【技术保护点】
一种基于Q学习的智能楼宇温度控制方法,其特征在于,所述方法包括:S1:初始化参数;S2:进行全局迭代,根据迭代控制序列更新迭代性能指标函数,以获得最优性能指标函数;S3:进行局部迭代,利用Q学习算法训练评价网络,修正所述评价网络的权值,并利用所述最优性能指标函数得到最优控制策略;S4:判断当前局部迭代是否完成,如果尚未完成,则返回局部迭代步骤,否则更新迭代性能指标函数和控制律,以获得最优性能指标函数;S5:判断当前全局迭代是否满足收敛精度,如果满足收敛精度,根据最优性能指标函数获得最优控制策略,并计算总成本。
【技术特征摘要】
【专利技术属性】
技术研发人员:魏庆来,李本凯,刘德荣,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。