基于Q学习的智能楼宇温度控制方法技术

技术编号：13516892 阅读：42 留言：0更新日期：2016-08-12 05:03

本发明专利技术公开了一种基于Q学习的智能楼宇温度控制方法，包括：相关参数初始化；开启全局迭代，初始化评价网络权值；开启局部迭代，利用Q学习算法训练评价网络，修正网络权值，其中评价网络用来近似最优性能指标函数，并利用该评价网络权值评测当前温度控制系统的性能，通过执行流程选择最优控制策略，最小化一次全局迭代的总成本；判断当前局部迭代是否完成，若否，则返回局部迭代，否则更新迭代性能指标函数和控制律，以获得最优解；判断当前全局迭代是否满足收敛精度，若否，则返回全局迭代，否则根据最优性能指标函数获得最优控制策略，并计算总成本。由此，本发明专利技术可以不断地学习、调整和适应外界环境在未来的不确定的变化以提高系统的性能。

全部详细技术资料下载

【技术实现步骤摘要】
201610221709

【技术保护点】
一种基于Q学习的智能楼宇温度控制方法，其特征在于，所述方法包括：S1：初始化参数；S2：进行全局迭代，根据迭代控制序列更新迭代性能指标函数，以获得最优性能指标函数；S3：进行局部迭代，利用Q学习算法训练评价网络，修正所述评价网络的权值，并利用所述最优性能指标函数得到最优控制策略；S4：判断当前局部迭代是否完成，如果尚未完成，则返回局部迭代步骤，否则更新迭代性能指标函数和控制律，以获得最优性能指标函数；S5：判断当前全局迭代是否满足收敛精度，如果满足收敛精度，根据最优性能指标函数获得最优控制策略，并计算总成本。

【技术特征摘要】

【专利技术属性】
技术研发人员：魏庆来，李本凯，刘德荣，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人