一种控制的方法及设备技术

技术编号：21372766 阅读：24 留言：0更新日期：2019-06-15 11:59

本发明专利技术公开了一种控制的方法及设备，涉及设备节能技术领域，用以解决现有技术中对空调等设备的节能控制不精准，且不能同时保证空调运行的节能和服务质量均衡的问题，本发明专利技术方法包括：根据设备当前运行环境，确定设备当前运行状态的当前运行状态参考值，将所述当前运行状态参考值输入通过Q深度学习构建的节能调控模型，所述节能调控模型用于根据当前运行状态参考值预测当前运行状态下，设备执行下一个不同的动作对应的Q值，并输出最大Q值对应的动作，所述动作包括控制对象和控制参数，确定所述节能调控模型输出的动作为下一个动作，并控制所述设备在执行完当前动作后，执行所述确定的下一个动作。

全部详细技术资料下载

【技术实现步骤摘要】
一种控制的方法及设备
本专利技术涉及设备节能
，特别涉及一种控制的方法及设备。
技术介绍
目前，空调已成为家庭或公共场所中不可或缺的改善内部环境质量的设备，但同时空调也是耗能较大的设备之一，现有空调节能控制主要在控制理论中对个别控制参数进行范围划定控制，控制较为粗糙，随着人工智能技术的发展，越来越多的设备中应用了智能算法对大规模数据进行分析从而实现精确控制。但目前在空调节能方面，如何通过对大规模数据进行分析实现精确的节能控制成为本领域急需解决的问题。
技术实现思路
本专利技术提供一种控制的方法及设备，用以解决现有技术中对空调等设备的节能控制不精准，且不能同时保证空调运行的节能和服务质量均衡的问题。第一方面，本专利技术实施例提供的一种设备控制的方法，该方法包括：根据设备当前运行环境，确定设备当前运行状态的当前运行状态参考值；将所述当前运行状态参考值输入通过Q深度学习构建的节能调控模型，所述节能调控模型用于根据当前运行状态参考值预测当前运行状态下，设备执行下一个不同的动作对应的Q值，并输出最大Q值对应的动作，所述动作包括控制对象和控制参数；确定所述节能调控模型输出的动作为下一个动作，并控制所述设备在执行完当前动作后，执行所述确定的下一个动作。上述方法中，根据设备的当前运行状态参考值，利用构建好的节能调控模型以及贪心算法，为上述设备选择执行效果最好的下一个动作执行，能实现满足设定要求(如设备节能，设备运行效带来的益最佳等)的对设备的精准的控制。在一种可选的实现方式中，通过Q深度学习构建的节能调控模型，包括：构建第一网络模型和第二网络模型，并随机初始化第一网络模...

【技术保护点】
1.一种设备控制的方法，其特征在于，该方法包括：根据设备当前运行环境，确定设备当前运行状态的当前运行状态参考值；将所述当前运行状态参考值输入通过Q深度学习构建的节能调控模型，所述节能调控模型用于根据当前运行状态参考值预测当前运行状态下，设备执行下一个不同的动作对应的Q值，并输出最大Q值对应的动作，所述动作包括控制对象和控制参数；确定所述节能调控模型输出的动作为下一个动作，并控制所述设备在执行完当前动作后，执行所述确定的下一个动作。

【技术特征摘要】
1.一种设备控制的方法，其特征在于，该方法包括：根据设备当前运行环境，确定设备当前运行状态的当前运行状态参考值；将所述当前运行状态参考值输入通过Q深度学习构建的节能调控模型，所述节能调控模型用于根据当前运行状态参考值预测当前运行状态下，设备执行下一个不同的动作对应的Q值，并输出最大Q值对应的动作，所述动作包括控制对象和控制参数；确定所述节能调控模型输出的动作为下一个动作，并控制所述设备在执行完当前动作后，执行所述确定的下一个动作。2.如权利要求1所述的方法，其特征在于，通过Q深度学习构建的节能调控模型，包括：构建第一网络模型和第二网络模型，并随机初始化第一网络模型和第二网络模型的模型参数；触发获取样本数据时，获取设备的当前运行状态参考值并输入到第一网络模型，确定第一网络模型输出的最大Q值对应的动作为下一个动作，确定设备执行当前动作结束时，根据设备的运行环境确定所述设备的下一个运行状态及对应的下一个运行状态参考值，并根据预设方法获得所述设备执行所述当前动作获得的奖励，同时将所述当前运行状态参考值、下一个运行状态参考值、下一个动作、奖励作为一条样本数据存入样本数据集，并判断获取的样本数据量是否达到预设条数，若是，结束样本数据的获取，否则，将下一运行状态参考值作为当前运行状态参考值，重新触发获取样本数据；根据所述样本数据集，基于第一网络模型和第二网络模型生成节能调控模型。3.如权利要求2所述的方法，其特征在于，根据所述样本数据集，基于第一网络模型和第二网络模型生成节能调控模型，包括：确定触发模型参数更新时，从所述样本数据集中选取第一预设数量的样本数据，将每条样本数据的当前运行状态参考值输入第一网络模型，将对应的下一个运行状态参考值输入第二网络模型；根据第一网络模型和第二网络模型输出的最大Q值的差值以及样本数据集中的奖励，更新所述第一网络模型的模型参数；确定第一网络模型的模型参数更新次数未达到第一预设次数时，重新触发模型参数更新，否则，将第二网络模型的模型参数更新为第一网络模型的模型参数，并判断第二网络的模型参数更新次数是否达到第二预设次数；确定第二网络模型的模型参数更新次数达到第二预设次数时，将所述第二网络模型作为所述节能调控模型，否则，重新触发获取样本数据。4.如权利要求3所述的方法，其特征在于，根据第一网络模...

【专利技术属性】
技术研发人员：谭建明，李绍斌，宋德超，陈翀，罗晓宇，岳冬，王鹏飞，肖文轩，邓家璧，
申请(专利权)人：珠海格力电器股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人