一种控制的方法及设备技术

技术编号:21372766 阅读:24 留言:0更新日期:2019-06-15 11:59
本发明专利技术公开了一种控制的方法及设备,涉及设备节能技术领域,用以解决现有技术中对空调等设备的节能控制不精准,且不能同时保证空调运行的节能和服务质量均衡的问题,本发明专利技术方法包括:根据设备当前运行环境,确定设备当前运行状态的当前运行状态参考值,将所述当前运行状态参考值输入通过Q深度学习构建的节能调控模型,所述节能调控模型用于根据当前运行状态参考值预测当前运行状态下,设备执行下一个不同的动作对应的Q值,并输出最大Q值对应的动作,所述动作包括控制对象和控制参数,确定所述节能调控模型输出的动作为下一个动作,并控制所述设备在执行完当前动作后,执行所述确定的下一个动作。

【技术实现步骤摘要】
一种控制的方法及设备
本专利技术涉及设备节能
,特别涉及一种控制的方法及设备。
技术介绍
目前,空调已成为家庭或公共场所中不可或缺的改善内部环境质量的设备,但同时空调也是耗能较大的设备之一,现有空调节能控制主要在控制理论中对个别控制参数进行范围划定控制,控制较为粗糙,随着人工智能技术的发展,越来越多的设备中应用了智能算法对大规模数据进行分析从而实现精确控制。但目前在空调节能方面,如何通过对大规模数据进行分析实现精确的节能控制成为本领域急需解决的问题。
技术实现思路
本专利技术提供一种控制的方法及设备,用以解决现有技术中对空调等设备的节能控制不精准,且不能同时保证空调运行的节能和服务质量均衡的问题。第一方面,本专利技术实施例提供的一种设备控制的方法,该方法包括:根据设备当前运行环境,确定设备当前运行状态的当前运行状态参考值;将所述当前运行状态参考值输入通过Q深度学习构建的节能调控模型,所述节能调控模型用于根据当前运行状态参考值预测当前运行状态下,设备执行下一个不同的动作对应的Q值,并输出最大Q值对应的动作,所述动作包括控制对象和控制参数;确定所述节能调控模型输出的动作为下一个动作,并控制所述设备在执行完当前动作后,执行所述确定的下一个动作。上述方法中,根据设备的当前运行状态参考值,利用构建好的节能调控模型以及贪心算法,为上述设备选择执行效果最好的下一个动作执行,能实现满足设定要求(如设备节能,设备运行效带来的益最佳等)的对设备的精准的控制。在一种可选的实现方式中,通过Q深度学习构建的节能调控模型,包括:构建第一网络模型和第二网络模型,并随机初始化第一网络模型和第二网络模型的模型参数;触发获取样本数据时,获取设备的当前运行状态参考值并输入到第一网络模型,确定第一网络模型输出的最大Q值对应的动作为下一个动作,确定设备执行当前动作结束时,根据设备的运行环境确定所述设备的下一个运行状态及对应的下一个运行状态参考值,并根据预设方法获得所述设备执行所述当前动作获得的奖励,同时将所述当前运行状态参考值、下一个运行状态参考值、下一个动作、奖励作为一条样本数据存入样本数据集,并判断获取的样本数据量是否达到预设条数,若是,结束样本数据的获取,否则,将下一运行状态参考值作为当前运行状态参考值,重新触发获取样本数据;根据所述样本数据集,基于第一网络模型和第二网络模型生成节能调控模型。上述方法中,根据设备的当前运行状态以及当前动作获取生成节能调控模型的样本数据,使获得的样本数据更精准,以便获得与上述设备实际运行情况贴合的节能调控模型。在一种可选的实现方式中,根据获取的样本数据集,基于第一网络模型和第二网络模型生成节能调控模型,包括:确定触发模型参数更新时,从所述样本数据集中选取第一预设数量的样本数据,将每条样本数据的当前运行状态参考值输入第一网络模型,将对应的下一个运行状态参考值输入第二网络模型;根据第一网络模型和第二网络模型输出的最大Q值的差值以及样本数据集中的奖励,更新所述第一网络模型的模型参数;确定第一网络模型的模型参数更新次数未达到第一预设次数时,重新触发模型参数更新,否则,将第二网络模型的模型参数更新为第一网络模型的模型参数,并判断第二网络的模型参数更新次数是否达到第二预设次数;确定第二网络模型的模型参数更新次数达到第二预设次数时,将所述第二网络模型作为所述节能调控模型,否则,重新触发获取样本数据。上述方法中,通过不同的样本数据更新第一网络模型和第二网络模型的模型参数,使第一网络模型输出的预测动作值逐渐靠近第二网络模型输出的真实动作值,确定满足将满足条件的第二网络模型作为节能调控参数,使第二网络模型的预测效果与上述设备实际的最佳动作选择更靠近,得到预测动作精准的节能调控参数。在一种可选的实现方式中,根据第一网络模型和第二网络模型输出的最大Q值的差值以及样本数据集中的奖励,更新所述第一网络模型的模型参数,包括:计算每条样本数据对应的第一网络模型和第二网络模型输出的最大Q值的差值,并确定所述第一预设数量的样本数据对应的最大Q值的差值的均值;计算所述第一预设数量的样本数据对应的奖励的均值;根据所述差值的均值及所述奖励的均值,更新所述第一网络模型的模型参数。在一种可选的实现方式中,根据所述设备执行所述当前动作前后的设备运行环境的改变,以及所述设备执行所述当前动作对应的功耗,确定所述设备执行所述当前动作获得的奖励。上述方法中,根据设备在不同运行状态下执行不同动作的运行环境的改变和对应功耗计算奖励,从而将设备运行时的综合效益进行量化,便于选出运行环境改变最佳,同时功耗最小的动作,从而对设备进行精确的节能调控。在一种可选的实现方式中,所述不同的动作由当前运行状态对应的控制参数范围确定,所述节能调控模型输出最大Q值对应的动作后,还包括:若输出的动作的控制参数大于当前运行状态对应的控制参数范围的最大值,将输出的动作的控制参数设置为当前运行状态对应的控制参数范围的最大值,若输出的动作的控制参数小于当前运行状态对应的控制参数范围的最小值,将输出的动作的控制参数设置为当前运行状态对应的控制参数范围的最小值。上述方法中,在使用节能调控模型时,可以根据模型的输出,进行节能调控模型的优化。在一种可选的实现方式中,所述设备为空调时,所述设备运行环境包括设备运行的外部环境及所述设备指定部件的运行信息,所述当前运行状态参考值包括:环境温度、压缩机转速、外风机转速。在一种可选的实现方式中,所述设备为空调时,所述动作包括的控制对象为冷流的调节阀,所述控制参数为所述冷流的调节阀的阀开度量。上述方法中,设备为空调时,可以运用上述节能调控模型,根据空调运行带来的环境温度的改变以及压缩机和外风机的功耗,选择节能效果最好,同时带来环境温度改变最佳的冷流的调节阀的阀开度量。第二方面,本专利技术实施例提供的一种设备,该设备包括处理器和存储器,其中,所述处理器存储可执行程序,所述处理器用于执行可执行程序时实现如下步骤:根据设备当前运行环境,确定设备当前运行状态的当前运行状态参考值;将所述当前运行状态参考值输入通过Q深度学习构建的节能调控模型,所述节能调控模型用于根据当前运行状态参考值预测当前运行状态下,设备执行下一个不同的动作对应的Q值,并输出最大Q值对应的动作,所述动作包括控制对象和控制参数;确定所述节能调控模型输出的动作为下一个动作,并控制所述设备在执行完当前动作后,执行所述确定的下一个动作。第三方面,本申请还提供一种计算机存储介质,其上存储有计算机程序,该程序被处理单元执行时实现第一方面所述方法的步骤。另外,第二方面和第三方面中任一种实现方式所带来的技术效果可参见第一方面中不同实现方式所带来的技术效果,此处不再赘述。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例一提供的一种设备节能控制的方法示意图;图2为本专利技术实施例一提供的第一网络与第二网络的结构示意图;图3为本专利技术实施例一提供的一个构建设备的运行状态和动作的映射表的完整方法示意图;图4为本专利技术实施例一本文档来自技高网...

【技术保护点】
1.一种设备控制的方法,其特征在于,该方法包括:根据设备当前运行环境,确定设备当前运行状态的当前运行状态参考值;将所述当前运行状态参考值输入通过Q深度学习构建的节能调控模型,所述节能调控模型用于根据当前运行状态参考值预测当前运行状态下,设备执行下一个不同的动作对应的Q值,并输出最大Q值对应的动作,所述动作包括控制对象和控制参数;确定所述节能调控模型输出的动作为下一个动作,并控制所述设备在执行完当前动作后,执行所述确定的下一个动作。

【技术特征摘要】
1.一种设备控制的方法,其特征在于,该方法包括:根据设备当前运行环境,确定设备当前运行状态的当前运行状态参考值;将所述当前运行状态参考值输入通过Q深度学习构建的节能调控模型,所述节能调控模型用于根据当前运行状态参考值预测当前运行状态下,设备执行下一个不同的动作对应的Q值,并输出最大Q值对应的动作,所述动作包括控制对象和控制参数;确定所述节能调控模型输出的动作为下一个动作,并控制所述设备在执行完当前动作后,执行所述确定的下一个动作。2.如权利要求1所述的方法,其特征在于,通过Q深度学习构建的节能调控模型,包括:构建第一网络模型和第二网络模型,并随机初始化第一网络模型和第二网络模型的模型参数;触发获取样本数据时,获取设备的当前运行状态参考值并输入到第一网络模型,确定第一网络模型输出的最大Q值对应的动作为下一个动作,确定设备执行当前动作结束时,根据设备的运行环境确定所述设备的下一个运行状态及对应的下一个运行状态参考值,并根据预设方法获得所述设备执行所述当前动作获得的奖励,同时将所述当前运行状态参考值、下一个运行状态参考值、下一个动作、奖励作为一条样本数据存入样本数据集,并判断获取的样本数据量是否达到预设条数,若是,结束样本数据的获取,否则,将下一运行状态参考值作为当前运行状态参考值,重新触发获取样本数据;根据所述样本数据集,基于第一网络模型和第二网络模型生成节能调控模型。3.如权利要求2所述的方法,其特征在于,根据所述样本数据集,基于第一网络模型和第二网络模型生成节能调控模型,包括:确定触发模型参数更新时,从所述样本数据集中选取第一预设数量的样本数据,将每条样本数据的当前运行状态参考值输入第一网络模型,将对应的下一个运行状态参考值输入第二网络模型;根据第一网络模型和第二网络模型输出的最大Q值的差值以及样本数据集中的奖励,更新所述第一网络模型的模型参数;确定第一网络模型的模型参数更新次数未达到第一预设次数时,重新触发模型参数更新,否则,将第二网络模型的模型参数更新为第一网络模型的模型参数,并判断第二网络的模型参数更新次数是否达到第二预设次数;确定第二网络模型的模型参数更新次数达到第二预设次数时,将所述第二网络模型作为所述节能调控模型,否则,重新触发获取样本数据。4.如权利要求3所述的方法,其特征在于,根据第一网络模...

【专利技术属性】
技术研发人员:谭建明李绍斌宋德超陈翀罗晓宇岳冬王鹏飞肖文轩邓家璧
申请(专利权)人:珠海格力电器股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1