物联网设备控制方法及系统技术方案

技术编号:40701219 阅读:21 留言:0更新日期:2024-03-22 10:59
本申请公开了一种物联网设备控制方法及系统。其中,该方法包括:获取MQTT消息服务器发送的目标物联网设备的第一状态信息;利用预训练的深度强化学习模型对第一状态信息进行分析,得到针对目标物联网设备的目标控制策略,其中,目标控制策略中包括目标控制参数,深度强化学习模型的状态空间包括:目标物联网设备的状态信息,深度强化学习模型的动作空间包括:针对目标物联网设备的控制参数;依据目标控制策略对目标物联网设备进行控制。本申请解决了相关技术中通过云计算架构对物联网设备进行控制消耗资源较多且控制效率较低的技术问题。

【技术实现步骤摘要】

本申请涉及边缘计算,具体而言,涉及一种物联网设备控制方法及系统


技术介绍

1、近年来,物联网市场快速增长,物联网应用涵盖了满足企业需求的传感器、标签和自定义设备等多种多样的异构终端,小型监控和执行设备的快速引入也有助于在工业环境中部署服务,物联网已经渗透到生产作业的方方面面。

2、然而,设备的控制问题始终是工业物联网场景下的核心问题,每当新接入一种类别的设备,通常需要先分析其物理模型,再基于该物理模型做特定的接入适配,研发和调试周期可能会比较长。另外,当前为了实现对不同物理结构的设备的稳定控制,通常采用经典的数学控制模型,如全状态反馈、线性二次调节器、比例积分导数等数学控制模型,但如果对控制系统缺乏深入的认识,利用经典数学控制模型对物联网设备进行控制是困难的。同时,随着云计算的发展,通常使用云计算架构解决物联网设备的控制过程中涉及到的大量数据存储和计算的问题,但传统云计算方法一般使用云中心-远端的架构,该架构在数据传输方面比较耗时,并且难以满足某些实时控制的需求。

3、针对上述的问题,目前尚未提出有效的解决方案


本文档来自技高网...

【技术保护点】

1.一种物联网设备控制方法,应用于边缘计算平台,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,获取MQTT消息服务器发送的目标物联网设备的第一状态信息,包括:

3.根据权利要求1所述的方法,其特征在于,所述深度强化学习模型为基于时间差分的Q学习模型,所述深度强化学习模型的训练过程包括:

4.根据权利要求3所述的方法,其特征在于,所述softmax选择算法选择所述第一控制参数的概率分布满足玻尔兹曼分布,依据softmax选择算法从所述动作空间中确定与所述当前状态信息对应的第一控制参数,包括:

5.根据权利要求3所述的方法,其特...

【技术特征摘要】

1.一种物联网设备控制方法,应用于边缘计算平台,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,获取mqtt消息服务器发送的目标物联网设备的第一状态信息,包括:

3.根据权利要求1所述的方法,其特征在于,所述深度强化学习模型为基于时间差分的q学习模型,所述深度强化学习模型的训练过程包括:

4.根据权利要求3所述的方法,其特征在于,所述softmax选择算法选择所述第一控制参数的概率分布满足玻尔兹曼分布,依据softmax选择算法从所述动作空间中确定与所述当前状态信息对应的第一控制参数,包括:

5.根据权利要求3所述的方法,其特征在于,利用预训练的深度强化学习模型对所述第一状态信息进行分析,得到针对所述目标物联网设备的目标控制策略,包括:

【专利技术属性】
技术研发人员:朱圣祥刘大伟丁君
申请(专利权)人:中国电信股份有限公司技术创新中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1