智能设备及其控制方法、装置制造方法及图纸

技术编号:19949474 阅读:35 留言:0更新日期:2019-01-03 05:39
本申请提供了一种智能设备及其控制方法、装置,属于机器学习领域。该方法可以在接收到针对目标任务的执行指令后,获取检测数据,并将检测数据和目标任务输入至感知模型,得到与该目标任务关联的代表性检测数据;然后可以将目标任务以及代表性检测数据输入至规划模型,得到目标状态数据;之后可以将目标状态数据,以及部分或全部代表性检测数据输入至控制模型,得到用于控制智能设备的控制参数,并基于该控制参数控制智能设备。解决了现有技术的智能设备控制过程中对训练样本的依赖较大,训练效果不理想的问题,能够实现对智能设备更好的控制。

Intelligent Equipment and Its Control Method and Device

The application provides an intelligent device and its control method and device, which belongs to the field of machine learning. After receiving the execution instructions for the target task, the method can obtain the detection data, and input the detection data and the target task into the perception model to obtain the representative detection data associated with the target task; then the target task and the representative detection data can be input into the planning model to obtain the target state data; after that, the target state data, as well as the target state data, can be obtained. Some or all of the representative test data are input into the control model, and the control parameters used to control the intelligent equipment are obtained. Based on the control parameters, the intelligent equipment is controlled. It solves the problem that the existing technology depends heavily on training samples and the training effect is not ideal in the process of intelligent equipment control, and can achieve better control of intelligent equipment.

【技术实现步骤摘要】
智能设备及其控制方法、装置
本申请涉及机器学习领域,特别涉及一种智能设备及其控制方法、装置。
技术介绍
智能设备,也可以称为智能体(IntelligentAgent,IA),是一种自主的实体(autonomousentity)。智能设备能够通过传感器感知周围的环境,并可以通过执行器(actuators)来执行操作。常见的智能设备一般包括机器人和自动驾驶车辆等。相关技术中,智能设备的控制装置中一般设置有基于机器学习算法训练得到的控制模型,该控制模型可以将传感器采集的数据作为输入数据,并对该输入数据进行处理后生成用于控制执行器的控制参数,该控制参数可以用于指示执行器执行相应操作。例如,对于自动驾驶车辆,控制模型可以根据摄像头采集到的道路图像,生成用于控制油门、刹车和方向盘中的至少一种执行器的控制参数。但是,相关技术中的控制模型的控制效果依赖于模型训练时所采用的样本数据的样本量,当样本量较少时,该控制模型的控制效果较差。
技术实现思路
本专利技术实施例提供了一种智能设备及其控制方法、装置,可以解决相关技术中的控制模型的控制效果较差的问题。技术方案如下:一方面,提供了一种智能设备的控制方法,该方本文档来自技高网...

【技术保护点】
1.一种智能设备的控制方法,其特征在于,所述方法包括:接收到针对目标任务的执行指令后,获取检测数据,所述检测数据包括所述智能设备周围环境的环境数据,以及所述智能设备的状态数据;将所述检测数据和所述目标任务输入至感知模型,得到与所述目标任务关联的代表性检测数据;将所述目标任务以及所述代表性检测数据输入至规划模型,得到目标状态数据,所述目标状态数据用于指示所述智能设备所需达到的状态;将所述目标状态数据,以及部分或全部所述代表性检测数据输入至控制模型,得到用于控制所述智能设备的控制参数;基于所述控制参数控制所述智能设备执行所述目标任务;其中,所述控制模型基于控制理论数据初始化得到。

【技术特征摘要】
1.一种智能设备的控制方法,其特征在于,所述方法包括:接收到针对目标任务的执行指令后,获取检测数据,所述检测数据包括所述智能设备周围环境的环境数据,以及所述智能设备的状态数据;将所述检测数据和所述目标任务输入至感知模型,得到与所述目标任务关联的代表性检测数据;将所述目标任务以及所述代表性检测数据输入至规划模型,得到目标状态数据,所述目标状态数据用于指示所述智能设备所需达到的状态;将所述目标状态数据,以及部分或全部所述代表性检测数据输入至控制模型,得到用于控制所述智能设备的控制参数;基于所述控制参数控制所述智能设备执行所述目标任务;其中,所述控制模型基于控制理论数据初始化得到。2.根据权利要求1所述的方法,其特征在于,所述感知模型基于深度学习的方式训练得到。3.根据权利要求1所述的方法,其特征在于,所述规划模型基于强化学习的方式式训练得到。4.根据权利要求1所述的方法,其特征在于,所述控制模型基于强化学习的方式式训练得到。5.根据权利要求2所述的方法,其特征在于,在接收针对目标任务的执行指令之前,所述方法还包括:获取检测样本数据以及与指定任务关联的代表性检测样本数据,所述检测样本数据包括智能设备在执行指定任务时的周围环境的环境样本数据,以及所述智能设备的状态样本数据;基于深度学习的方式,采用所述检测样本数据、所述指定任务以及所述代表性检测样本数据对初始感知模型进行训练,得到所述感知模型。6.根据权利要求3所述的方法,其特征在于,在接收针对目标任务的执行指令之前,所述方法还包括:获取与指定任务关联的代表性检测样本数据以及效果值样本数据;基于强化学习的方式,采用所述代表性检测样本数据、所述指定任务以及所述效果值样本数据对初始规划模型进行训练,得到所述规划模型。7.根据权利要求4所述的方法,其特征在于,在接收针对目标任务的执行指令之前,所述方法还包括:基于所述控制理论数据对初始控制模型进行初始化;获取与指定任务关联的部分或全部代表性检测样本数据,目标状态样本数据,以及效果值样本数据;基于强化学习的方式,采用获取到的所述代表性检测样本数据,所述目标状态样本数据,以及所述效果值样本数据,对所述初始控制模型进行训练,得到所述控制模型。8.根据权利要求4所述的方法,其特征在于,所述控制模型包括:用于计算权重的控制子模型,以及用于计算所述控制参数的一个或多个计算子模型;在接收针对目标任务的执行指令之前,所述方法还包括:获取与指定任务关联的部分或全部代表性检测样本数据,目标状态样本数据,以及效果值样本数据;基于强化学习的方式,采用获取到的所述代表性检测样本数据,所述目标状态样本数据,以及所述效果值样本数据,对初始控制子模型进行训练,得到所述控制子模型;基于所述控制理论数据确定每个所述计算子模型。9.根据权利要求8所述的方法,其特征在于,所述控制模型包括:用于计算权重的控制子模型,以及用于计算所述控制参数的一个或多个计算子模型;所述将所述目标状态数据,以及部分或全部所述代表性检测数据输入至控制模型,得到用于控制所述智能设备的控制参数,包括:从所述目标状态数据,以及部分或全部所述代表性检测数据中获取与每个所述计算子模型对应的一组目标输入数据;分别将每组目标输入数据输入至对应的计算子模型,得到每组目标输入数据所对应的控制参数的取值;将所述目标状态数据,以及部分或全部代表性检测数据输入至所述控制子模型,得到一组权重;根据所述一组权重,以及各组目标输入数据对应的控制参数的取值,确定所述控制参数的目标取值。10.根据权利要求1至9任一所述的方法,其特征在于,所述方法还包括:在基于所述控制参数控制所述智能设备之后,获取所述智能设备新的状态数据;根据所述新的状态数据与所述目标任务确定控制效果;根据所述控制效果,调整所述感知模型、所述规划模型和所述控制模型中一个或多个模型的参数。11.根据权利要求1至9任一所述的方法,其特征在于,所述智能设备为自动驾驶车辆或者智能机器人。12.一种智能设备的控制装置,其特征在于,所述装置包括:第一获取模块,用于接收到针对目标任务的执行指令后,获取检测数据,所述检测数据包括所述智能设备周围环境的环境数据,以及所述智能设备的状态数据;第一...

【专利技术属性】
技术研发人员:袁庭球黄韬黄永兵刘兵
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1