The invention provides an industrial robot learning method for large-scale repetitive processing. Its characteristics are as follows: the learning method is based on learning model, which includes the following steps: S001, sensor acquisition status information; S002, learning according to collected information; S003, judging processing quality and adding. Whether the work cycle meets the requirement or not, if it meets the requirement, the study will be finished, otherwise the status information will be collected and re-learned. The method of the invention learns and improves the control strategy according to the sensor data, achieves good control at high speed, simplifies the debugging work of the robot, realizes the application in large-scale repetitive processing, and solves the high speed caused by the lack of accurate dynamic model in the traditional learning mode of the robot. The oscillation under work improves the working efficiency of industrial robots.
【技术实现步骤摘要】
一种应用于大批量重复性加工的工业机器人学习方法
本专利技术涉及工业机器人
,尤其涉及一种应用于大批量重复性加工的工业机器人学习方法。
技术介绍
工业机器人是一种具有高度非线性的系统,其动态特性的准确建模难以实现。以往的机器人通常只考虑运动学而不考虑动力学模型。在只使用动力学模型时,一方面通常将每个点最大的速度和加速度设置得低于实际所能承受的速度和加速度,这是考虑到动态特性时不超出执行器的最大力矩,但这也导致了执行器的性能没有被充分利用。另一方面,未考虑动力学特性不仅影响了工业机器人的工作效率,在机器人高速运动过程以及重负载过程中,由于惯性力,离心力,摩擦力,重力,关节扭矩力的影响,往往会产生强烈的震动,这不仅影响了机器人的加工质量,也影响了机器人的寿命。此外,工业机器人动力学准确建模还存在对机器人参数难以辨识的问题,如果机器人的一致性不好,每个部件的摩擦力系数不一样,导致动力学参数出现错误,而不正确的动力学参数会导致机器人调试工作更加繁琐,也难以实现大批量、规模化的应用。
技术实现思路
针对现有技术中存在的缺陷或不足,本专利技术提供一种应用于大批量重复性加工的工业机器人学习方法,根据传感器数据去学习并改进控制策略,达到在高速下的良好控制,能够简化机器人调试工作,并可实现在大批量、规模化的重复性加工中应用,并解决机器人在传统的学习方式中缺乏精确动力学模型造成的高速工作下的震荡,提高工业机器人的工作效率。为了实现上述目的,本专利技术采取的技术方案为提供一种应用于大批量重复性加工的工业机器人学习方法,该学习方法是基于学习模型进行学习,其包括如下步骤:S001、 ...
【技术保护点】
1.一种应用于大批量重复性加工的工业机器人学习方法,其特征在于:该学习方法是基于学习模型进行学习,其包括如下步骤:S001、传感器采集状态信息;S002、根据采集的信息进行学习;S003、判断加工质量以及加工周期是否达到要求,若达到要求则结束学习,否则重新采集状态信息重新学习。
【技术特征摘要】
1.一种应用于大批量重复性加工的工业机器人学习方法,其特征在于:该学习方法是基于学习模型进行学习,其包括如下步骤:S001、传感器采集状态信息;S002、根据采集的信息进行学习;S003、判断加工质量以及加工周期是否达到要求,若达到要求则结束学习,否则重新采集状态信息重新学习。2.根据权利要求1所述的应用于大批量重复性加工的工业机器人学习方法,其特征在于:所述学习模型由环境单元、机器人学习单元和加工执行单元组成;其中,环境单元至少包括加工质量测量单元,机器人学习单元包括状态观测单元、数据处理单元及决策制定单元,加工执行单元至少包括机器人和定位器;所述环境单元,由加工工件状态测量传感器和机器人状态末端测量观测器组成,所述加工工件状态测量传感器采集所加工工件的视觉信息,所述视觉信息至少包括工件的几何形状和表面光滑度信息;所述机器人状态末端测量观测器采集机器人的位置、速度、加速度以及关节扭矩的信息;所述状态观测单元,所述状态观测单元通过通信线路获取所述环境单元采集的信息,并将获取的信息转化成数据格式;所述数据处理单元,接收并处理所述状态观测单元转化成数据格式的信息;所述数据处理单元包括奖励计算单元和函数更新单元,其中,所述奖励计算单元通过奖励函数设置单元设置即时奖励r,所述奖励计算单元对所述状态观测单元的信息进行计算,计算完成后将结果参数输送至函数更新单元,函数更新单元采用神经网络训练的方式对获取到的参数进行更新,直到得到最终学习参数,将最终学习参数存储起来,通过神经网络做出行为决策,再进行强化学习到一个确定性策略以驱动机器人进行工作。3.根据权利要求2所述的应用于大批量重复性加工的工业机器人学习方法,其特征在于:所述强化学习通过假设机器人由状态信息到行为定义为策略π,从时刻t开始获得的累积回报定义为:根据累积回报通过Qπ(st,at)=Eπ[Rt|st,at]求取期望回报;其中,Qπ(st,at)表示依据策略π在状态st下采取行为at时的期望回报;结合累积回报和取期望回报的公式,得到期望回报的递归形式公式:根据递归形式公式不断...
【专利技术属性】
技术研发人员:李建刚,钟刚刚,吴雨璁,
申请(专利权)人:哈尔滨工业大学深圳,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。