【技术实现步骤摘要】
一种基于未知机械臂模型的深度强化学习抑振系统及方法
[0001]本专利技术涉及机器人控制领域,尤其是一种基于未知机械臂模型的深度强化学习抑振系统及方法。
技术介绍
[0002]为了满足工业生产质量和效率的不断提高需求,工业机器人向着更加智能化的方向发展,各类工业机械臂应运而生。其中,机械臂的吊装在生产中比较常见,如龙门/桁架机器人的悬臂、天车的吊臂等等。吊装的机械臂具有高灵活性,高工作效率,低成本与低能耗等优势,但机械臂在工作过程中会产生一定程度的振动,从而对其工作稳定性和精度造成影响,尤其在一些精度要求较高的地方,如高精度上下料、装配等。机械臂无法满足其工作要求。专利号为CN201710548814.2的专利技术专利提出的一种基于时滞补偿的风洞支杆抑振方法,分析了振动控制中加速度传感器与压电作动器激励信号的相位差,在控制器中编制移相算法程序做时滞补偿,最终实现主动振动控制,此方法需要利用锤击法来获得系统的频率响应函数,较为复杂;专利号为CN201710975489.8的专利技术专利通过一种基于输入整形器的机器人关节末端残余 ...
【技术保护点】
【技术特征摘要】
1.一种基于未知机械臂模型的深度强化学习抑振系统,其特征在于:包括机械臂模块、振动采集模块、处理器和抑振控制模块;所述机械臂模块,是振动抑制的对象,能够是机器人的悬臂,也能够是单独存在的机械臂;所述振动采集模块,包括陀螺仪和TTL转485模块,陀螺仪通过固定装置固定在机械臂的末端,实时采集机械臂末端的偏航、俯仰、横滚姿态的振动数据,所述振动数据以TTL电平信号发送至TTL转485模块,以提高其传输距离至1000m,然后将其转化为485电平信号,发送至抑振控制模块;所述处理器,用来接收实时采集到的机械臂振动数据,并进行处理分析,同时搭载抑振控制模块,实现对机械臂的振动抑制控制;所述抑振控制模块,其功能为根据实时接收采集到的机械臂振动数据,推导出机械臂系统的阻尼比与频率,进而设计输入整形器,对机械臂运行的加速度信号进行整形,并再次得到振动数据;此时根据深度强化学习DDPG算法选取一个动作,再次对机械臂运行的加速度信号进行整形,得到振动数据,对此次过程的振动数据进行处理,再次根据强化学习DDPG算法选取动作,不断循环此训练过程,直至机械臂达到较好的抑振效果。2.一种如权利要求1所述的基于未知机械臂模型的深度强化学习抑振系统的抑振方法,其特征在于:将深度强化学习与输入整形二者结合;在机器人机械臂精确动力学模型未知的情况下,通过深度强化学习DDPG算法,不断优化输入整形器参数,以此来对机械臂振动进行优化,以提高机械臂工作效率。3.根据权利要求2所述的一种基于未知机械臂模型的深度强化学习抑振方法,其特征在于:该方法不需要已知机械臂精确的动力学模型,而是将机械臂系统近似为二阶系统,通过陀螺仪传感器采集机械臂末端振动数据,以此来求解系统的阻尼比与频率,进而设计输入整形器;具体实现步骤如下:步骤1,根据机械臂振动数据推导出其阻尼比与频率参数,将机械臂系统近似为二阶系统,取机械臂振动数据中的俯仰数据,取俯仰数据的最大值为系统的峰值Y
P
,对应的时间为峰值时间t
P
,对应的超调量为σ,超调量的计算公式如下:σ=[Y
P
‑
Y(∞)]/Y(∞)*100%
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中,Y(∞)为系统稳定下的输出,ε为系统的阻尼比,联立(1)(2)式求得系统的阻尼比ε,计算公式如下:系统的峰值时间t
P
计算公式如下:由式(3)计算出系统的阻尼比,峰值时间t
P
直接读取,由此得系统的频率w
n
计算公式为:
由此便求出机械臂系统的阻尼比与频率;步骤2;根据第一步求出的机械臂系统的阻尼比与频率,将机械臂系统近似为二阶系统,表达式为:根据拉普拉斯变换,将系统的表达式改写为传递函数的形式:输入整形器的时域表达式为:其中,A
i
为脉冲幅值,t
i
为脉冲时滞,n为输入整形所包含的脉冲个数,对其进行拉普拉斯变换,得到其频域表达式为:引入输入整形后,二阶系统的响应为:考虑到系统响应的快速性,取n=2,则有:t1=0
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。