基于速度精度权衡的肌肉骨骼系统控制方法、系统和装置制造方法及图纸

技术编号:28356574 阅读:35 留言:0更新日期:2021-05-07 23:41
本发明专利技术属于控制技术领域,具体涉及了一种基于速度精度权衡的肌肉骨骼系统控制方法、系统和装置,旨在解决现有的类人的肌肉骨骼机器人控制方法无法很好的进行拮抗肌协同收缩控制的问题。本发明专利技术包括:通过菲兹法则获取肌肉骨骼系统的估计运动精度,基于估计运动精度,通过纹状体启发的速度调制策略,计算监督项力矩,通过肌肉激活信号网络计算肌肉激活信号向量,基于肌肉激活信号向量和监督项力矩计算动作奖励,进而计算损失函数,基于损失函数调节肌肉激活信号网络的参数,使动作奖励取值增大,反复迭代获得控制所需的肌肉激活信号序列;本发明专利技术利用了肌肉骨骼系统的结构信息,构建了通用的拮抗肌协同收缩控制策略,保证了运动的顺利进行。

【技术实现步骤摘要】
基于速度精度权衡的肌肉骨骼系统控制方法、系统和装置
本专利技术属于控制
,具体涉及了一种基于速度精度权衡的肌肉骨骼系统控制方法、系统和装置。
技术介绍
生物的适应能力使得他们能够灵活地调整并执行行为,让已习得的熟练的运动根据环境和任务要求产生变化。实现运动可变性的典型策略之一是速度精度权衡,它反映了运动在快速与准确之间的折衷。如何在类人肌肉骨骼机器人实现这种灵活行为策略,使机器人产生对环境和任务的普遍的适应能力,是一个具有吸引力的挑战。另一方面,对于类人的肌肉骨骼机器人系统,其肌肉数目一般远远大于关节数,冗余的肌肉不仅为运动学习带来了困难,还对新运动的生成带来了困扰。如何利用肌肉骨骼系统的结构信息,构建通用的拮抗肌协同收缩控制策略同样是一个挑战,尤其是考虑到部分肌肉受损的情况。
技术实现思路
为了解决现有技术中的上述问题,即现有的类人的肌肉骨骼机器人控制方法无法很好的进行拮抗肌协同收缩控制的问题,本专利技术提供了一种基于速度精度权衡的肌肉骨骼系统控制方法,所述方法包括:令训练次数k=1;步骤S100,通过菲兹法则获取肌肉骨骼系统t时刻的估计运动精度W;步骤S200,基于所述估计运动精度W,通过纹状体启发的速度调制策略,计算监督项力矩步骤S300,基于所述监督项力矩通过肌肉激活信号网络计算肌肉激活信号向量ut;步骤S400,基于所述肌肉激活信号向量ut和监督项力矩计算动作奖励Rt,进而计算预设的损失函数L,基于所述预设的损失函数L调节肌肉激活信号网络的参数,使动作奖励Rt取值增大,令k=k+1重复步骤S100-步骤S400的方法直至k=K,K为预设的最大训练次数,获得控制所需的肌肉激活信号序列。在一些优选的实施方式中,步骤S100包括:预设累积时间T;步骤S110,通过皮层模型获取t1时刻的感知证据xi(t1)~N(μi,σ2),进而获取累积感知证据Yi(T):步骤S120,将所述感知证据Yi(T)输入基底神经节模型,获得基底神经节模型的输出OUTi;步骤S130,基于所述基底神经节模型的输出OUTi,通过预设的决策阈值-lnPi(T)获取第一有效累积时间和第二有效累积时间若T>0,则令T=T-1,重复步骤S110-步骤S130;其中,当首次出现所述基底神经节模型的输出OUTi≥-lnPi(T)时,将OUTi对应的累积时间T设置为第一有效累积时间当出现所述基底神经节模型的输出OUTi<≥-lnPi(T)时,将OUTi对应的累计时间T设置为第二有效累积时间迭代过程中每次产生新的第二有效累积时间覆盖上一次产生的第二有效累积时间所述-lnPi(T)为决策阈值;步骤S140,通过所述第一有效累积时间和第二有效累积时间获取最终决策时间步骤S150,基于所述最终决策时间Tout,通过菲兹法则估计运动精度W。所述通过计算合适的最终决策时间进而调节后续对肌肉控制的精度。在一些优选的实施方式中,所述纹状体启发的速度调制策略为:其中,表示根据估计的运动精度计算的终点位置的关节角度,qs表示初始位置的关节角度,tS是运动的起始时刻,VM(λ,t)为钟形速度调制模型,t表示调制的t时刻,Tout表示决策时间;所述钟形速度调制模型VM(λ,t)为:其中,λ是调制模型的参数,t代表的t时刻;所述关节期望角速度为所述监督项力矩为:其中,qt是t时刻的关节角度,关节期望角速度,关节期望角速度的角加速度,M(qt)为肌肉骨骼系统的惯性矩阵,向心科氏力,G(qt)是肌肉骨骼系统的重力矩阵;所述肌肉骨骼系统的惯性矩阵M(qt)为:所述向心科氏力为:所述肌肉骨骼系统的重力矩阵G(qt)为:其中,m1表示机械臂第一根连杆的质量,m2表示机械臂第二根连杆的质量,d1表示机械臂第一根连杆的长度,d2表示机械臂第二根连杆的长度,q1,t表示机械臂第一个关节的角度,q2,t表示机械臂第二个关节的角度,和是机械臂第一个关节和第二个关节的角速度。在一些优选的实施方式中,所述肌肉激活信号向量ut,其计算方法为:其中,ut-1是t-1时刻的肌肉激活信号,τt-1为t-1时刻的关节力矩,策略网络μ(·|θμ)用于求解肌肉激活信号的神经网络。在一些优选的实施方式中,步骤S400包括:步骤S410,基于所述肌肉激活信号向量ut和监督项力矩计算动作奖励Rt,使Rt尽可能大:其中,γ是折扣因子,为t时刻屈肌产生的力矩,为t时刻屈肌产生的力,为t时刻屈肌产生的肌肉激活信号,为t时刻伸肌产生的力矩,为t时刻伸肌产生的力,为t时刻伸肌产生肌肉激活信号,p为是屈肌数目,q为伸肌数目,ω1和ω2是比例参数;步骤S420,基于所述动作奖励Rt,计算评价网络Qμ的损失函数L:其中,θQ为评价网络的参数,Δut+1为t+1时刻的肌肉激活信号,Δut为t时刻的肌肉激活信号;步骤S430,基于所述损失函数L对评价网络Qμ的参数θQ进行更新:其中,η1表示更新步长;基于所述评价网络Qμ更新策略网络μ(·|θμ)的参数θμ:其中,η2表示更新步长,为策略网络μ(·|θμ)的梯度:步骤S440,若t≠Tout,令t=t+1,重复步骤S200-步骤S400的方法直至t=Tout;步骤S450,若k≠K,令k=k+1,重复步骤S100-步骤S400的方法直至k=K,此时肌肉激活信号ut(t∈[1,T])为完成控制所需的肌肉激活信号序列。在一些优选的实施方式中,所述基底神经节模型的输出OUTi为:其中,为增益系数,i和j为感知证据的序号。在一些优选的实施方式中,所述通过菲兹法则估计运动精度W为:其中a和b是两个常数参数,D是关节末端运动的距离。本专利技术的另一方面,提出了一种基于速度精度权衡的肌肉骨骼系统控制系统,所述系统包括精度估计模块、期望力矩计算模块、激活信号计算模块和速度精度权衡模块;令训练次数k=1;所述精度估计模块,用于通过菲兹法则获取肌肉骨骼系统t时刻的估计运动精度W;所述期望力矩计算模块,用于基于所述估计运动精度W,通过纹状体启发的速度调制策略,计算监督项力矩所述激活信号计算模块,用于基于所述监督项力矩通过肌肉激活信号网络计算肌肉激活信号向量ut;所述速度精度权衡模块,用于基于所述肌肉激活信号向量ut和监督项力矩计算动作奖励Rt,进而计算预设的损失函数L,基于所述预设的损失函数L调节肌肉激活信号网络的参数,使动作奖励Rt取值增大,令k=k+1重复所述精度估计模块——速度精度权衡模块的功能直至k=K,K为预设的最大训练次数,获得控制所需的肌肉激活信号序列。本专利技术的第三方面,提出了一种存储装置,其中存储有多条程序,所述程序适于由本文档来自技高网...

【技术保护点】
1.一种基于速度精度权衡的肌肉骨骼系统控制方法,其特征在于,所述控制方法包括:/n令训练次数k=1;/n步骤S100,通过菲兹法则获取肌肉骨骼系统t时刻的估计运动精度W;/n步骤S200,基于所述估计运动精度W,通过纹状体启发的速度调制策略,计算监督项力矩

【技术特征摘要】
1.一种基于速度精度权衡的肌肉骨骼系统控制方法,其特征在于,所述控制方法包括:
令训练次数k=1;
步骤S100,通过菲兹法则获取肌肉骨骼系统t时刻的估计运动精度W;
步骤S200,基于所述估计运动精度W,通过纹状体启发的速度调制策略,计算监督项力矩
步骤S300,基于所述监督项力矩通过肌肉激活信号网络计算肌肉激活信号向量ut;
步骤S400,基于所述肌肉激活信号向量ut和监督项力矩计算动作奖励Rt,并通过预设的损失函数L计算损失值,基于所述预设的损失函数L对应的损失值调节肌肉激活信号网络的参数,使动作奖励Rt取值增大,若k<K,令k=k+1重复步骤S100-步骤S400直至k=K,K为预设的最大训练次数,获得控制所需的肌肉激活信号序列。


2.根据权利要求1所述的基于速度精度权衡的肌肉骨骼系统控制方法,其特征在于,步骤S100包括:
预设累积时间T;
步骤S110,通过皮层模型获取t1时刻的感知证据xi(t1)~N(μi,σ2),进而获取累积感知证据Yi(T):



步骤S120,将所述感知证据Yi(T)输入基底神经节模型,获得基底神经节模型的输出OUTi;
步骤S130,基于所述基底神经节模型的输出OUTi,通过预设的决策阈值-lnPi(T)获取第一有效累积时间和第二有效累积时间若T>0,则令T=T-1,重复步骤S110-步骤S130;
其中,当首次出现所述基底神经节模型的输出OUTi≥-lnPi(T)时,将OUTi对应的累积时间T设置为第一有效累积时间当出现所述基底神经节模型的输出OUTi<-lnPi(T)时,将OUTi对应的累计时间T设置为第二有效累积时间迭代过程中每次产生新的第二有效累积时间覆盖上一次产生的第二有效累积时间所述-lnPi(T)为决策阈值;
步骤S140,通过所述第一有效累积时间和第二有效累积时间获取最终决策时间
步骤S150,基于所述最终决策时间Tout,通过菲兹法则估计运动精度W。


3.根据权利要求2所述的基于速度精度权衡的肌肉骨骼系统控制方法,其特征在于,所述纹状体启发的速度调制策略为:



其中,表示根据估计的运动精度计算的终点位置的关节角度,qs表示初始位置的关节角度,tS是运动的起始时刻,VM(λ,t)为钟形速度调制模型,t表示调制的t时刻,Tout表示决策时间;
所述钟形速度调制模型VM(λ,t)为:



其中,λ是调制模型的参数,t代表的t时刻;
所述关节期望角速度为
所述监督项力矩为:



其中,qt是t时刻的关节角度,关节期望角速度,关节期望角速度的角加速度,M(qt)为肌肉骨骼系统的惯性矩阵,向心科氏力,G(qt)是肌肉骨骼系统的重力矩阵;
所述肌肉骨骼系统的惯性矩阵M(qt)为:



所述向心科氏力为:

所述肌肉骨骼系统的重力矩阵G(qt)为:



其中,m1表示机械臂第一根连杆的质量,m2表示机械臂第二根连杆的质量,d1表示机械臂第一根连杆的长度,d2表示机械臂第二根连杆的长度,q1,t表示机械臂第一个关节的角度,q2,t表示机械臂第二个关节的角度,和是机械臂第一个关节和第二个关节的角速度。


4.根据权利要求3所述的基于速度精度权衡的肌肉骨骼系统控制方法,其特征在于,所述肌肉激活信号向量ut,其计算方法为:...

【专利技术属性】
技术研发人员:周俊杰钟汕林乔红吴伟
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1