一种不确定环境下的分布式多无人机任务分配方法组成比例

技术编号:21890606 阅读:26 留言:0更新日期:2019-08-17 14:01
本发明专利技术提供了一种不确定环境下的分布式多无人机任务分配方法,首先建立协同任务分配模型,各无人机进行自己的任务束更新、构建,然后无人机编队进行一致性协商,实现不确定参数下最大化整体收益的目标。本发明专利技术利用一致性束算法CBBA,在分布式的架构下求解任务环境存在不确定参数时多无人机的时敏任务协同分配问题,利用高斯过程回归模型来捕捉不确定参数对任务分配收益的影响来参与分配过程从而保证任务分配结果的实际执行效果,利用主动学习和流形学习方法来提高算法的计算效率。

A Distributed Multi-UAV Task Assignment Method in Uncertain Environment

【技术实现步骤摘要】
一种不确定环境下的分布式多无人机任务分配方法
本专利技术涉及一种多无人机任务分配方法。
技术介绍
当前,随着无人机技术的提高,多无人机能通过协同、协作组成集群编队来完成单无人机无法完成或难以完成的工作。因此,多无人机系统的研究受到广泛关注。多无人机任务分配是多无人机协同任务规划的关键技术之一,其目标是根据任务区域和目标的先验情报信息,在考虑具体约束条件的前提下,以任务的总体效能最优或次优为目标,合理地将具体行动任务分配给无人机编队中的成员。随着无人机性能的不断提高和任务环境干扰因素的增加,任务分配过程中常常存在部分先验数据具有不确定性的现象,因此,不确定环境下的多无人机任务分配研究成为研究热点。针对不确定环境下的多无人机任务分配问题,相关领域学者在主流的任务分配算法基础上考虑了分配参数的不确定性。陈侠将不确定性指标表示为区间不确定性信息,然后给出了基于随机概率的多属性方案排序(StochasticMulti-criteriaAcceptabilityAnalysis,SMAA)方法的求解思路。Ponda提出了鲁棒任务分配算法,具体操作是基于期望值法、最坏情形法、风险约束法将已知分布信息的不确定参数耦合进任务分配过程,并在一致性束算法CBBA(Consensus-BasedBundleAlgorithm,CBBA)框架内进行了求解。但是现有的方法需要的计算量过大,如何在不降低鲁棒任务分配算法的执行效能的情况下提高算法的计算效率是本领域技术人员需要解决的技术问题。
技术实现思路
为了克服现有技术的不足,本专利技术提供一种不确定环境下的分布式多无人机任务分配方法,利用一致性束算法CBBA,在分布式的架构下求解任务环境存在不确定参数时多无人机的时敏任务协同分配问题,利用高斯过程回归模型(GaussianProcessRegression,GPR)来捕捉不确定参数对任务分配收益的影响来参与分配过程从而保证任务分配结果的实际执行效果,利用主动学习和流形学习方法来提高算法的计算效率。本专利技术解决其技术问题所采用的技术方案包括以下步骤:步骤1,对于由Na个无人机组成的无人机编队,所有无人机均是同一类型;任务执行区域内有Nt个目标,无人机编队要对每个目标执行时敏任务,每个时敏任务的执行时间为tj,j=1,2...,Nt,其时间窗约束为ETj≤tj≤LTj,其中,ETj为任务j的最早允许开始执行时间,LTj为任务j的最晚允许开始执行时间;无人机i对目标j执行任务的收益其中,Vj为目标j的价值,λ为指数折扣收益模型的递减因子,α为距离代价的惩罚因子,Lij为无人机i与目标j的欧式距离;每个任务的执行时长tj-dur=gj(θ),其中,任务环境的不确定参数θ服从分布概率密度函数p(θ),函数关系gj在仿真时由历史数据或模型仿真获得;协同分配模型目的是求解决策矩阵x,xij=1表示分配无人机i对目标j执行任务,x∈χ,每个无人机最多能够执行Li个任务,每个无人机维护以下数据信息结构:(1)任务束集(Bundle):其中bin是竞拍到的目标,表示无人机i竞拍得到的第n个任务的序号;(2)任务时序集(Path):任务时序Pi为无人机i的任务束Bi的任务执行顺序,即无人机i执行任务的顺序为(3)执行时间集(Time):τin∈R+表示无人机i根据任务时序集Pi到达任务区执行任务pin的执行时间;(4)赢家集(WinningUavs):其中元素zin表示无人机i与其所有邻接无人机通过信息交互所获得的关于任务j的赢家信息,即当前时刻无人机zin对任务j出价最高成为赢家;若当前尚未有无人机竞拍到任务j,则zi=φ;(5)赢家出价集(WinningBids):其中元素yin∈R+,用来表示当前时刻各无人机对任务j竞拍时的最大出价值,若当前尚未有无人机竞拍到任务j则yin=0;(6)时间戳集(TimeStamps):时间戳为其中元素sin∈R+,用来表示无人机i与其邻接无人机之间的最近一次信息交互时间;(7)分配时间标记:[Tip,tip],Tip为通信的时间标记,无人机之间采用同步通信机制,每次协商阶段无人机i同通信网络中的其他所有无人机进行完通信,Tip自增;tip为无人机i进行任务束构建阶段的时间标记,无人机i任务束构建完有新任务加入时,tip自增;步骤2,已知无人机i和目标j的位置矢量、目标j任务Tj的价值和时间窗,构造信息结构Bi,Pi,τi的步骤如下:Step2.1,从j=1循环迭代到j=Nt,若执行Step2.2到Step2.6,否则j自增;Step2.2,对于任务时序集Pi的每一个位置k=1到k=LPi,检测加入新任务Tj的可能性,若满足可能性转入Step2.3,LPi为无人机i的任务时序集里已经出价的任务个数;Step2.3,求Tj插在Pi的位置k竞拍出价的边际收益cij-Pik:Step2.3.1,根据已知不确定参数θ[θ1,θ2]的参数空间及分布概率密度函数p(θ),产生N个样本形成样本集,每个样本包含θ[θ1,θ2]和对应的f(θ)形成的有序对(θ,f(θ));其中,f(θ)为θ的具体取值下加入新任务Tj并插在Pi的位置k的优化任务束总收益;样本集分为训练集S和未采样样本集U,训练集S样本的f(θ)已通过计算获得,未采样样本集U的f(θ)未知;随机选取s个样本转入Step2.3.2计算f(θ),构造初始训练集;Step2.3.2,求需要采样的样本θk对应的优化收益f(θk):(1)对于任务时序集中的每个任务Tl∈Pi,任务Tl的执行时长已知;(2)计算Pi对应的优化执行时间(3)求Step2.3.3,利用MPGR方法初步筛选U,产生稀疏子集Ls:(1)利用K近邻法从U构造一个图G,每个θk是一个节点,每个节点选取离自己欧式距离最近的k个节点形成边;(2)n=1,计算图G中每个节点的度其中,Wpq为节点p与邻居节点q的连接边权值,其中,xp,xq是节点p,q的位置矢量,t是一个可调参数,η是所有节点的最邻近距离的平均值;(3)选出度指标最高的节点p*加入Ls,并从图G剔除及p*的连接边;(4)若n=NLs,NLs为期望生成的Ls的规模,转入Step2.3.4;否则n自增,转入Step2.3.3的(2);Step2.3.4,通过训练集S训练高斯过程模型GPR为Jθ=J(θ),其中,J为输入不确定参数θ和输出收益Jθ之间的映射关系,高斯过程表示为J(θ)=GP(m(θ),k(θ,θ')),其中,均值m(θ)=Eθ[J(θ)],协方差k(θ,θ')=Eθ[(J(θ)-m(θ))(J(θ')-m(θ'))];Step2.3.5,从Ls中同时选取Ns个样本加入训练集:(1)对于每个样本θ*∈U,转入(2)进行GPR预测;(2)求预测收益分其中,均值μ(θ*)和方差∑(θ*)的计算如下:μ(θ*)=k(θ*,θS)K-1J(θS)K=k(θS,θS)其中,α和Λ为高斯训练过程的超参数;(3)选取最高评价值的Ns个样本加入训练集S,并从U中剔除(4)若训练集规模已经达到要求,则转入Step2.3.6,否则转入Step2.3.2;Step2.3.6,计算期望收益分:(1)对于每个样本θk∈S∪U,利用式(2-10)预测θk相应的任务收益本文档来自技高网...

【技术保护点】
1.一种不确定环境下的分布式多无人机任务分配方法,其特征在于包括下述步骤:步骤1,对于由Na个无人机组成的无人机编队,所有无人机均是同一类型;任务执行区域内有Nt个目标,无人机编队要对每个目标执行时敏任务,每个时敏任务的执行时间为tj,j=1,2...,Nt,其时间窗约束为ETj≤tj≤LTj,其中,ETj为任务j的最早允许开始执行时间,LTj为任务j的最晚允许开始执行时间;无人机i对目标j执行任务的收益

【技术特征摘要】
1.一种不确定环境下的分布式多无人机任务分配方法,其特征在于包括下述步骤:步骤1,对于由Na个无人机组成的无人机编队,所有无人机均是同一类型;任务执行区域内有Nt个目标,无人机编队要对每个目标执行时敏任务,每个时敏任务的执行时间为tj,j=1,2...,Nt,其时间窗约束为ETj≤tj≤LTj,其中,ETj为任务j的最早允许开始执行时间,LTj为任务j的最晚允许开始执行时间;无人机i对目标j执行任务的收益其中,Vj为目标j的价值,λ为指数折扣收益模型的递减因子,α为距离代价的惩罚因子,Lij为无人机i与目标j的欧式距离;每个任务的执行时长tj-dur=gj(θ),其中,任务环境的不确定参数θ服从分布概率密度函数p(θ),函数关系gj在仿真时由历史数据或模型仿真获得;协同分配模型目的是求解决策矩阵x,xij=1表示分配无人机i对目标j执行任务,x∈χ,每个无人机最多能够执行Li个任务,每个无人机维护以下数据信息结构:(1)任务束集(Bundle):其中bin是竞拍到的目标,表示无人机i竞拍得到的第n个任务的序号;(2)任务时序集(Path):任务时序Pi为无人机i的任务束Bi的任务执行顺序,即无人机i执行任务的顺序为(3)执行时间集(Time):τin∈R+表示无人机i根据任务时序集Pi到达任务区执行任务pin的执行时间;(4)赢家集(WinningUavs):其中元素zin表示无人机i与其所有邻接无人机通过信息交互所获得的关于任务j的赢家信息,即当前时刻无人机zin对任务j出价最高成为赢家;若当前尚未有无人机竞拍到任务j,则zi=φ;(5)赢家出价集(WinningBids):其中元素yin∈R+,用来表示当前时刻各无人机对任务j竞拍时的最大出价值,若当前尚未有无人机竞拍到任务j则yin=0;(6)时间戳集(TimeStamps):时间戳为其中元素sin∈R+,用来表示无人机i与其邻接无人机之间的最近一次信息交互时间;(7)分配时间标记:[Tip,tip],Tip为通信的时间标记,无人机之间采用同步通信机制,每次协商阶段无人机i同通信网络中的其他所有无人机进行完通信,Tip自增;tip为无人机i进行任务束构建阶段的时间标记,无人机i任务束构建完有新任务加入时,tip自增;步骤2,已知无人机i和目标j的位置矢量、目标j任务Tj的价值和时间窗,构造信息结构Bi,Pi,τi的步骤如下:Step2.1,从j=1循环迭代到j=Nt,若执行Step2.2到Step2.6,否则j自增;Step2.2,对于任务时序集Pi的每一个位置k=1到k=LPi,检测加入新任务Tj的可能性,若满足可能性转入Step2.3,LPi为无人机i的任务时序集里已经出价的任务个数;Step2.3,求Tj插在Pi的位置k竞拍出价的边际收益cij-Pik:Step2.3.1,根据已知不确定参数θ[θ1,θ2]的参数空间及分布概率密度函数p(θ),产生N个样本形成样本集,每个样本包含θ[θ1,θ2]和对应的f(θ)形成的有序对(θ,f(θ));其中,f(θ)为θ的具体取值下加入新任务Tj并插在Pi的位置k的优化任务束总收益;样本集分为训练集S和未采样样本集U,训练集S样本的f(θ)已通过计算获得,未采样样本集U的f(θ)未知;随机选取s个样...

【专利技术属性】
技术研发人员:符小卫王辉潘静高晓光
申请(专利权)人:西北工业大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1