在并行分配制度下Two-Agent的贝叶斯操作方法技术

技术编号:21225407 阅读:20 留言:0更新日期:2019-05-29 06:09
本发明专利技术公开了一种在并行分配制度下Two‑Agent的贝叶斯操作方法,涉及人工智能及多Agent系统技术领域,解决的问题是在并行分配制度下,如何找到一个能成功操作得到期望效益最大的拿取序列的操作方法。在该方法中,当操作者Agent‑A和参与者Agent‑B在某轮同时想要同一个物品时,在贝叶斯情况下,则会采用参与者都能以同等的概率获得该物品的方法来进行分配。操作者会根据其他参与者对分配物品的喜好顺序⊳,依次把自己最喜爱的物品放入拿取序列进行判断能否实现,直到分配完所有物品,得到一个期望效益值最高的拿取序列。采用本发明专利技术技术方案可使操作者Agent‑A找到一个期望效益值最大的拿取序列。

Bayesian Operating Method of Two-Agent under Parallel Distribution System

The invention discloses a Bayesian operation method of Two Agent under the parallel allocation system, which relates to the field of artificial intelligence and multi-agent system technology. The problem to be solved is how to find an operation method of acquisition sequence which can operate successfully and obtain the maximum expected benefit under the parallel allocation system. In this method, when the operator Agent A and the participant Agent B want the same item at the same time in a certain round, in the Bayesian case, the participants will be able to obtain the same probability to allocate the item. According to the preference order of other participants, the operator will put his favorite items into the fetch sequence to judge whether it can be realized or not, until all the items are allocated and a fetch sequence with the highest expected benefit value is obtained. By adopting the technical scheme of the invention, the operator Agent A can find a fetching sequence with the greatest expected benefit value.

【技术实现步骤摘要】
在并行分配制度下Two-Agent的贝叶斯操作方法
本专利技术涉及人工智能及多Agent系统
,尤其涉及在并行分配制度下Two-Agent的贝叶斯操作方法。
技术介绍
最近几年国内外的研究中,一些将计算效率纳入考虑范围的对分配制度设计问题的研究发现,各种不考虑私有信息但能彻底封杀单Agent操弄行为的制度,例如VCG制度,计算效率很低,而各种考虑私有信息且计算效率很高的制度无法彻底防止通过不诚实行为获得额外利益的情况出现。对计算效率的考虑使人们对设计合理分配制度的思考有了新的务实的方向:尽管无法彻底消除不诚实行为出现的可能性,但如果各Agent在某分配制度下想要找到能为其带来额外利益的不诚实行为,例如操作行为和串谋行为,那么它们将面临难以接受的巨量计算任务,例如相关的计算问题是NP-hard的,则可以认为该制度是有限可靠的即参与分配的Agent都倾向于采用诚实的行为。因此在设计面向多个自利Agent的分配制度时,需要考虑:(1)在各自利Agent都诚实地参与分配过程的情况下,能否有效地即在多项式时间内,计算得到兼顾经济效益和社会平等的分配结果;(2)若某个或某些自利Agent企图寻找可以带来额外利益的非诚实行动方案,那么他们所面临的计算任务是否异常巨大。近年来人工智能领域的学者们开始尝试同时从以上这两方面研究如何设计面向多个自利Agent的分配制度。近年来人工智能领域的学者们开始尝试同时从以上这两方面研究如何设计面向多个自利Agent的分配制度。Huangwei研究设计了一个新型无诱导的并行分配制度框架即并行分配制度。在该框架下采用一种不会随问题规模改变的简单分配协议,并且将之与最优的顺序分配协议作实验和理论比较,例如Bouveret和Lang在他们发表于IJCAI2011的论文里提出最优猜想,Kalinowski和Walsh则在他们发表于IJCAI2013的论文里给出了证明。发现无论在经济效益还是社会平等的标准下,该协议都打败了在这些标准下相应的最优顺序分配协议,并进一步探讨了在该协议下进行目标资源集合与最大安全收益操弄的计算性问题还初步分析了在该制度框架下实现操弄行为的计算复杂性。公开号为:CN109034361A名称为:“一种基于并行分配制度下Two-Agent的悲观操作方法”的中国专利技术公开了一种分配方法,包括步骤:(1)在分配过程的每一个步骤里,根据指定的“并行机制”,将选择公开报告自己在剩下的所有物品中最喜欢的物品,然后物品将被分配出去;(2)当Agent同时想要同一个物品时,则通过抛硬币的方式随机决定,但当操作者Agent-A在悲观策略下,默认当两个Agent在同一轮同时报告同一个物品时,悲观的认为自己不可能拿到该物品,会避免与其他操作者同时报告某个物品;(3)操作者Agent-A提前知道其他Agent的物品喜爱顺序,通过自己的悲观操作策略,让自己获得最优的物品集,直到物品分配完毕。该专利技术的技术方案研究了操弄者如何在悲观情况下获得最优物品集、实现利益最大化的操作策略。但并不是Agent都会悲观的认为在分配过程中拿不到与其他Agent竞争的物品,没有讨论更加普遍的贝叶斯情况即同一个物品在竞争时,无法知道每个Agent的期望效益是多少,达到真正的最大化利益。
技术实现思路
针对现有技术的不足,本专利技术所解决的技术问题是在并行分配制度下,如何找到一个能成功操作得到期望效益最大的拿取序列的操作方法。为解决上述技术问题,本专利技术采用的技术方案是一种在并行分配制度下Two-Agent的贝叶斯操作方法,包括如下步骤:(1)定义一个三元组用表示被分配的物品集合;表示操作者有50%概率拿到的物品集合;表示操作者拿不到的物品集合;N=2,表示参与分配操作者Agent的数量,用Agent-A和Agent-B表示;每个Agent对物品的偏好顺序集合由表示;在分配物品的每一轮中,操作者各自选择自己最想要拿取的物品,被选中的物品将被分配出去;(2)当操作者Agent-A和参与者Agent-B某轮同时想要同一个物品时,则会采用每个参与者都能以相同的概率获得该物品的方法;(3)操作者Agent-A在贝叶斯情况下,采用的操作策略为,根据自己对分配物品的喜好顺序依次把第i轮(i=1、2、3...且i≤n)的物品放入拿取序列进行判断能否成功插入序列中,直到分配完所有物品后,得到一个期望效益最大的物品拿取序列,其具体过程如下:1)设定操作者Agent-A提前知道了参与者Agent-B对物品的偏好顺序且Agent-B会诚实的按照自己的偏好顺序去报告每一轮想要拿取的物品;2)判断物品放入拿取序列δ能否成功,需要满足下面的条件:上述式中,表示当前第i轮没有拿到的物品集合,o表示当前第i轮试图加入拿取序列δ的物品,表示所有被分配的物品集合,表示参与者Agent-B认为在集合中比o物品要好的物品集,δ表示操作者最优的拿取序列,IPOS表示物品o在拿取序列中插入的位置,表示操作者有50%概率拿到的物品集合;当前第i轮要插入拿取序列δ的物品o,如果满足等式(1),就可以认为在拿取该物品之前,参与者Agent-B能拿到比物品o要好的物品数大于或等于操弄者Agent-A拿到比物品o要好的物品数量;故第i轮操弄者Agent-A有几率拿到该物品o;当等式(1)取大于号,则物品o一定可以拿到;当等式(1)取等于号,则物品o被拿到的概率为50%,且放入集合中;3)物品o满足等式(1)插入拿取序列δ之后,需要检验其他拿取序列δ中的物品是否因为物品o的插入拿取概率发生了改变,所以需要一次检验整个拿取序列δ;判断物品是否需要检验,需要满足下面的条件:上述式中,j依次表示拿取序列δ从1到|δ|的位置,δ(j)则表示在拿取序列δ中j这个位置上的物品;若在拿取序列δ中属于集合中的物品和与当前插入位置IPOS相同的物品,都不用检验物品的拿取概率;其余位置上的物品判断是否拿取概率改变,需要满足下面的条件:如果物品δ(j)不满足等式(3)的判定条件,那么物品o插入拿取序列的位置IPOS则需要往后挪一位,IPOS=IPOS+1;然后再回到等式(1)继续判定,成功之后再检验,检验成功之后才算是能加入到拿取序列δ中;且插入物品o的次数由的值决定,如果物品o成功插入且属于集合,则EXPNUMO减去0.5;如果插入成功单不属于集合,则EXPNUMO减去1;直到EXPNUMO的值为0,不再继续插入物品o进入拿取序列δ,且此时的拿取序列δ为最优的贝叶斯情况下的拿取序列δ。与现有技术相比,采用本专利技术的技术方案,基于并行分配制度下,当满足条件:对于则可以保证基于操作者Agent-A的物品偏好顺序的拿取序列δ能够被找到,得到一个期望效益最大的物品集。附图说明图1为本专利技术操作流程图;图2为检验一个物品能否插入拿取序列操作流程图;图3为两个Agent对自己心中最喜爱物品的一个偏好排序;图4为操作者Agent-A的最优操作序列和真实喜好序列、Agent-B的真实喜好序列;图5为两个Agent都诚实的情况下,每个Agent分配到自己最喜爱物品的一个分配结果;图6为操作者Agent-A进行贝叶斯策略操作,在Agent-B诚实的情况下,每个Agent分配到物品的一个分配结果;图7为两个Agent本文档来自技高网
...

【技术保护点】
1.一种在并行分配制度下Two‑Agent的贝叶斯操作方法,其特征在于:包括如下步骤:(1)定义一个三元组

【技术特征摘要】
1.一种在并行分配制度下Two-Agent的贝叶斯操作方法,其特征在于:包括如下步骤:(1)定义一个三元组用表示被分配的物品集合;表示操作者有50%概率拿到的物品集合;表示操作者拿不到的物品集合;N=2,表示参与分配操作者Agent的数量,用Agent-A和Agent-B表示;每个Agent对物品的偏好顺序集合由表示;在分配物品的每一轮中,操作者各自选择自己最想要拿取的物品,被选中的物品将被分配出去;(2)当操作者Agent-A和参与者Agent-B某轮同时想要同一个物品时,则会采用每个参与者都能以相同的概率获得该物品的方法;(3)操作者Agent-A在贝叶斯情况下,采用的操作策略为,根据自己对分配物品的喜好顺序依次把第i轮(i=1、2、3...且i≤n)的物品放入拿取序列进行判断能否成功插入序列中,直到分配完所有物品后,得到一个期望效益最大的物品拿取序列。2.根据权利要求1所述的在并行分配制度下Two-Agent的贝叶斯操作方法,其特征在于:步骤(3)中,所述贝叶斯情况操作策略具体过程如下:1)设定操作者Agent-A提前知道了参与者Agent-B对物品的偏好顺序且Agent-B会诚实的按照自己的偏好顺序去报告每一轮想要拿取的物品;2)判断物品放入拿取序列δ能否成功,需要满足下面的条件:上述式中,表示当前第i轮没有拿到的物品集合,o表示当前第i轮试图加入拿取序列δ的物品,表示所有被分配的物品集合,表示参与者Agent-B认为在集合中比o物品要好的物品集,δ表示操作者最优的拿取序列,IPO...

【专利技术属性】
技术研发人员:黄巍黄宇卢雨戈唐倩
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:广西,45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1