The invention discloses a Bayesian operation method of Two Agent under the parallel allocation system, which relates to the field of artificial intelligence and multi-agent system technology. The problem to be solved is how to find an operation method of acquisition sequence which can operate successfully and obtain the maximum expected benefit under the parallel allocation system. In this method, when the operator Agent A and the participant Agent B want the same item at the same time in a certain round, in the Bayesian case, the participants will be able to obtain the same probability to allocate the item. According to the preference order of other participants, the operator will put his favorite items into the fetch sequence to judge whether it can be realized or not, until all the items are allocated and a fetch sequence with the highest expected benefit value is obtained. By adopting the technical scheme of the invention, the operator Agent A can find a fetching sequence with the greatest expected benefit value.
【技术实现步骤摘要】
在并行分配制度下Two-Agent的贝叶斯操作方法
本专利技术涉及人工智能及多Agent系统
,尤其涉及在并行分配制度下Two-Agent的贝叶斯操作方法。
技术介绍
最近几年国内外的研究中,一些将计算效率纳入考虑范围的对分配制度设计问题的研究发现,各种不考虑私有信息但能彻底封杀单Agent操弄行为的制度,例如VCG制度,计算效率很低,而各种考虑私有信息且计算效率很高的制度无法彻底防止通过不诚实行为获得额外利益的情况出现。对计算效率的考虑使人们对设计合理分配制度的思考有了新的务实的方向:尽管无法彻底消除不诚实行为出现的可能性,但如果各Agent在某分配制度下想要找到能为其带来额外利益的不诚实行为,例如操作行为和串谋行为,那么它们将面临难以接受的巨量计算任务,例如相关的计算问题是NP-hard的,则可以认为该制度是有限可靠的即参与分配的Agent都倾向于采用诚实的行为。因此在设计面向多个自利Agent的分配制度时,需要考虑:(1)在各自利Agent都诚实地参与分配过程的情况下,能否有效地即在多项式时间内,计算得到兼顾经济效益和社会平等的分配结果;(2)若某个或某些自利Agent企图寻找可以带来额外利益的非诚实行动方案,那么他们所面临的计算任务是否异常巨大。近年来人工智能领域的学者们开始尝试同时从以上这两方面研究如何设计面向多个自利Agent的分配制度。近年来人工智能领域的学者们开始尝试同时从以上这两方面研究如何设计面向多个自利Agent的分配制度。Huangwei研究设计了一个新型无诱导的并行分配制度框架即并行分配制度。在该框架下采用一种不会随问题规模 ...
【技术保护点】
1.一种在并行分配制度下Two‑Agent的贝叶斯操作方法,其特征在于:包括如下步骤:(1)定义一个三元组
【技术特征摘要】
1.一种在并行分配制度下Two-Agent的贝叶斯操作方法,其特征在于:包括如下步骤:(1)定义一个三元组用表示被分配的物品集合;表示操作者有50%概率拿到的物品集合;表示操作者拿不到的物品集合;N=2,表示参与分配操作者Agent的数量,用Agent-A和Agent-B表示;每个Agent对物品的偏好顺序集合由表示;在分配物品的每一轮中,操作者各自选择自己最想要拿取的物品,被选中的物品将被分配出去;(2)当操作者Agent-A和参与者Agent-B某轮同时想要同一个物品时,则会采用每个参与者都能以相同的概率获得该物品的方法;(3)操作者Agent-A在贝叶斯情况下,采用的操作策略为,根据自己对分配物品的喜好顺序依次把第i轮(i=1、2、3...且i≤n)的物品放入拿取序列进行判断能否成功插入序列中,直到分配完所有物品后,得到一个期望效益最大的物品拿取序列。2.根据权利要求1所述的在并行分配制度下Two-Agent的贝叶斯操作方法,其特征在于:步骤(3)中,所述贝叶斯情况操作策略具体过程如下:1)设定操作者Agent-A提前知道了参与者Agent-B对物品的偏好顺序且Agent-B会诚实的按照自己的偏好顺序去报告每一轮想要拿取的物品;2)判断物品放入拿取序列δ能否成功,需要满足下面的条件:上述式中,表示当前第i轮没有拿到的物品集合,o表示当前第i轮试图加入拿取序列δ的物品,表示所有被分配的物品集合,表示参与者Agent-B认为在集合中比o物品要好的物品集,δ表示操作者最优的拿取序列,IPO...
【专利技术属性】
技术研发人员:黄巍,黄宇,卢雨戈,唐倩,
申请(专利权)人:桂林电子科技大学,
类型:发明
国别省市:广西,45
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。