当前位置: 首页 > 专利查询>深圳大学专利>正文

基于CCV-MAB的群智感知任务分配方法、装置、设备及存储介质制造方法及图纸

技术编号:38996372 阅读:9 留言:0更新日期:2023-10-07 10:27
本发明专利技术适用群智感知技术领域,提供了一种基于CCV

【技术实现步骤摘要】
基于CCV

MAB的群智感知任务分配方法、装置、设备及存储介质


[0001]本专利技术属于群智感知
,尤其涉及一种基于CCV

MAB的群智感知任务分配方法、装置、设备及存储介质。

技术介绍

[0002]群智感知计算是一种典型的基于群体智能的应用,其中任务的执行者主要通过移动设备参与任务,这种方式的优势在于其广泛的覆盖范围和实时性,然而,这也带来了一系列的复杂性,尤其是在任务分配方面。群体智能的本质是利用大规模人群的智慧、技能和资源来实现共同的目标,然而,当这种模式应用于移动感知环境时,任务的分配和协调变得尤其重要,实际上,寻找最佳的任务分配策略是群智感知问题的核心挑战之一。
[0003]在群智感知中,任务分配的困难主要源于以下几个方面:
[0004](1)合适的人群选择:每一个雇佣的人都需要花费一定的代价,如何将任务分配给最合适的人群成为了一项巨大的挑战。这需要考虑到参与者的技能、兴趣、地理位置等多种因素;
[0005](2)用户间的协作:对于复杂的任务,如开源项目开发,通常需要前端、后端以及核心业务的协同工作。如果某个领域的参与者过多,可能会影响项目的整体进度。因此,如何平衡不同领域的参与者,促进他们之间的合作,是一个重要的问题;
[0006](3)动态调整:随着任务的进行,可能需要动态地调整雇佣用户的数量。例如,任务难度可能超过预期,或者某些参与者可能无法按时完成任务。因此,如何根据任务难度和用户能力动态调整任务分配,是另一个关键挑战。
[0007]总的来说,群智感知的任务分配问题需要考虑到多方面的因素,并需要在实时性和有效性之间找到平衡。目前已经有一些研究尝试解决群智感知中的任务分配问题。如一种基于神经网络的组合式多臂老虎机算法(Neural Multi

armed Bandit,Neural

MAB)是用于解决群智感知中的任务分配问题,该算法利用一个神经网络来预测每个单独用户(即单臂)的奖励,另一个神经网络用于选择一组用户(即超级臂)来完成一个任务,该算法融合了梯度上升和置信上界策略以进行任务分配,并通过用户反馈来更新神经网络的参数和置信上界,然而,这种方法存在一明显不足,即它忽略了用户之间的关系,换句话说,某个用户的个人奖励可能受到其他用户行为的影响,因此我们无法在不考虑其他用户的情况下准确评估某个用户的个人奖励,举例来说,在为用户推荐当地餐厅的任务时,平台不希望将所有用户推荐到同一个高分餐厅,以最大化评论的多样性和用户的体验,这也可以说明,用户之间的相互关系是任务分配过程中的重要因素。还有一种用于解决上下文相关的组合式易变多臂老虎机问题的算法(Contextual Combinatorial Volatile Multi

armed Bandit with Adaptive Discretization,CCV

MAB),CCV

MAB算法即在每一轮中,平台需要根据用户的上下文信息(如位置、设备类型等)选择一组任务分配给用户,以最大化整体的感知效果,该算法考虑了两个特点:一是任务的可用性可能会随时间变化,即易变臂;二是任务的
总奖励可能不是单个任务奖励的简单求和,而是具有递减收益特性的子模函数,即子模奖励。然而,子模奖励也有一些缺陷,尤其是在某些群智感知问题上,一方面,子模奖励可能不能完全反映用户和任务之间的复杂关系,因为它忽略了用户的个性化偏好和任务的难易程度等因素;另一方面,子模奖励可能导致一些不合理或者不公平的结果,因为它倾向于选择那些与已选任务相关性低或者冗余性高的任务,而忽略了那些与已选任务相关性高或者冗余性低的任务,例如,在群智感知系统中,如果一个用户已经完成了一些关于某个主题的任务,那么子模奖励可能会分配给他一些与这个主题无关或者相反的任务,这可能会降低他的兴趣和动机;而另一个用户可能只接收到与这个主题相关或者相同的任务,这可能会增加他的负担和压力。

技术实现思路

[0008]本专利技术的目的在于提供一种基于CCV

MAB的群智感知任务分配方法、装置、设备及存储介质,旨在解决由于现有技术无法提供一种有效的群智感知任务分配方法,导致群智感知任务分配效率低、任务完成质量不高的问题。
[0009]一方面,本专利技术提供了一种基于CCV

MAB的群智感知任务分配方法,所述方法包括下述步骤:
[0010]获取当前群智感知问题下所有用户的用户特征和当前任务的任务特征;
[0011]通过预先创建的决策模型对所述用户特征和所述任务特征进行处理,得到每个所述用户的选中概率;
[0012]根据所述选中概率对所有所述用户进行采样,得到目标用户组;
[0013]通过预先创建的评估模型对所述目标用户组内每个用户的用户特征和所述任务特征进行处理,得到估计奖励;
[0014]根据所述目标用户组,通过预先构建的基于CCV

MAB的群智感知任务分配模型获得真实奖励;
[0015]根据所述估计奖励和所述真实奖励,对所述决策模型和所述评估模型的模型参数进行调整,并跳转至所述获取当前群智感知问题下所有用户的用户特征和当前任务的任务特征的步骤,以进行下一轮的任务分配。
[0016]优选地,所述通过预先创建的决策模型对所述用户特征和所述任务特征进行处理的步骤,包括:
[0017]通过所述决策模型中的第一子模块对所述用户特征和所述任务特征进行特征交互,得到每个所述用户的特征向量;
[0018]通过所述决策模型中的第二子模块对所述特征向量进行处理,得到对应的所述选中概率。
[0019]优选地,所述第一子模块由转换器模型的编码器组成,所述第二子模块由一个多层感知机组成。
[0020]优选地,所述评估模型由转换器模型的编码器和多个多层感知机组成。
[0021]另一方面,本专利技术提供了一种基于CCV

MAB的群智感知任务分配装置,所述装置包括:
[0022]特征获取单元,用于获取当前群智感知问题下所有用户的用户特征和当前任务的
任务特征;
[0023]概率获得单元,用于通过预先创建的决策模型对所述用户特征和所述任务特征进行处理,得到每个所述用户的选中概率;
[0024]用户采样单元,用于根据所述选中概率对所有所述用户进行采样,得到目标用户组;
[0025]特征处理单元,用于通过预先创建的评估模型对所述目标用户组内每个用户的用户特征和所述任务特征进行处理,得到估计奖励;
[0026]奖励获得单元,用于根据所述目标用户组,通过预先构建的基于CCV

MAB的群智感知任务分配模型获得真实奖励;以及
[0027]参数调整单元,用于根据所述估计奖励和所述真实奖励,对所述决策模型和所述评估模型的模型参数进行调整,并触发所述特征获取单元,以进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于CCV

MAB的群智感知任务分配方法,其特征在于,所述方法包括下述步骤:获取当前群智感知问题下所有用户的用户特征和当前任务的任务特征;通过预先创建的决策模型对所述用户特征和所述任务特征进行处理,得到每个所述用户的选中概率;根据所述选中概率对所有所述用户进行采样,得到目标用户组;通过预先创建的评估模型对所述目标用户组内每个用户的用户特征和所述任务特征进行处理,得到估计奖励;根据所述目标用户组,通过预先构建的基于CCV

MAB的群智感知任务分配模型获得真实奖励;根据所述估计奖励和所述真实奖励,对所述决策模型和所述评估模型的模型参数进行调整,并跳转至所述获取当前群智感知问题下所有用户的用户特征和当前任务的任务特征的步骤,以进行下一轮的任务分配。2.如权利要求1所述的方法,其特征在于,所述通过预先创建的决策模型对所述用户特征和所述任务特征进行处理的步骤,包括:通过所述决策模型中的第一子模块对所述用户特征和所述任务特征进行特征交互,得到每个所述用户的特征向量;通过所述决策模型中的第二子模块对所述特征向量进行处理,得到对应的所述选中概率。3.如权利要求2所述的方法,其特征在于,所述第一子模块由转换器模型的编码器组成,所述第二子模块由一个多层感知机组成。4.如权利要求1所述的方法,其特征在于,所述评估模型由转换器模型的编码器和多个多层感知机组成。5.一种基于CCV

MAB的群智感知任务分配装置,其特征在于,所述装置包括:特征获取单元,用于获取当前群智感知问题下所有用户的用户特征和当前任务的任务特征;概率获得单元,...

【专利技术属性】
技术研发人员:江常坤蒋伯鸿
申请(专利权)人:深圳大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1