System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于组合多臂老虎机和双边拍卖的数据交易方法技术_技高网

基于组合多臂老虎机和双边拍卖的数据交易方法技术

技术编号:40422654 阅读:5 留言:0更新日期:2024-02-20 22:42
本发明专利技术公开了一种基于组合多臂老虎机和双边拍卖的数据交易方法,包括:基于组合多臂老虎机算法,数据平台从数据质量未知的数据提供者中选择数据工人;基于双边拍卖算法,运营端确定每个数据请求者的最佳收益和最佳支付成本;根据最佳收益和最佳支付成本得到的社会效益最大。通过组合多臂赌博机算法从信息未知的数据提供者中选择数据工人,能够确保后续数据交易过程中数据平台提供的数据的数据质量,提高数据平台收集数据的准确性和一致性,提高数据的可信度和可用性;通过迭代的双边拍卖算法确定的最佳支付成本和最佳收益能够使得社会利益最大化。

【技术实现步骤摘要】

本专利技术属于计算机,具体涉及一种基于组合多臂老虎机和双边拍卖的数据交易方法


技术介绍

1、典型的数据交易系统包括一个驻留在云上的平台。通过该平台,服务请求者可以公布自己的感知任务,并招募移动用户(即工作人员)来完成这些任务。一般来说,由于不同的智能手机和移动行为,即使是相同的任务,员工也可能会产生不同的感知质量。因此,招聘工人以达到更高的完工质量或更低的成本是mcs中最重要的问题之一。近年来在设计工人招聘或任务分配算法方面做了大量的工作。然而,大多数现有的工作假设工人的感知素质是事先已知的,这在实践中是不正确的。

2、因此,基于上述条件已知的假设设计的数据交易系统经常只能得到社会效益的次优解,不能实现社会效益的最大化。


技术实现思路

1、本专利技术实施例提供了一种基于组合多臂老虎机和双边拍卖的数据交易方法,可以解决基于工人数据质量已知的假设设计的数据交易系统经常只能得到社会效益的次优解,不能实现社会效益的最大化的问题。

2、第一方面,本专利技术实施例提供的一种基于组合多臂老虎机和双边拍卖的数据交易方法,所述方法应用于数据交易系统,所述数据交易系统包括数据平台和运营端,所述方法包括:

3、基于组合多臂老虎机算法,数据平台从数据质量未知的数据提供者中选择数据工人,其中,数据工人的数据质量较高;

4、基于双边拍卖算法,运营端确定每个数据请求者的最佳收益和最佳支付成本;

5、其中,最佳收益为数据请求者从数据平台获取的收益,数据请求者的最佳支付成本为数据请求者支付给数据平台的费用,最佳支付成本是根据数据平台的最佳数据提供量确定的,数据平台提供的数据是由数据工人获取的,根据最佳收益和最佳支付成本得到的社会效益最大。

6、根据本专利技术提供的方法,通过组合多臂赌博机算法从信息未知的数据提供者中选择数据工人,能够确保后续数据交易过程中数据平台提供的数据的数据质量,提高数据平台收集数据的准确性和一致性,提高数据的可信度和可用性;通过迭代双边拍卖算法确定的最佳支付成本和最佳收益能够使得社会利益最大化。

7、在第一方面的一种可能的实现方式中,数据平台可以选取每一个数据提供者进行在线学习,得到所有数据提供者的初始置信上界指数;然后基于多臂老虎机算法,根据数据提供者的第t-1个质量成本比,选取k个数据提供者进行第t轮在线学习,以更新每个数据提供者的第t个置信上界指数,并根据第t个置信上界指数确定第t个质量成本比;一直基于多臂老虎机算法,进行在线学习,直至预算消耗尽为止;最后将第t个质量成本比较高的前k个数据提供者,确定为数据工人。

8、示例性的,数据提供者在进行在线学习时需执行至少一个数据获取任务。数据提供者在执行数据获取任务时消耗部分预算。

9、示例性的,t=1,2……t,第0个置信上界指数为初始置信上界指数。初始置信上界指数和置信上界指数是根据数据提供者执行数据获取任务时获取到的数据的数据质量确定的。

10、在第一方面的一种可能的实现方式中,数据平台可以选取第t-1个质量成本比较高的前k个数据提供者,进行第t轮在线学习,得到第k个学习者的第t个任务执行次数,和第k个学习者在执行第m个数据获取任务时获取到的数据的数据质量;根据第k个学习者的第t-1个置信上界指数、第k个学习者的第t个任务执行次数,和第k个学习者在执行数据获取任务时获取到的数据的数据质量,确定第k个学习者的第t个置信上界指数;根据非学习者的第t-1个置信上界指数,确定非学习者的第t个置信上界指数。

11、示例性的,学习者为进行第t轮在线学习的数据提供者,k=1,2……k,m=1,2……mn,mn为第n个数据提供者的任务执行次数,任务执行次数为学习者进行第t轮在线学习时执行的数据获取任务的总数。

12、示例性的,非学习者为未进行第t轮在线学习的数据提供者。

13、在第一方面的一种可能的实现方式中,数据提供者的第t个置信上界指数可以满足下述公式:

14、

15、

16、其中,为第n个数据提供者的第t个置信上界指数;为可加性因子;为在进行前t轮在线学习时,第n个数据提供者执行的数据获取任务的总数;α为一个正的超参数;为数据提供者的第t个数据质量均值,φn,t=0表示第n个数据提供者为非学习者,φn,t=1表示第n个数据提供者为学习者,mn为第n个数据提供者的任务执行次数,为第n个数据提供者在进行第t轮在线学习时执行的第m个数据获取任务的数据质量。

17、在第一方面的一种可能的实现方式中,运营端可以基于双边拍卖算法,确定多个数据请求者的最佳数据请求量和数据平台提供给每个数据请求者的最佳数据提供量;根据数据请求者的最佳数据请求量,确定数据请求者的最佳支付成本;根据数据平台的最佳数据提供量,确定数据请求者的最佳收益。

18、在第一方面的一种可能的实现方式中,运营端可以根据数据请求者的第i个第一拉格朗日乘子、学习率、第i个数据请求量及数据平台的第i个数据提供量,确定数据请求者的第i+1个第一拉格朗日乘子;根据学习率、第i个第二拉格朗日乘子及第i个数据提供量,确定第i+1个第二拉格朗日乘子;分别确定数据提供者的第i+1个第一拉格朗日乘子的第一差值比率是否小于第一阈值,第i+1个第二拉格朗日乘子的第二差值比率是否小于第二阈值;若数据提供者的第i+1个第一拉格朗日乘子的第一差值比率小于第一阈值,并且第i+1个第二拉格朗日乘子的第二差值比率小于第二阈值,则将数据请求者的第i个数据请求量确定为数据请求者的最佳数据请求量,并将数据平台的第i个数据提供量确定为最佳数据提供量。

19、在第一方面的一种可能的实现方式中,在确定最佳数据请求量之前,运营端可以基于第一分配模型,根据数据请求者的第i-1个数据请求量,确定运营端分配给数据请求者的第i个数据请求分配量;根据数据请求者的第i个第一拉格朗日乘子和第i个数据请求分配量,确定数据请求者第i次出价的第i个数据请求量;基于第二分配模型,根据数据平台的第i-1个数据提供量,确定运营端分配给数据平台的第i个数据提供分配量;根据第i个第二拉格朗日乘子和数据请求者的第i个第一拉格朗日乘子及第i个数据提供分配量,确定数据平台第i次出价时对数据请求者的第i个数据提供量。

20、根据本专利技术提供的方法,通过组合多臂赌博机算法从信息未知的数据提供者中选择数据工人,能够确保后续数据交易过程中数据平台提供的数据的数据质量,提高数据平台收集数据的准确性和一致性,提高数据的可信度和可用性;通过迭代双边拍卖算法确定的最佳支付成本和最佳收益能够使得社会利益最大化。进一步的,基于数据提供者的ucb指数来选择数据工人,能够实现多臂老虎机问题中探索和利用之间的权衡;使用ucb指数和成本的比值,即质量成本比,选择数据工人,能够确保拍卖机制的真实性;通过第一分配模型和第二分配模型确定下一轮数据平台和数据请求者的出价,能够诱导数据请求者和数据平台以真实的方式投标。

本文档来自技高网...

【技术保护点】

1.一种基于组合多臂老虎机和双边拍卖的数据交易方法,其特征在于,所述方法应用于数据交易系统,所述数据交易系统包括数据平台和运营端,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于组合多臂老虎机算法,所述数据平台从数据质量未知的所述数据提供者中选择数据工人,包括:

3.根据权利要求2所述的方法,其特征在于,基于多臂老虎机算法,根据所述数据提供者的第t-1个质量成本比,选取K个所述数据提供者进行第t轮在线学习,以更新每个所述数据提供者的第t个置信上界指数,包括:

4.根据权利要求3所述的方法,其特征在于,所述数据提供者的第t个所述置信上界指数可以满足下述公式:

5.根据权利要求1所述的方法,其特征在于,所述基于双边拍卖算法,所述运营端确定每个数据请求者的最佳收益和最佳支付成本,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于双边拍卖算法,所述运营端确定多个所述数据请求者的最佳数据请求量和所述数据平台提供给每个所述数据请求者的最佳数据提供量,包括:

7.根据权利要求6所述的方法,其特征在于,在所述根据所述数据请求者的第i个第一拉格朗日乘子、学习率、第i个所述数据请求量及所述数据平台的第i个所述数据提供量,确定所述数据请求者的第i+1个第一拉格朗日乘子之前,所述方法还包括:

8.一种数据交易系统,其特征在于,所述数据交易系统包括数据平台和运营端;

9.一种电子设备,包括存储器、处理器以及存储在所述存储器中的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7任一项所述的方法。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的方法。

...

【技术特征摘要】

1.一种基于组合多臂老虎机和双边拍卖的数据交易方法,其特征在于,所述方法应用于数据交易系统,所述数据交易系统包括数据平台和运营端,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于组合多臂老虎机算法,所述数据平台从数据质量未知的所述数据提供者中选择数据工人,包括:

3.根据权利要求2所述的方法,其特征在于,基于多臂老虎机算法,根据所述数据提供者的第t-1个质量成本比,选取k个所述数据提供者进行第t轮在线学习,以更新每个所述数据提供者的第t个置信上界指数,包括:

4.根据权利要求3所述的方法,其特征在于,所述数据提供者的第t个所述置信上界指数可以满足下述公式:

5.根据权利要求1所述的方法,其特征在于,所述基于双边拍卖算法,所述运营端确定每个数据请求者的最佳收益和最佳支付成本,包括:

6.根据权利要求5所述的方法,...

【专利技术属性】
技术研发人员:刘佳李晓旭徐扬沈玉龙刘晓媛谢盟
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1