众包任务推荐中的自适应指数衰减算法制造技术

技术编号:27589131 阅读:17 留言:0更新日期:2021-03-10 10:05
本发明专利技术公开了一种众包场景下根据实时竞争情况对为工人推荐任务的离线模型预测值进行衰减的自适应指数衰减算法。本发明专利技术根据不同离线预测模型预测值的分布差异,设计了一种根据离线预测值的局部分布和全局分布自适应调整指数衰减参数的算法。该模型中全局分布决定指数衰减强度的上界,局部分布是否能达到这个上界,其中局部分布的绝对分布用于决定初始局部分布强度的增减,相对分布决定增减的强度。模型在调整超参数后在不同离线模型间有泛化能力。该模型稳定了众包场景下因工人间非独立性导致的推荐列表有关指标异常波动问题。性导致的推荐列表有关指标异常波动问题。性导致的推荐列表有关指标异常波动问题。

【技术实现步骤摘要】
众包任务推荐中的自适应指数衰减算法
一、

[0001]本专利技术涉及推荐算法领域,尤其涉及众包竞争下的任务推荐,具体是一种根 据离线预测值分布的自适应参数指数衰减方法。
二、
技术介绍

[0002]众包作为一种创新商业模式,促进了群体的开放式创新。近年来共享经济的 发展也促进了众包模式的迅速发展。将推荐算法应用于众包有助于众包任务的承 接方(通常称为工人)难以选择众包可能性大的任务进行投标,以及降低发布方 的筛选成本,提升工人和承接方的用户体验。但其它场景下的推荐算法却不能直 接应用于众包。众包平台的特殊性在于其多角色的用户、级联的用户行为、任务 时效性和用户间的非独立性等,专利技术在于用户的非独立性带来的推荐算法指标异 常波动问题,而用户的非独立性主要体现在工人之间的竞争问题。但现有算法没 有考虑到众包任务的用户非独立性。首先现有推荐算法框架在输入关系上可分为 排序学习中的单点法、配对法和列表法。排序学习中的单点法中每一个训练样本 都仅仅是某一个查询关键字(即推荐算法中用户)和某一个文档(即推荐算法中 物品)的配对。用户之间是否相关,与其他文档和其他查询关键字都没有关系, 在众包场景中,即假设工人间和发布方间都独立。配对法对样本进行两两比较, 构建偏序文档对,从比较中学习排序,组合任意两个文档形成文档对作为输入样 本,但配对法任考虑的是文档对(本专利技术中即任务)而非用户之间的相关性。而 列表法考虑的是当前文档排序和最优排序差值,也是文档对(本专利技术中即任务) 而非用户之间的相关性。因此现有的三种排序学习的方法不能解决工人之间的竞 争问题。现有衰减的应用都是针对场景对基础衰减函数进行改进,需要针对不同 已知量(时间偏移)或已知不同形式的数据(地震波、水波),在此基础上引入 场景因素进行衰减,而使用场景和本专利技术众包场景差异巨大,以往工作还没有针 对这类场景的衰减函数构造。因此本专利技术在利用离线模型得到预测值后,在线上 部分使用自适应参数的衰减算法根据竞争强度确定衰减强度,得到在线预测值, 既能利用神经网络的良好表征和学习能力,又能捕捉线上实时的竞争情况。
[0003]机器学习和深度学习广泛应用于推荐算法之前,部分研究利用衰减函数来捕 获用户兴趣或物品属性随时间的变化,作为一种修正或补充手段,结合用户打分、 协同过滤等等传统方法进行建模进而实现推荐。Medo M等人提出了一种自适应 模型,将用户评分模式的相似度与新闻在演进网络上的流行式传播相结合,通过 用户对新闻的正负反馈衡量用户间相似度,通过随后引入的推荐分数的持续时间 衰减实现新颖的新闻推荐(Medo M,Zhang Y,Zhou T,et al.Adaptive modelfor recommendation of news[J].EPL,2009,88(3))。杨立等人考虑到用户的 偏好会随时间而改变,因此引入时间衰减与偏好波动共同获取用户偏好。用衰减 速度和衰减增量定义衰减函数(杨立,胡运红,邵桂荣.融合时间衰减与偏好波动 的协同偏好获取方法[J].计算机应用,2016,36(07):2011

2015.)。Anelli V M 等人将物品的流行程度引入协同过滤算法中提出TimePop算法,并且不考虑全局 的流行度,只考虑了物品在用户近邻间的流行度。并且在选择候选项是避免使用 时间窗口,也避
免固定标签数量的候选项(Anelli V W,Di Noia T,Di SciascioE,et al.Local popularity and time in top

n recommendation[C]//EuropeanConference on Information Retrieval.Springer,Cham,2019:861

868.)。
[0004]近年来有少数研究结合机器学习和衰减函数进行推荐。Liu H等人分析了用 户的标签行为,验证了标签的频率、时间和顺序位置是否反映了用户的兴趣,以 及它是如何随着这三个特征而变化的。为了揭示用户兴趣的衰减规律,假设用户 的活动具有周期性,用户兴趣具有稳定性和可变性。用非线性最小二乘法对每个 用户的衰减过程进行数据拟合,分别尝试了五中衰减函数(Liu H.Resourcerecommendation via user tagging behavior analysis[J].Cluster Computing, 2019:1

10.)。Zheng Q等人提出了一种基于专家信任和时间衰减的改进协同过 滤算法。目标用户的预测值是通过用户的加权等级和时间衰减因子获得的,该时 间衰减因子用于反映用户兴趣的变化(Zheng Q.An Improved CollaborativeFiltering Algorithm Based on Expert Trust and Time Decay[C]//2018 11thInternational Symposium on Computational Intelligence and Design(ISCID). IEEE,2018,2:12

15.)。Peng D等人同样假设社交网络中用户兴趣不断改变, 对单一的遗忘函数算法进行改进(Peng D,Li Y,Zhou H,et al.Time DecayFriend Recommender System for Social Network[C].testbeds and researchinfrastructures for the development of networks and communities,2018.)。 而本专利技术是在已有预测结果基础上,根据实时竞争情况对预测值进行衰减或增 益,以往工作还没有针对这类场景的衰减函数构造,因此本专利技术也将在基础衰减 函数的基础上,根据众包场景和已知预测值改进基础指数衰减函数。
三、
技术实现思路

[0005]本专利技术的目的在于解决众包任务推荐中因用户非独立性带来的推荐列表有 关指标异常波动的问题,通过在离线模型得到离线预测值的基础上,根据实时竞 争情况即推荐列表中离线预测值的全局和局部分布确定指数衰减函数的衰减因 子,对离线预测值进行衰减得到在线预测值。
[0006]本专利技术的目的是这样达到的:
[0007]在进行衰减时,从两个角度的预测值分布确定衰减或增益参数,分别为已投 标记录中高于当前记录的预测值的全局分布和局部分布。全局分布是在为某工人 生成推荐列表时,整个列表的预测值分布,局部分布是在推荐列表某个任务中的 预测值分布,在生成推荐列表时由于只能已知当前以及投标的预测值,因此只根 据已投标的记录反映竞争情况。最后用已投标记录中低于当前记录的预测值最为 衰减参数的修正。
[0008]具体做法是:
[0009]本专利技术涉及同统计概念如图1所示,总结来说衰减强度由预测值的全局分布 和局部分布共同决定,全局分布决定强度的上界,局部分布是否能达到这个上界, 绝对分布用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种众包任务推荐中的自适应指数衰减算法,其特征在于:在众包场景下利用线下模型预测值及实时投标情况定量分析当前任务的竞争强度,通过预测值的全局和局部分布得到衰减参数对已有预测值进行衰减。本发明对衰减和增益是两个对称的过程,衰减强度由预测值的全局分布和局部分布共同决定,全局分布决定强度的上界,局部分布是否能达到这个上界,绝对分布用于决定初始局部分布强度的增减,相对分布决定增减的强度。最后对衰减参数进行一定惩罚后作用于增益,因为在此假设对工人能否中标的影响主要是由竞争来的的衰减决定的,衰减参数主要反应了当前的实时竞争情况;具体做法是:第一步,通过工人登录时间确定在登陆时间有效的候选任务集作为未排序的候选推荐列表,根据登录时间得到当前已投标的离线预测值,当前工人对候选推荐列表中的离线预测值score=[s1,s1...,s
l
];利用score的四分位差得到全局衰减因子α
global
,α
global
表示可使任务内对s
l
衰减所导致的列表位置偏移最大为50%;第二步,将方阵划分为六类平面,并根据节点对应的坐标确定节点所需存储的密钥;这六类平面分别是:XOY类型平面、XOZ类型的平面、YOZ类型的平面、过Z轴的对角面、过Y轴的对角面、过X轴的对角面,然后根据节点的坐标判断节点所在的平面,并存储相应的平面密钥和有六个参数的伪随机函数;第三步,利用任务内s
lm
>s
l
的投标数量确定局部衰减因子的衰减强度基准,将投标数量l映射到使tanh函数有效的范围内;第四步,利用任务内离线预测值的绝对分布和相对分布对l0进行修正,用d表示s
l
距score
l
两个标准差的距离d∈(

1,1),使用EMD距离计算任务内分布score
l
到score
list
的距离W,在计算W前首先对score
l
和score
list
进行归一化处理,这里将score
l
与score
list
均值差作为加强或抑制的标准,正则加强负则抑制,第五步,由d和d
EM
共同决定l
offset
,第六步,用第一步到第四步对称的方法计算s
lm
<s
l
的增益部分g
local,l
,得到g
local,l
后利用g
local,l
与d
local,l
的比值r
l
对d
local,l
进行削弱,在利用sigmoid函数对r
l
进行平滑处理后用余弦衰减得到最终的局部衰减参数d
local,l
,第七步,超参数a用于对全局衰...

【专利技术属性】
技术研发人员:陈彦如邹可欣赵琪雯张媛媛廖俊华王伟胡顺仿许春张磊梁刚陈良银
申请(专利权)人:成都易书桥科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1