一种基于自适应主动学习的项目选择方法技术

技术编号:11757845 阅读:61 留言:0更新日期:2015-07-22 11:27
本发明专利技术公开了一种基于自适应主动学习的项目选择方法,包括:计算候选项目的不确定性;计算候选项目的代表性;根据所述不确定性和代表性,自适应地动态选择信息含量最高的项目。本发明专利技术能够综合考虑项目的不确定性和代表性挑选出信息含量最高的项目。

【技术实现步骤摘要】

本专利技术涉及推荐系统
,尤其涉及一种基于自适应主动学习的项目选择方 法。
技术介绍
在协同过滤推荐系统中,解决用户冷启动问题的关键在于如何快速建立新用户的 兴趣偏好模型。在用户初始使用系统时,基于主动学习评分引导的方法主动挑选一些项目 让用户评价可以有效获得用户的个性化偏好信息。挑选项目给用户评分出于两点考虑:(1) 用户对项目评分可以获得用户更多的评分数据,评分信息越多,推荐系统越有效;(2)并非 所有评分信息都是等效的,有些评分能够代表用户的个性化信息,有些则不能,因此不同的 主动学习评分引导方法会带来不同的效果。比如一直挑选热门项目给用户评价,虽然能获 得更多的用户评分数据,但是对于系统获得用户的个性化偏好信息帮助不大,因为大多数 用户都喜欢热门项目。因此,如何设计一个有效的主动学习项目选择策略,能尽可能少的选 择信息含量较高的项目评分数据来更好地表示用户的偏好信息是非常关键的问题,也是目 前亟待解决的问题。
技术实现思路
本专利技术提供了,能够综合考虑项目的不 确定性和代表性挑选出信息含量最高的项目。 本专利技术提供了,包括: 计算候选项目的不确定性; 计算候选项目的代表性; 根据所述不确定性和代表性选择信息含量最高的项目。 优选地,所述计算候选项目的不确定性为:【主权项】1. ,其特征在于,包括: 计算候选项目的不确定性; 计算候选项目的代表性; 根据所述不确定性和代表性选择信息含量最高的项目。2. 根据权利要求1所述的方法,其特征在于,所述计算候选项目的不确定性为: 依据公式计算出候选项目的不确定性,其中;R。,表 示用户C对项目X的评分,忘表示用户的平均评分,Uy(sim)表示和当前新用户相似且对项 目X有评分行为的用户集合。3. 根据权利要求2所述的方法,其特征在于,所述计算候选项目的代表性包括: 在训练集T。上根据预测模型0计算得到C对X的预测评分.V(0),并估计C为X评分 为r的概率P扣=C,氏,=r),并将r当作y( 0 )变化值,其中,.M巧二r; 更新评分训练集合T。,将预测评分变化值(巧添加到C的已评分项目集合列表中,得 至Ij新的评分训练集Te,r=TeU(X,r); 在评分训练集T。和Tw上,根据预测模型0,预测c对未评分项目集合中的其它 未评分项目Xi的评分值,分别得到对应训练集上的预测评分为记.(0)和乂,'(巧; 在评分为r的概率P扣=c,Rty=r)下,估计当前候选项目X的评分变化对 其它项目预测评分的影响,用片.(0)与.V;;/ (0)差值的平方表示评分变化,依据公式I计算出当前候选项目X的代表性 rep(X),其中;C表示当前新用户,X代表当前候选项目,X戸代表C的未评分项目集 合,單表示C的已评分项目集合,巧'W表示去掉X后C的剩余未评分项目集合,即 =巧'> \树,乂中的每个项目用X康示,;巧=LU'…hiU)是C对应的训练数 据集,表不C对X的评分。4. 根据权利要求3所述的方法,其特征在于,所述根据所述不确定性和代表性选择信 息含量最局的项目为: 依据公式计算得出信息含量高的项目,其中: uncedainty(x)为不确定性,rep(x)为代表性,C表示当前新用户,X代表当前候选项目, 《"代表C的未评分项目集合。5. 根据权利要求1所述的方法,其特征在于,所述计算候选项目的代表性后还包括: 预先指定权值集合W,W= {Wi, *2,…,*。_1,W。},其大小IWI=n; 设置候选项目集合I为空,/ =0; 针对当前权值Wi,WiE W,选择前L个候选项目,构成项目集合I i; 更新候选项目集合I=IUli; 在用户c已有的评分集合T。上训练得到预测模型0,根据0计算c对项目X的预测 评分乂.、.,更新训练集T。; 计算每个项目对应的预测评分偏差e(X); 从候选项目集合I中选择最具信息含量的项目x>。6. 根据权利要求5所述的方法,其特征在于,所述针对当前权值W1,WiGW,选择前L个 候选项目为: 根据所述不确定性unce;rtainty(X)和代表性rep(X),依据公式 info(X) =uncertainty(x)wXrep(x)d-w)计算出组合后项目的信息含量info(X); 依据公式计算出最具信息含量的项目X%选择前L个候选项目。7. 根据权利要求6所述的方法,其特征在于,所述在用户C已有的评分集合T。上训练 得到预测模型e,根据0计算C对项目X的预测评分乂,.T,更新训练集T。为: 依据公式r=rU<-、-,乂,. >更新训练集T。。8. 根据权利要求7所述的方法,其特征在于,所述计算每个项目对应的预测评分偏差 e(X)为: 根据更新后的T。训练得到新的预测模型g,基于各、.预测C对已评分项目训练集合中 项目t(t G T。)的评分根据公估计真实评分与预测评分的偏差 e(X),其中表示更新后的协同过滤模型§预测的C对项目t的评分。9. 根据权利要求8所述的方法,其特征在于,所述从候选项目集合I中选择最具信息含 量的项目为: 依据公选择最具信息含量的项目x>。【专利摘要】本专利技术公开了,包括:计算候选项目的不确定性;计算候选项目的代表性;根据所述不确定性和代表性,自适应地动态选择信息含量最高的项目。本专利技术能够综合考虑项目的不确定性和代表性挑选出信息含量最高的项目。【IPC分类】G06F17-30【公开号】CN104794250【申请号】CN201510255684【专利技术人】吴健, 李承超, 张宇 【申请人】苏州融希信息科技有限公司【公开日】2015年7月22日【申请日】2015年5月19日本文档来自技高网...

【技术保护点】
一种基于自适应主动学习的项目选择方法,其特征在于,包括:计算候选项目的不确定性;计算候选项目的代表性;根据所述不确定性和代表性选择信息含量最高的项目。

【技术特征摘要】

【专利技术属性】
技术研发人员:吴健李承超张宇
申请(专利权)人:苏州融希信息科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1