【技术实现步骤摘要】
基于用户需求和标签关联度的电影推荐方法和系统
本专利技术涉数据挖掘和信息处理领域,尤其涉及一种基于用户需求和标签关联度的电影推荐方法和系统。
技术介绍
随着互联网技术的发展以及人们越来越高的要求,以及近年来数据挖掘在各行各业开始广泛使用,例如面向用户的电影推荐等。现有的电影推荐算法以协同过滤算法为主,其功能主要是通过自己的爱好,找到与其相似的用户然后推荐相似用户的爱好。协同过滤算法是以项目属性或用户评分相近的思想作为推荐的基础的。其主要观点是根据观点相似的用户的进行选推荐。是一种依赖于大量用户信息的信息过滤算法。从大量的用户中查找出一组和目标用户评分相近的用户集合和项目集合并依据相似用户对于同一个项目的评分,预测目标用户对该项目的评分,根据项目所得评分的排名顺序得出推荐意见给集群中的其他用户。目前,协同过滤推荐方法存在以下技术问题:1.该推荐算法需要依赖其他用户的评分信息来进行判断,所以要对其他用户的信息进行收集处理,从而降低了推荐效率。2.该推荐算法推荐的准确度依然存在问题,该推荐算法以他人评分为基 ...
【技术保护点】
1.一种基于用户需求和标签关联度的电影推荐方法,其特征在于,包括以下步骤:/nS1、获取用户输入的电影标签作为目标标签,并组合所有目标标签形成目标项;设置最小支持度a0和最小置信度b0,0<a0≤c0,c0为目标项的支持度的值;0<b0<1;/n支持度c的计算方式为:c=f/D,f为电影库中包含待计算支持度的电影标签集合的电影的数量,所述电影标签集合中至少包含一个电影标签;D为电影库中的电影的总数;/nS2、获取电影库中的电影包含的目标标签以外的所有电影标签和目标项作为原始项,获取支持度大于或等于最小支持度a0的原始项作为频繁项;/nS3、将频繁项两两合并 ...
【技术特征摘要】
1.一种基于用户需求和标签关联度的电影推荐方法,其特征在于,包括以下步骤:
S1、获取用户输入的电影标签作为目标标签,并组合所有目标标签形成目标项;设置最小支持度a0和最小置信度b0,0<a0≤c0,c0为目标项的支持度的值;0<b0<1;
支持度c的计算方式为:c=f/D,f为电影库中包含待计算支持度的电影标签集合的电影的数量,所述电影标签集合中至少包含一个电影标签;D为电影库中的电影的总数;
S2、获取电影库中的电影包含的目标标签以外的所有电影标签和目标项作为原始项,获取支持度大于或等于最小支持度a0的原始项作为频繁项;
S3、将频繁项两两合并作为候选项,将支持度大于或等于最小支持度a0的候选项记作过渡项;
S4、判断过渡项的数量是否大于或等于2,且至少一个过渡项包含目标项;是,则将频繁项更新为过渡项,然后返回步骤S3;
S5、否,则筛选包含有目标项的候选项作为预备项;预备项划分为目标项和关联项,关联项包含预备项中目标项以外的所有电影标签;
S6、计算各预备项的置信度;
置信度的计算方式为:
其中,表示电影标签集合,y表示目标项,z表示中目标项以外的电影标签的集合,表示的置信度,表示的支持度,support(y)表示目标项的支持度;
S7、获取置信度大于最小置信度b0的预备项的关联项作为目标关联项。
2.如权利要求1所述的基于用户需求和标签关联度的电影推荐方法,其特征在于,步骤S6具体为:计算各预备项的置信度,并判断是否存在置信度大于或等于最小置信度b0的预备项;是,则执行步骤S7;否,则执行步骤S8;
S8:从组成各预备项的频繁项中提取包含目标项的频繁项作为目标补充项,并获取置信度大于最小置信度b0的目标补充项的关联项作为目标关联项,目标补充项的关联项为目标补充项中目标项以外的电影标签的组合。
3.如权利要求1所述的基于用户需求和标签关联度的电影推荐方法,其特征在于,还包括步骤S9:基于各目标关联项筛选电影并向用户推荐。
4.如权利要求3所述的基于用户需求和标签关联度的电影推荐方法,其特征在于,步骤S9具...
【专利技术属性】
技术研发人员:储昭碧,张亮,朱敏,于振磊,杨兰,
申请(专利权)人:合肥工业大学,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。