当前位置: 首页 > 专利查询>南通大学专利>正文

一种基于加权混合的移动APP推荐方法技术

技术编号:13595905 阅读:62 留言:0更新日期:2016-08-26 13:14
本发明专利技术公开了一种基于加权混合的移动APP推荐方法,抓取移动APP标签数据和移动APP简介数据,并与用户移动APP下载数据分别进行数据预处理;针对预处理后的移动APP标签数据和用户移动APP下载数据,建立个性化标签模型,利用该模型计算预测分数以此得到第一推荐列表;针对处理后的移动APP简介数据和用户移动APP下载数据,建立LDA用户模型,通过该模型得到主题下用户的概率分布,然后利用KL散度计算用户之间的相似度以此形成第二推荐列表;对两个推荐列表进行加权混合,形成最终推荐列表。本发明专利技术通过两种相互独立的方法各自形成相应的推荐结果,最终对两个推荐结果进行加权混合,通过并列式加权混合的方式将两种方法的优势结合起来,提高推荐结果的准确性和多样性。

【技术实现步骤摘要】

本专利技术涉及信息
,具体涉及移动APP个性化推荐研究的一种基于加权混合的移动APP推荐方法
技术介绍
伴随着信息技术和互联网的快速发展,移动智能终端作为信息服务的载体近几年迅速普及。而移动智能终端的普及带来了移动APP市场的快速增长,几大应用市场的应用安装也相应越来越流行,主要的应用市场包括:APP Store、Android Market和Windows Store,且拥有用户较多的APP Store和Android Market的移动APP个数已超百万。移动APP的快速发展,给用户带来了丰富多样的选择,但是要从海量的移动APP中找到感兴趣的APP,用户需要耗费大量的时间来进行选择。在信息过滤领域,存在着“信息过载”问题,而对于目前的移动APP市场同样也存在着此问题,能解决此类问题最有效的方式则是推荐系统(Recommender Systems)。为了深入有效地解决“信息过载”问题,工业界和学术界展开了一系列对推荐系统的广泛研究,并且也取得了很多的研究成果。推荐系统的实现方式是通过充分挖掘用户与项目之间(User-Item)的二元关系,从而帮助用户在海量的数据中发现用户可能感兴趣的项目。因此,针对如何提高移动APP的推荐算法性能的研究势在必行。一个完整的推荐系统由三个模块组成,分别为:用户建模模块、推荐对象建模模块和推荐算法模块。用户建模模块完成的是收集用户历史信息数据,建立用户模型,而用户历史信息数据的种类很多,如用户购买行为、点击行为、评分行为等;推荐对象建模模块实现的是对推荐对象内容进行建模;推荐算法模块是最核心的部分,针对不同类型的推荐系统以及不同的数据形态存在多种不同的推荐算法,这个模块将利用相应的规则对用户建模模块和推荐对象建模模块进行处理。最终将用户最可能喜欢的内容作为推荐结果。常见的推荐算法有基于内容的推荐算法、协同过滤推荐算法和混合推荐算法。基于内容的推荐算法基于物品信息内容进行推荐,通常用特征抽取来描述物品,用户偏好的刻画用来表示用户喜爱什么类型的物品。换句话说,此算法根据用户历史的喜爱物品为其推荐相似物品。通常基于内容的推荐算法首先对物品进行建模,用来描述物品的属性,算法利用物品特征的权重向量来对用户进行特征表示,权重代表每个特征对用户的重要程度,可以通过Bayesian、决策树等计算用户对于物品的喜爱程度。通过用户的直接反馈,比如喜爱与不喜爱,可以分配不同大小的权重。因此,基于内容的推荐是根据物品的
内容信息生成的推荐,而不需要依赖用户对物品的评价等数据。协同过滤推荐算法主要是通过收集和分析大量的用户和物品关系数据,通过此数据得到用户或物品之间的相似度,从而给用户推荐可能最感兴趣的物品[15]。协同过滤推荐算法不需要对物品内容信息进行特征表示,而是基于假设用户现在的喜好和历史的喜好相同,过去喜爱的物品现在也仍会喜欢。协同过滤算法需要有用户的积极参与,且能够用简单的方法描述用户的兴趣,然后根据信息匹配相似兴趣的用户。协同过滤的实现方式是通过用户对物品的评分,以此表示用户对物品的喜好程度,以此来描述用户的兴趣,系统能够将用户对物品的评分和其他用户对相同物品的评分进行匹配,发现兴趣最相似的用户,最后将相似用户评分很高的物品,且此物品不在此用户列表中,推荐给此用户。协同过滤推荐算法可以分为基于用户的协同过滤和基于物品的协同过滤。协同过滤推荐算法的推荐质量取决于用户对物品的评价,而本文所处理的移动APP数据中没有用户对移动APP的评价信息,因此本文将不考虑协同过滤推荐算法。基于内容的推荐算法主要依附于物品的内容信息和描述进行推荐,协同过滤推荐算法是通过对用户特定行为进行收集和分析形成推荐,利用单一的推荐算法对用户进行推荐时可能会存在数据稀疏和冷启动等问题。因此可以利用混合算法扬长避短,结合不同推荐算法的优点为用户进行推荐。
技术实现思路
本专利技术目的是:提供一种基于加权混合的移动APP推荐方法,以解决目前基于内容的推荐算法只考虑信息和信息之间的相似关系,而忽略了用户行为,存在模型有效性问题和过度特征化等问题,以及基于主题模型的推荐算法无法表征用户偏好的问题。本专利技术的技术方案是:一种基于加权混合的移动APP推荐方法,包括以下步骤:S1:抓取移动APP标签数据和移动APP简介数据,然后对移动APP标签数据、移动APP简介数据及用户移动APP下载数据进行数据预处理;S2:针对预处理后的移动APP标签数据和用户移动APP下载数据,通过对用户行为进行分析建立个性化标签模型,然后对用户所下载APP的标签数据集进行加权量化,利用个性化标签模型遍历所有候选移动APP,计算用户对候选移动APP的预测分数以此得到第一推荐列表;S3:针对处理后的移动APP简介数据和用户移动APP下载数据,建立LDA用户模型,通过该模型得到主题下用户的概率分布,然后利用KL散度计算用
户之间的相似度以此形成第二推荐列表;S4:对第一推荐列表与第二推荐列表进行加权混合,通过并列式的混合方式形成最终推荐列表。优选的,步骤S1中通过定向爬虫技术,即利用Nutch工具的爬虫组件Crawler对移动APP标签数据和移动APP简介数据进行抓取。优选的,步骤S2中得到第一推荐列表的方法包括:针对处理后的移动APP标签数据和用户移动APP下载数据,对用户行为进行分析,根据用户下载来源对用户所下载的移动APP进行划分,将其划分为High、Normal和Low三个等级,得到用户移动APP的划分后,对标签数据集进行划分,将其划分为HighTags Set、Normal Tags Set和Low Tags Set三个数据集,去除重复标签,根据每个标签的频率对标签进行加权量化,得到标签的权重后,建立个性化标签模型,利用个性化标签模型遍历所有候选移动APP,计算用户对候选移动APP的预测分数,通过对预测分数排序,得到第一推荐列表。优选的,根据用户下载来源对用户所下载的移动APP进行划分,将其划分为High、Normal和Low三个等级,具体如下:High:搜索、猜你喜欢、更新管理,收藏;Normal:软件、首页,游戏;Low:后台下载、来源未知、none。优选的,步骤S3中得到第二推荐列表的方法包括:针对处理后的移动APP简介数据和用户下载列表数据,建立LDA用户模型,首先是对数据格式的系列转换,具体包括将数据转换成SequenceFile格式,将SequenceFile格式文件转换为向量表示,且将单词形式转换成单词id的形式,使用CVB0方法对LDA用户模型训练,设定迭代次数和主题个数,LDA用户模型训练后得到用户在主题空间下的概率分布,利用优化后的KL散度计算用户之间的相似度,利用用户之间的相似度,选定相应的移动APP,给用户形成第二推荐列表。优选的,所述步骤S4中加权混合的方法为:对于第一推荐列表与第二推荐列表,利用并行式混合模型思想将其进行混合,利用加权因子来对不同方法生成的推荐结果进行控制,形成最终推荐列表。本专利技术的有益效果:本专利技术所提供的基于加权混合的移动APP推荐方法,通过两种相互独立的方法各自形成相应的推荐结果,最终对两个推荐结果进行加权混合,通过并列式加权混合的方式将两种方法的优势结合起来,提高算法本文档来自技高网
...

【技术保护点】
一种基于加权混合的移动APP推荐方法,其特征在于,包括以下步骤:S1:抓取移动APP标签数据和移动APP简介数据,然后对移动APP标签数据、移动APP简介数据及用户移动APP下载数据进行数据预处理;S2:针对预处理后的移动APP标签数据和用户移动APP下载数据,通过对用户行为进行分析建立个性化标签模型,然后对用户所下载APP的标签数据集进行加权量化,利用个性化标签模型遍历所有候选移动APP,计算用户对候选移动APP的预测分数以此得到第一推荐列表;S3:针对处理后的移动APP简介数据和用户移动APP下载数据,建立LDA用户模型,通过该模型得到主题下用户的概率分布,然后利用KL散度计算用户之间的相似度以此形成第二推荐列表;S4:对第一推荐列表与第二推荐列表进行加权混合,通过并列式的混合方式形成最终推荐列表。

【技术特征摘要】
1.一种基于加权混合的移动APP推荐方法,其特征在于,包括以下步骤:S1:抓取移动APP标签数据和移动APP简介数据,然后对移动APP标签数据、移动APP简介数据及用户移动APP下载数据进行数据预处理;S2:针对预处理后的移动APP标签数据和用户移动APP下载数据,通过对用户行为进行分析建立个性化标签模型,然后对用户所下载APP的标签数据集进行加权量化,利用个性化标签模型遍历所有候选移动APP,计算用户对候选移动APP的预测分数以此得到第一推荐列表;S3:针对处理后的移动APP简介数据和用户移动APP下载数据,建立LDA用户模型,通过该模型得到主题下用户的概率分布,然后利用KL散度计算用户之间的相似度以此形成第二推荐列表;S4:对第一推荐列表与第二推荐列表进行加权混合,通过并列式的混合方式形成最终推荐列表。2.根据权利要求1所述的基于加权混合的移动APP推荐方法,其特征在于,步骤S1中通过定向爬虫技术,即利用Nutch工具的爬虫组件Crawler对移动APP标签数据和移动APP简介数据进行抓取。3.根据权利要求1所述的一种基于加权混合的移动APP推荐方法,其特征在于,步骤S2中得到第一推荐列表的方法包括:针对处理后的移动APP标签数据和用户移动APP下载数据,对用户行为进行分析,根据用户下载来源对用户所下载的移动APP进行划分,将其划分为High、Normal和Low三个等级,得到用户移动APP的划分后,对标签数据集进行划分,将其划分为HighTags Set、Normal Tags Set和Low Tags Se...

【专利技术属性】
技术研发人员:施佺肖瑶丁卫平陈建平杨晨晨
申请(专利权)人:南通大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1