当前位置: 首页 > 专利查询>中山大学专利>正文

一种对用户进行主题挖掘和应用推荐的方法技术

技术编号:13970795 阅读:46 留言:0更新日期:2016-11-10 08:39
本发明专利技术提供一种对用户进行主题挖掘和应用推荐的方法,该方法先定量计算出衡量用户所安装的某个应用对用户主题贡献的权重,根据权重来建立用户选择应用安装的模型,然后再计算出建立好的模型的参数即可模拟用户选择应用的过程并向用户推荐其意向的应用软件,实现了根据用户的安装应用列表挖掘出用户和应用的潜在特征的功能,以及对用户推荐其较感兴趣的应用的功能。

【技术实现步骤摘要】

本专利技术涉及数据挖掘领域,更具体地,涉及一种对用户进行主题挖掘和应用推荐的方法
技术介绍
在移动平台上,挖掘用户的主题往往会根据用户的一些明显的标签来进行,例如年龄、活跃程度、地理位置等。其实,用户的安装应用列表也能够反映用户的一些主题偏好。但是,由于用户安装应用的量的大小分布极为不均匀,且不同国家或地区的用户对同一应用的偏好差异较大,因而这一部分信息较难被合理利用。使用传统的主题挖掘算法,例如LDA算法,挖掘出来的主题无法反映出用户的主题分布和地理位置影响。用户的安装应用列表和地理位置信息所包含的这种主题分布,不仅可以用来进行用户分析,还可以用在对用户进行应用推荐的工作上。传统的推荐算法,会根据用户的特征、应用的特征,以及用户和应用的联合特征来训练模型,从而完成对用户进行应用推荐的任务。但用户的安装应用列表无法直接拿来作为特征,因为每个用户安装应用的量差异较大。如果能够根据众多用户的安装应用列表挖掘出用户和应用的潜在特征,那么就可以由此计算出用户与应用之间的一个相似度,作为评判用户是否喜欢一个应用的重要特征。
技术实现思路
本专利技术提供一种对用户进行主题挖掘和应用推荐的方法,该方法可根据用户的安装应用列表来挖掘出用户和应用的潜在特征,并向用户推荐其意向的应用。为了达到上述技术效果,本专利技术的技术方案如下:一种对用户进行主题挖掘和应用推荐的方法,包括以下步骤:S1:计算应用对用户主题贡献的权重;S2:建立用户在安装应用时选择过程的概率图模型;S3:求取概率图模型参数,并完成主题的挖掘和应用的推荐;进一步地,所述步骤S1中计算应用对用户主题贡献的权重值:其中,user表示一个用户,app表示用户所安装的一个应用,Luser表示用户user所安装的应用数,Laverage表示平均一个用户所安装的应用数,|U|表示数据集中用户的总量,napp表示安装了该app的用户的总数。通过向上取整,weight是一个大于0的整数。进一步地,所述步骤S2的过程如下:S21:根据用户的偏好分布产生用户的一个偏好变量xu,n,其中即偏好变量xu,n服从以为参数的一个二项分布;S22:若S21中得到的xu,n的值为0,则表示用户在选择应用时考虑的是个人的喜好,首先根据用户对主题的分布抽样出用户将要安装的应用的主题zu,n,其中即该应用的主题服从以为参数的多项分布;S23:根据主题z在各个应用上的分布产生相应的应用,其中即所要安装的应用由一个参数为的多项分布抽样产生;S24:若S21中得到的xu,n的值为1,则表示用户在选择应时考虑的是所处的地理位置因素,用户u所处的地理位置为l,表示该位置对应用的偏好分布,其中即所要安装的应用由一个参数为的多项分布抽样产生; φ → u ~ B e t a ( η → ) - - - ( 2 ) ]]> θ → u ~ D i r i c h l e t ( α → ) - - - ( 3 ) ]]> θ → z ~ D i r i c h l e t ( β → ) - - - ( 4 ) ]]> θ → l ~ D i r i c h l e t ( γ → ) - - - ( 5 ) ]]>其中,xu,n表示第u个用户在安装第n个应用时的选择偏好,xu,n∈{0,1本文档来自技高网...

【技术保护点】
一种对用户进行主题挖掘和应用推荐的方法,其特征在于,包括以下步骤:S1:计算应用对用户主题贡献的权重;S2:建立用户在安装应用时选择过程的概率图模型;S3:求取概率图模型的参数,并完成主题的挖掘和应用的推荐。

【技术特征摘要】
1.一种对用户进行主题挖掘和应用推荐的方法,其特征在于,包括以下步骤:S1:计算应用对用户主题贡献的权重;S2:建立用户在安装应用时选择过程的概率图模型;S3:求取概率图模型的参数,并完成主题的挖掘和应用的推荐。2.根据权利要求1所述的对用户进行主题挖掘和应用推荐的方法,其特征在于,所述步骤S1中计算应用对用户主题贡献的权重值:其中,user表示一个用户,app表示用户所安装的一个应用,Luser表示用户user所安装的应用数,Laverage表示平均一个用户所安装的应用数,|U|表示数据集中用户的总量,napp表示安装了该app的用户的总数。通过向上取整,weight是一个大于0的整数。3.根据权利要求2所述的对用户进行主题挖掘和应用推荐的方法,其特征在于,所述步骤S2的过程如下:S21:根据用户的偏好分布产生用户的一个偏好变量xu,n,其中即偏好变量xu,n服从以为参数的一个二项分布;S22:若S21中得到的xu,n值为0,则表示用户在选择应用时考虑的是个人的喜好,首先根据用户对主题的分布抽样出用户将要安装的应用的主题zu,n,其中即该应用的主题服从以为参数的多项分布;S23:根据主题z在各个应用上的分布产生相应的应用,其中即所要安装的应用由一个参数为的多项分布抽样产生;S24:若S21中得到的xu,n的值为1,则表示用户在选择应时考虑的是所处的地理位置因素,用户u所处的地理位置为l,表示该位置对应用的偏好分布,其中即所要安装的应用由一个参数为的多项分布抽样产生; φ → u ~ B e t a ( η → ...

【专利技术属性】
技术研发人员:胡浩柏杨刘冶印鉴
申请(专利权)人:中山大学广州中大南沙科技创新产业园有限公司广州智海纵横信息科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1