一种基于高斯混合的大数据智能推荐方法技术

技术编号：16970617 阅读：56 留言：0更新日期：2018-01-07 07:09

本发明专利技术公开了一种基于高斯混合的智能推荐方法，属于大数据智能推荐领域；本发明专利技术基于高斯混合模型的协同过滤推荐算法GMM‑TCF的研究及应用，主要包括用户和项目联合概率的生成、如何定义大数据推荐模型中的最大似然函数、如何对大数据推荐模型中的高斯混合参数进行初始化和优化、以及怎么样将基于高斯混合的用户兴趣度模型与基于项目的推荐模型进行线性结合。一方面从最初用户属于某一个聚类到多个聚类的转变，这使得用户的兴趣得到了极大的体现；另一方面，通过添加项目时间因子，提高了项目之间的相似度，从而建立基于项目的预测模型，使得算法的推荐效果更好，推荐精度更高。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于高斯混合的大数据智能推荐方法
本专利技术涉及一种基于高斯混合的智能推荐方法，属于大数据智能推荐领域，涉及大数据推荐模型与群智能优化算法的结合及使用。
技术介绍
随着电子商务的发展，商家提供的商品种类和数量急剧增长。具有明确需求的用户可直接通过搜索查找想购买的商品即可。然而，实际中用户需求通常具有不确定性和模糊性。据亚马逊统计，在其网站购物的客户中，有明确购买意向的仅占16％。如果商家能够从海量的商品中把满足用户模糊需求的商品主动推荐给用户，则有望将潜在需求转化为实际需求，不仅能提高电子商务网站的销售量，还有助于提高用户对网站的忠诚度。在此背景下，能够根据用户特征有针对性推荐商品的个性化推荐系统应运而生，并被广泛应用。包括Amazon、eBay、YouTube和Google在内的诸多网站都部署了不同形式的推荐系统，并产生了巨大的商业利润。据统计，2006年推荐系统为Amazon提高了30％的销售额。推荐系统具有重要的应用价值，不仅成为计算机领域具有挑战性的研究课题之一，还吸引了来自数学、物理、认知、人工智能、管理、市场营销等众多领域的研究者。因此如何有效地利用数据挖掘和机器学习方法向用户推荐有价值的个性化信息成为有很强实际意义的问题。协同过滤是一种能够产生个性化推荐的有效技术，在各种推荐系统中都得到广泛应用，其基本任务是根据相似的偏好匹配用户，以推荐用户可能会喜欢的项目。协同过滤算法一般可以分为基于内存和基于模型。其中，基于内存的协同过滤又可分为基于用户和基于项目。前者是计算用户间相似度，得到与目标用户兴趣偏好相似的最近邻，以此为基础进行预测推荐。它...
一种基于高斯混合的大数据智能推荐方法

【技术保护点】
一种基于高斯混合的大数据智能推荐方法，其特征在于：该方法的实现步骤如下，(1)基于用户兴趣的相似度预测模型；首先，通过PLSA模型构建用户和项目的联合概率，基于此概率形式，构建合适的似然函数即大数据智能推荐模型；然后，通过CFPSO算法优化EM算法从而求解大数据智能推荐模型中的参数；最后，运用大数据智能推荐模型求解目标用户对项目的预测评分；a.构建用户和项目的联合概率；对于每一个三维向量＜u,i,v＞，其中u,i,v分别为用户u、项目i、及用户u对项目i的评分；引入潜在变量Z＝{z1,z2,…,zk}，其中zi(1≤i≤k)为不同的聚类群体，用P(zk|u)表示用户u属于zk群体的概率且

【技术特征摘要】
1.一种基于高斯混合的大数据智能推荐方法，其特征在于：该方法的实现步骤如下，(1)基于用户兴趣的相似度预测模型；首先，通过PLSA模型构建用户和项目的联合概率，基于此概率形式，构建合适的似然函数即大数据智能推荐模型；然后，通过CFPSO算法优化EM算法从而求解大数据智能推荐模型中的参数；最后，运用大数据智能推荐模型求解目标用户对项目的预测评分；a.构建用户和项目的联合概率；对于每一个三维向量＜u,i,v＞，其中u,i,v分别为用户u、项目i、及用户u对项目i的评分；引入潜在变量Z＝{z1,z2,…,zk}，其中zi(1≤i≤k)为不同的聚类群体，用P(zk|u)表示用户u属于zk群体的概率且P(v|i,zk)表示群体zk对项目i评分v的概率；则用户和项目的联合概率为：b.构建似然函数即大数据智能推荐模型；假定群体z对项目i评分v的条件概率P(v|i,z)符合高斯分布，有P(v|i,z)＝N(μi,z,σi,z)＝P(v；μi,z,σi,z)，其中μi,z,σi,z分别为群体Z对项目i评分的均值和方差，则用户和项目的联合概率是一个满足高斯混合的概率模型：则得到对数似然函数为：c.参数初始化选择；针对参数P(z|u)，μi,z，采用K-means聚类算法对参数进行初始化；同时，运用CFPSO算法对初始化后的参数进行优化；设定粒子群的数目为n，任意粒子i的位置表示为Xi＝(x1,x2,…xn)，选择(1)式作为适应度函数；则基于CFPSO优化EM算法的步骤如下：第一步：初始化粒子种群；给定粒子群的数目同时对粒子群中每个粒子的初始位置和速度进行初始化，位置和速度公式如下:其中，表示第i个粒子在t+1时刻d维空间的速度，k为压缩因子，ω为惯性权重，c1，c2为加速常数，r1和r2为随机数，与分别表示粒子i在t时刻d维空间的个体最优和全局最优值，表示第i个粒子在t+1时刻d维空间的位置；第二步：计算粒子群中各个粒子的适应度值，并更新粒子的当前个体最优位置pbest和粒子群的群体最优位置gbest；第三步：对粒子群的gbest根据EM算法对其进行更新；比较更新前后的适应度值，如果更新后的gbest值使得适应度函数值变大，则更新种群最优位置gbest信息，否则不予更新；第四步：对更新后的种群最优值gbest进行校验，如果其满足要求，则结束CFPSO算法，并取得gbest值的属性信息作为EM算法的初始参数；否则转至第五步；第五步：根据公式(2)和(3)更新粒子群中粒子个体的速度和位置参数并转至第二步继续执行；其中，EM算法的执行步骤如下：E步：根据每一个评分向量＜u,i,v＞，计算得到每个潜在的变量z∈Z的后验概率P(z|u,v,i)，如下：M步：根据E步计算得到的后验概率，并结合拉格朗日最优化极值对似然函数求偏导可得到P(z|u)，μi,z，的值，分别如下：

【专利技术属性】
技术研发人员：杨永丽，宁振虎，薛菲，公备，王昱波，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人