本发明专利技术属于网络资源管理领域,涉及网络资源的协作过滤技术,公开了一种基于极速神经网络模型的网络资源个性化推荐方法。它包括:(1)数据预处理:从系统用户日志文件中读取信息并生成全局用户兴趣矩阵,并变换为当前用户的单用户兴趣矩阵,然后进行变换、降维,划分出训练集A1和预测集A2;(2)模型训练:为目标用户建立结构为单隐藏层神经网络SLFNs的兴趣预测模型,采用极速学习机技术在训练集A1上进行训练,得到单隐藏层神经网络模型的各个连接权值以及隐藏层阈值;(3)预测推荐:利用训练所得到的预测模型计算出该目标用户对预测集A2中每一项资源的评分值,并将预测评分最高的前几项资源推荐给目标用户。
【技术实现步骤摘要】
本专利技术属于网络资源管理领域,涉及网络资源的协作过滤技术,特别涉及一种基于极速神经网络模型的网络资源个性化推荐方法。
技术介绍
目前,协作过滤技术是最流行的个性化推荐技术。用户建模以及以此为基础的用 户兴趣预测的研究集中在Web日志挖掘(Web Usage Mining)领域,其数据来源主要是服 务器端记录的Web日志——用户的兴趣信息。常用的协作过滤技术主要包括以下三种① 基于用户(User-based)的协作过滤技术,为用户推荐与其相似用户感兴趣的资源;②基于 项目(Item-based)的协作过滤技术,为用户推荐与其感兴趣资源相似的资源;③基于模型 (Model-based)的协作过滤技术,构造一个用户的评分模型,系统采用概率统计或者机器学 习的方法来预测目标用户对未评分项目的评分,从而产生推荐。 关于利用协作过滤技术进行网络资源个性化推荐方法,专利技术人经过查新,检 索得到一篇相关专利文献一种引入节目热门度权重的协作过滤推荐方法(公开号 CN101287082),首先收集用户的行为特征信息,作出"用户-项目"评分矩阵A(m, n);计算 热门度权重值;计算相似度大小并排序;对目标用户进行预测评分并排序;作出推荐列表 给目标用户。 随着网络中的用户和资源数目不断增加,上述专利文献采用协作过滤技术,存在 着以下一些问题①数据的高维稀疏性现象出现,即系统中的用户并不可能对所有资源进行评价,他们对系统中资源已有的评价相对系统中资源总数来说少得多,这就导致数据高 维稀疏问题的出现,数据的高维稀疏性使得协作过滤技术的信息推荐质量大大下降;②系 统计算耗时,协作过滤要比较目标用户(资源)与系统中所有用户(资源)的相似度,随着 系统规模的不断增大,计算量急剧增加,无法满足在线用户对系统实时性能的要求。
技术实现思路
本专利技术的目的在于克服上述现有技术的不足,提出一种基于极速神经网络的协作 过滤方法,能够解决数据高维稀疏所导致的协作过滤技术的信息推荐质量大大下降问题, 以及系统计算耗时大而无法满足在线用户对系统实时性能要求的问题。 为了解决上述技术问题,本专利技术采用以下技术方案予以实现。 —种基于极速神经网络的网络资源个性化推荐方法,其特征在于,具体包括以下 步骤 (1)数据预处理 从系统用户日志文件中读取信息并生成全局用户兴趣矩阵,根据当前用户将全局 用户兴趣矩阵进行变换,得到当前用户的单用户兴趣矩阵; 当前用户的单用户兴趣矩阵中每一列定义为一个样本实例,每个样本实例由特征 属性和目标属性组成,其中特征属性对应为单用户兴趣矩阵中其他用户对该列所对应资源4的评分,目标属性为当前用户对该列所对应资源的评分值,其中目标属性对应的行向量记 为T^w,特征属性对应的行向量集所组成的矩阵记为I(M—1)XN ;其中N表示系统中被评价的资 源的个数,M表示系统中参与评分的用户的个数,每一个元素存放用户对资源的评分; 此时矩阵T(M—dX1中存在着大量空缺值,对于空缺值采用同一样本实例的其他属性 平均值进行预填充,并记填充后的矩阵为X(M—1)XN,将矩阵X(M—1)XN经过主成分分析法降维为 特征矩阵Pnx,,其中,n表示降维后的维数; 然后,将目标用户对系统资源的评分的行向量l^,放置在特征矩阵Pn^的尾行之 后,形成降维后的用户兴趣矩阵A,看成是由降维后的N个样本实例形成的集合,再根据目 标用户对目标属性是否评分将样本实例的集合划分为训练集A1和预测集A2 ; (2)模型训练 首先,为目标用户建立用户兴趣预测模型,其模型结构为单隐藏层神经网络 SLFNs ;然后,对预测模型采用极速学习机技术在训练集A1上进行训练,得到单隐藏层神经 网络模型的各个连接权值以及隐藏层阈值,完成对用户兴趣预测模型中各权值的求解; (3)预测推荐 利用训练所得到的预测模型计算出该目标用户对预测集A2中每一项资源的评分 值,并将预测评分最高的前几项资源推荐给目标用户。 本专利技术的进一步特点和改进在于 (1)系统用户日志信息记录了 3项内容用户ID、资源ID以及该用户对资源的评 分值,表示为三元组的形式 (UserID, ItemID, Rate) 其中 UserID :用于唯一标识某个用户的ID ; ItemID :用于唯一标识某项资源的ID ; Rate :用户对资源的评分,评分的类型为从1到5的正整数,该值越高,表示用户对 资源越感兴趣,若该值为空时,表示用户对资源没有评分。 (2)所述根据目标用户对目标属性是否评分将样本实例的集合划分为训练集Al 和预测集A2,其形式化表示为 Al = {(Xi, t》/X = T G Rn, ti G R, i = 1. Nx}; A2 = {(Xi, ti)/Xi = T G Rn, ti = Null, i = 1. N_NX}; 其中 Xi代表第i个样本实例的n维特征属性; ti为目标属性; R为实数域; Nx为训练集包含的样本实例的个数。 (3)所述为目标用户建立用户兴趣预测模型,其模型结构为单隐藏层神经网络 SLFNs,其数学表示采用如下式子i 》 2 <formula>formula see original document page 5</formula> 其中 Wi = T :为连接第i个隐藏层节点和模型输入的权值向量,通过 样本实例训练得到; |3 i = [13 n, 13 i2, . . . , 13 J1 :为连接第i个隐藏层节点和模型输出的权值向量, 通过样本实例训练得到; bi :为第i个隐藏层节点的阈值,通过样本实例训练得到; Xj G Rn :为模型输入向量,对应某个实例的特征向量; 0j G Rm :为模型输出向量,对应某个实例的目标向量; ^ :为用户模型中隐藏层包含的节点个数; g(x):为激活函数,要求该函数为连续函数; Wi Xj :表示Wi与Xj的点积。 在资源项目很多的情况下,用户的评分数据相对来说是很少的,比如在大型的电 子商务系统中,用户的评分项目 一般不会超过资源项目总数的1 % ,数据的高维稀疏性导致 不同用户之间交叉评分的资源项目会很少,导致信息推荐质量的下降,另一方面也会导致 系统计算量巨大。针对上面的问题,本专利技术在数据预处理阶段拟采用主成分分析降维技术 对原始高维数据集合降维,将稀疏的用户兴趣预测矩阵转化为由主成分构成的稠密矩阵以 解决数据高维稀疏问题。 另外,本专利技术选择单隐藏层神经网络模型作为用户的兴趣预测模型,并采用极速 学习机技术对模型进行训练,这是因为传统的神经网络模型训练方法如BP算法速度较慢, 而且会陷入局部最小值,而单隐藏层神经网络具有如下的特性当隐藏层节点个数N 等于 训练集合中实例个数N时,网络可以无误差地逼近任何非线性函数。这就意味着对输入层 权值Wi和隐藏层阈值h进行随机赋值,而无需迭代调整;输出层权值13 i则可以根据最小 二乘法直接计算得出。基于以上思想的极速学习算法(Extreme Learning Machine),首先 为单隐藏层神经网络的输入权值和隐藏层阈值随机赋值,根据样本集合和前面的随机参数 计算隐藏层输出矩阵,最后利用最小二乘解本文档来自技高网...
【技术保护点】
一种基于极速神经网络的网络资源个性化推荐方法,其特征在于,具体包括以下步骤: (1)数据预处理 从系统用户日志文件中读取信息并生成全局用户兴趣矩阵,根据当前用户将全局用户兴趣矩阵进行变换,得到当前用户的单用户兴趣矩阵; 当前用户的单用户兴趣矩阵中每一列定义为一个样本实例,每个样本实例由特征属性和目标属性组成,其中特征属性对应为单用户兴趣矩阵中其他用户对该列所对应资源的评分,目标属性为当前用户对该列所对应资源的评分值,其中目标属性对应的行向量记为T↓[1×N],特征属性对应的行向量集所组成的矩阵记为I↓[(M-1)×N];其中N表示系统中被评价的资源的个数,M表示系统中参与评分的用户的个数,每一个元素存放用户对资源的评分; 此时矩阵I↓[(M-1)×N]中存在着大量空缺值,对于空缺值采用同一样本实例的其他属性平均值进行预填充,并记填充后的矩阵为X↓[(M-1)×N],将矩阵X↓[(M-1)×N]经过主成分分析法降维为特征矩阵P↓[n×N],其中,n表示降维后的维数; 然后,将目标用户对系统资源的评分的行向量T↓[1×N]放置在特征矩阵P↓[n×N]的尾行之后,形成降维后的用户兴趣矩阵A,看成是由降维后的N个样本实例形成的集合,再根据目标用户对目标属性是否评分将样本实例的集合划分为训练集A1和预测集A2; (2)模型训练 首先,为目标用户建立用户兴趣预测模型,其模型结构为单隐藏层神经网络SLFNs;然后,对预测模型采用极速学习机技术在训练集A1上进行训练,得到单隐藏层神经网络模型的各个连接权值以及隐藏层阈值,完成对用户兴趣预测模型中各参数的求解; (3)预测推荐 利用训练所得到的预测模型计算出该目标用户对预测集A2中每一项资源的评分值,并将预测评分最高的前几项资源推荐给目标用户。...
【技术特征摘要】
【专利技术属性】
技术研发人员:郑庆华,刘均,王昕,邓万宇,吴茜媛,田锋,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:87[]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。