【技术实现步骤摘要】
用于评分预测的模型构建方法和系统
本专利技术涉及数据处理
,具体涉及一种用于评分预测的模型构建方法和系统。
技术介绍
推荐系统是根据用户的历史行为和兴趣特点,为用户推荐其感兴趣的信息或商品的系统。推荐系统一般通过评分预测来实现,即将预测评分高的商品推荐给用户。传统的方法主要是考虑用户和产品之间的交互,比如矩阵分解方法通过分解用户和产品的评分矩阵分别得到用户和产品的隐特征矩阵,在预测评分时,通过输入用户和产品的隐特征来预测用户对产品的评分,将预测评分高的产品推荐给用户。然而,随着数据量的大量增长,用户与产品的数量的增加,使得用户与产品的交互数据变得稀疏,现有的评分预测系统难以准确的预测用户对未购买的产品的评分。
技术实现思路
(一)解决的技术问题针对现有技术的不足,本专利技术提供了一种用于评分预测的模型构建方法和系统,解决了现有评分预测系统预测精度低的技术问题。(二)技术方案为实现以上目的,本专利技术通过以下技术方案予以实现:本专利技术提供一种用于评分预测的模型构建方法,该方法包括以下步骤:S1、定义推荐环境:包括定义N个用户、M个产品、用户对已购买的产品的评分、 ...
【技术保护点】
1.一种用于评分预测的模型构建方法,其特征在于,该方法包括以下步骤:S1、定义推荐环境:包括定义N个用户、M个产品、用户对已购买的产品的评分、评分范围1~R、用户对已购买的产品的评论,N和M均为大于0的自然数;S2、根据所述推荐环境中的所存在的评论训练LDA主题模型,并计算各个评论在所有主题下的概率分布;S3、构建网络模型:对用户和产品进行编码,得到用户的编号和产品的编号;基于用户的编号和产品的编号分别构建两个嵌入层;然后将两个嵌入层合并,得到合并层;利用激活函数对合并层进行多次非线性激活,构建多层非线性层;基于最后一层非线性层添加一个激活函数为softMax的全连接层和一 ...
【技术特征摘要】
1.一种用于评分预测的模型构建方法,其特征在于,该方法包括以下步骤:S1、定义推荐环境:包括定义N个用户、M个产品、用户对已购买的产品的评分、评分范围1~R、用户对已购买的产品的评论,N和M均为大于0的自然数;S2、根据所述推荐环境中的所存在的评论训练LDA主题模型,并计算各个评论在所有主题下的概率分布;S3、构建网络模型:对用户和产品进行编码,得到用户的编号和产品的编号;基于用户的编号和产品的编号分别构建两个嵌入层;然后将两个嵌入层合并,得到合并层;利用激活函数对合并层进行多次非线性激活,构建多层非线性层;基于最后一层非线性层添加一个激活函数为softMax的全连接层和一个激活函数为sigmoid的全连接层,激活函数为softMax的全连接层用于表示用户对产品评分,激活函数为sigmoid的全连接层用于表示用户对产品的评论,并计算评分对应类别的概率和评论对应主题类别的概率;S4、训练并更新网络模型中的参数。2.根据权利要求1所述的用于评分预测的模型构建方法,其特征在于,所述方法还包括步骤S5,采用步骤S1~S4构建的用于评分预测的模型,预测用户对未购买的产品会给出的评分。3.根据权利要求1所述的用于评分预测的模型构建方法,其特征在于,所述步骤S1还包括:S101、对评论文本数据预处理,包括:对评论进行分词、去停用词、去噪声词。4.根据权利要求1所述的用于评分预测的模型构建方法,其特征在于,所述步骤S2中计算各个评论在所有主题下的概率分布的具体方法为:对于LDA主题模型,推荐环境中所存在的评论文本构成文档集,分别给文档集到主题以及主题到词的多项式分布添加参数为α和β的dirichlet先验分布,基于LDA主题模型的文档集生成过程,得到整个文档集预料生成的联合概率:其中:w表示文档集中词的集合;z表示文档集中主题的集合;通过GibbsSampling算法对上面的联合分布进行采样,可实现得到给定文档集的主题概率分布:其中:θm,k表示第m篇文档中属于主题k的概率;表示主题k在第m篇文档中出现的次数;φk,t表示第k个主题中产生词t的概率;表示词t在主题k中出现的次数。5.根据权利要求1所述的用于评分预测的模型构建方法,其特征在于,所述步骤S3中构建用户的嵌入层具体方法为:定义表示模型中的用户u的D维向量以用户的编号作为输入,通过嵌入层映射到较低的维度为D的向量,用eu表示:所述步骤S3中构建产品的嵌入层具体方法为:定义表示模型中的产品i的D维向量以产品的编号作为输入,通过嵌入层映射到较低的维度为D的向量,用ei表示:6.根据权利要求5所述的用于评分预测的模型构建方法,其特征在于,所述步骤S3中的合并层具体表示为:所述步骤S3中非线性层的输出为:定义h...
【专利技术属性】
技术研发人员:刘业政,吴锋,田志强,李哲,杨露,贺菲菲,
申请(专利权)人:合肥工业大学,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。