基于多层感知机的新闻推荐方法技术

技术编号：24575093 阅读：29 留言：0更新日期：2020-06-21 00:16

本发明专利技术公开了一种基于多层感知机的新闻推荐方法，首先，采集用户评论数据，构建用户行为向量，其次，构建训练特征集和测试特征集，再次，构建多层感知机并初始化，然后，训练并测试多层感知机，接着，待推送新闻下评论用户的行为向量分类，最后，推荐新闻给对应类别中的活跃用户。本发明专利技术通过分析用户对新闻的反馈行为来间接的刻画新闻特征，规避了复杂的新闻特征提取工作，无需考虑新闻内容信息形式多样性的问题。同时，借助多层感知机来对用户行为向量的分类结果来实现推荐，使得本发明专利技术具有操作简单，易于在实际应用中部署的优点。

News recommendation method based on multi-layer perceptron

全部详细技术资料下载

【技术实现步骤摘要】
基于多层感知机的新闻推荐方法
本专利技术涉及人工智能领域，特别涉及一种基于多层感知机的新闻推荐方法。
技术介绍
新闻推荐是缓解信息过载问题并优化用户体验的重要途径之一。现有技术大多是分析新闻的文本信息特征，同时基于用户历史数据分析用户兴趣偏好，借助两者的匹配程度来实现推荐。这些技术途径在提取新闻特征时大多基于文本信息忽略了的其他形式的信息，如图片、视频等，而同时考虑所有形式的信息特征的话，将使得信息特征的提取流程过于冗杂，时间成本和计算成本将大幅提升，难以实际应用。北京航空航天大学在其申请的专利文献“一种基于层次注意力网络的动态新闻推荐的方法”(专利申请号201910302363.3，公开号CN110032679A)中公开了一种基于层次注意力网络的动态新闻推荐的方法。该方法中通过层次注意力网络得到候选新闻整体表示，通过卷积层得到序列偏好向量，最后使用全连接层将新闻整体表示，序列偏好向量和用户嵌入表示进行联接预测用户点击候选新闻的概率，进而实现新闻推荐。该方法的不足是新闻特征的提取局限在了文本形式，忽略了其他形式(图片...

【技术保护点】
1.一种基于多层感知机的新闻推荐方法，其特征在于：/n分别采集每一个用户在各个新闻版块下的评论次数，得到每一个用户的用户行为向量，所述用户行为向量的各个维度的值所对应的是各个新闻版块下该用户的评论次数；/n根据肘方法和Kmeans算法分别为每一个用户的用户行为向量匹配出原始的标签向量，并将每一个用户的用户行为向量和匹配出原始的标签向量合并成为一个用户数据；/n构建一个多层感知机，其中最上层为输入层，最下层为输出层，中间层均为隐藏层，并分别将输入层、输出层以及隐藏层进行初始化；/n依次使用每一个用户的用户行为向量和其所对应的原始的标签向量对构建好的多层感知机进行训练，得到训练好的多层感知机；/n...

【技术特征摘要】
1.一种基于多层感知机的新闻推荐方法，其特征在于：
分别采集每一个用户在各个新闻版块下的评论次数，得到每一个用户的用户行为向量，所述用户行为向量的各个维度的值所对应的是各个新闻版块下该用户的评论次数；
根据肘方法和Kmeans算法分别为每一个用户的用户行为向量匹配出原始的标签向量，并将每一个用户的用户行为向量和匹配出原始的标签向量合并成为一个用户数据；
构建一个多层感知机，其中最上层为输入层，最下层为输出层，中间层均为隐藏层，并分别将输入层、输出层以及隐藏层进行初始化；
依次使用每一个用户的用户行为向量和其所对应的原始的标签向量对构建好的多层感知机进行训练，得到训练好的多层感知机；
若新出来的新闻下的评论次数大于等于设定的次数则认定该新闻为待推送新闻，并将在所述待推送新闻下评论的用户所对应的用户行为向量作为训练好的多层感知机的输入，得到所述待推送新闻所对应的标签向量；
将所述待推送新闻推送到用户数据中的原始标签向量与所述待推送新闻所对应的标签向量一致的用户。

2.如权利要求1所述的一种基于多层感知机的新闻推荐方法，其特征在于，在为每一个用户的用户行为向量匹配出原始的标签向量之前，分别将每一个用户的用户行为向量分别进行归一化处理。

3.如权利要求1所述的一种基于多层感知机的新闻推荐方法，其特征在于，将所有用户的用户数据按照设定的比例分为两部分，其中占比大的部分为训练特征集，占比小的部分为测试特征集；
首先，对所述多层感知机进行训练的时候，依次将训练特征集中的每一个用户的用户行为向量输入到多层感知机进行训练，得到的输出和训练特征集中该用户原始的标签向量作为损失函数的输入得到损失函数的输出值，损失函数的输出值作为反向传播算法的输入值，将反向传播算法的输出值作为隐藏层的新的参数，最终得到一个待训练好的多层感知机；
之后，分别将测试特征集中的每一个用户的用户行为向量输入到待训练好的多层感知机中进行测试，得到的输出和该用户原始的标签向量进行比较，判断是否一致，从而得到准确率，当准确率大于设定的数值的时候，得到训练好的多层感知机。

4.如权利要求1所述的一种基于多层感知机的新闻推荐方法，其特征在于，分别使用t-sne算法对所有的用户行为...

【专利技术属性】
技术研发人员：易运晖，聂翌帅，赵楠，陈南，权东晓，何先灯，周晓寒，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人