一种基于用户阅读时间行为的新闻推荐方法及系统技术方案

技术编号：29133439 阅读：38 留言：0更新日期：2021-07-02 22:28

本发明专利技术公开了一种基于用户阅读时间行为的新闻推荐方法及系统，通过分析用户阅读新闻时的时间信息，为每一位用户生成个性化阅读速度，然后再结合候选新闻的时效性做出推荐。而对于曝光未阅读过的新闻，该方法采用间谍算法来区分其中用户真正不感兴趣的新闻和有潜在兴趣的新闻，从而保证推荐新闻的质量和多样化。本发明专利技术解决个性化新闻推荐系统的时效性、标题误导性和推荐内容单一性问题。将每一位用户的阅读时间行为抽象为个性化阅读速度，并引入注意力机制，衡量用户历史点击新闻对候选新闻的不同影响程度；对于曝光过的用户未点击的新闻，引入间谍算法来区分其中用户真正不感兴趣的新闻和用户有潜在兴趣的新闻，从而保证推荐新闻的质量和多样化。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于用户阅读时间行为的新闻推荐方法及系统
本专利技术涉及个性化新闻推荐
，具体涉及一种基于用户阅读时间进行个性化新闻推荐的推荐系统。
技术介绍
随着信息技术和互联网的不断发展，人们逐渐从信息匮乏的时代走入了信息过载时代。在这个时代，无论是信息消费者还是信息生产者都面临着很大的挑战。对于信息消费者来说，如何从大量信息中获取自己有价值的信息是一件十分困难的事情；对于信息生产者，如何使自己的信息脱颖而出，将信息呈现给信息消费者也是一件十分困难的事情。为了解决信息过载问题，催生了搜索引擎和推荐系统两大工具。如今，推荐系统已经逐渐应用在互联网的各个领域，它们主要是通过用户历史行为记录对用户的兴趣爱好进行分析，为用户进行推荐，包括电商推荐、个性化的广告推荐和新闻推荐等，比如在淘宝、今日头条、抖音短视频等产品中就大量应用了推荐系统。当推荐的数据量和用户大规模增长后，推荐系统的复杂度也会同步增长。目前主流的推荐算法有协同过滤推荐算法、基于内容的推荐算法等。其中协同过滤推荐方法主要分为两种：基于物品的协同过滤和基于用户的协同过滤。基于物品的协同过滤基本思想是基于用户对项目的评价，发现项目之间的相似度，然后根据用户的历史偏好信息将类似的物品推荐给该用户。基于用户的协同过滤基本思想是发现与目标用户兴趣相似的邻居用户，并将邻居用户感兴趣且目标用户没有过行为的项目推荐给目标用户。协同过滤算法不需要预先获得物品或者用户的特征数据，仅依赖用户的历史行为给用户进行推荐，但对新用户来说，会存在由于没有历史数据产生的冷启动问题，这会对...

【技术保护点】
1.一种基于用户阅读时间行为的新闻推荐方法，其特征在于：该方法包括如下步骤为：/n步骤(1)从用户的行为日志中提取用户所阅读新闻的各项信息，包括新闻标题、阅读时长、新闻发布时间；/n步骤(2)为每一条提取到的新闻，采用卷积神经网络构建该新闻的个性化表示方式；/n步骤(3)由于用户对每一条浏览过的新闻感兴趣程度并不相同，通过注意力机制，将不同新闻赋予不同权重；/n步骤(4)将用户在一段时间范围内阅读过的所有新闻加权后聚合，用来表示该用户的兴趣方向，以此作为该用户的特征表示；/n步骤(5)对于已曝光但用户没有点击的新闻，采用间谍算法查找出用户潜在感兴趣的新闻，和新产生的没有推荐过的新闻一起加入到待推荐的候选新闻中进行处理；/n步骤(6)计算候选待推荐新闻与用户特征之间的相似性，对其中相似度较高的新闻进行推荐。/n

【技术特征摘要】
1.一种基于用户阅读时间行为的新闻推荐方法，其特征在于：该方法包括如下步骤为：
步骤(1)从用户的行为日志中提取用户所阅读新闻的各项信息，包括新闻标题、阅读时长、新闻发布时间；
步骤(2)为每一条提取到的新闻，采用卷积神经网络构建该新闻的个性化表示方式；
步骤(3)由于用户对每一条浏览过的新闻感兴趣程度并不相同，通过注意力机制，将不同新闻赋予不同权重；
步骤(4)将用户在一段时间范围内阅读过的所有新闻加权后聚合，用来表示该用户的兴趣方向，以此作为该用户的特征表示；
步骤(5)对于已曝光但用户没有点击的新闻，采用间谍算法查找出用户潜在感兴趣的新闻，和新产生的没有推荐过的新闻一起加入到待推荐的候选新闻中进行处理；
步骤(6)计算候选待推荐新闻与用户特征之间的相似性，对其中相似度较高的新闻进行推荐。

2.根据权利要求1所述的一种基于用户阅读时间行为的新闻推荐方法，其特征在于：在步骤(1)中，从用户的行为日志中提取用户所阅读新闻的各项信息，得到用户i的点击历史；每条日志包含时间戳，用户ID，新闻标题等信息，用户的点击历史表示为其中是用户i点击的第j个新闻标题，N是用户i点击的新闻总数，t＝[w1，w2，w3，......]表示新闻的标题，wi为新闻标题中的一个单词，该将新闻信息初步提取并做相应的预处理。

3.根据权利要求1所述的一种基于用户阅读时间行为的新闻推荐方法，其特征在于：在步骤(2)中，将步骤(1)的新闻标题t通过词向量模型转换为嵌入矩阵W，对W的子矩阵Wi，i+l-1进行卷积操作，得到特征对每一个子矩阵进行卷积操作后，可以得到特征图：

其中h为卷积核，l为卷积核的大小，f为一个非线性函数，通过使用多个不同大小的卷积核，获得多个特征，最后将这些特征串联在一起形成最终的新闻表示向量：
e(t)＝[Ch1Ch2......Chm](2)。

4.根据权利要求1所述的一种基于用户阅读时间行为的新闻推荐方法，其特征在于：在步骤(3)中，由于用户对不同的新闻感兴趣程度不同，需要计算不同新闻占用户喜好的权重，使用注意力机制进行计算；将步骤(2...

【专利技术属性】
技术研发人员：杨宏，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人