信息推送方法技术

技术编号:13378467 阅读:39 留言:0更新日期:2016-07-21 07:27
本发明专利技术涉及一种信息推送方法,包括以下步骤:从数据库中提取待推送内容的特征信息和目标用户的历史操作信息,分别根据所述特征信息和历史操作信息构建内容特征向量和用户特征向量;根据所述用户特征向量计算所述目标用户与其他用户之间的相似度,根据所述相似度从其他用户中选择若干个与目标用户相似的相似用户,获取所述相似用户对各个待推送内容的权重,根据所述权重计算目标用户对各个待推送内容的关联系数;根据所述内容特征向量对各个待推送内容进行热度预测,并根据热度预测结果对所述关联系数进行修正;根据修正后的关联系数对各个待推送内容进行排序,根据排序结果将对应的待推送内容推送给所述目标用户。

【技术实现步骤摘要】

本专利技术涉及机器学习
,特别是涉及一种信息推送方法
技术介绍
互联网快速增长的信息使得用户发现有价值信息愈发困难,从而使得信息推送系统成为当今学术最为活跃的研究领域之一。信息推送系统力图辅助用户发现潜在喜欢的音乐、电影、商品、App等。一些信息推送系统根据用户信息和商品信息进行学习,使得用户更喜欢的商品拥有更高的权重。当有大量用户信息可供使用时,信息推送系统可以提供个性化的推送结果。例如为软件工作者推送软件类书籍,而为艺术工作者提供艺术类书籍等。然而,用户的兴趣和偏好在很多情况下是随时间变化的。当前的信息推送系统在向用户推送信息时,缺乏考虑用户兴趣和偏好的特点,信息推送的准确性较差。
技术实现思路
基于此,有必要针对信息推送的准确性较差的问题,提供一种信息推送方法。一种信息推送方法,包括以下步骤:从数据库中提取待推送内容的特征信息和目标用户的历史操作信息,分别根据所述特征信息和历史操作信息构建内容特征向量和用户特征向量;根据所述用户特征向量计算所述目标用户与其他用户之间的相似度,根据所述相似度从其他用户中选择若干个与目标用户相似的相似用户,获取所述相似用户对各个待推送内容的权重,根据所述权重计算目标用户对各个待推送内容的关联系数;根据所述内容特征向量对各个待推送内容进行热度预测,并根据热度预测结果对所述关联系数进行修正;根据修正后的关联系数对各个待推送内容进行排序,根据排序结果将对应的待推送内容推送给所述目标用户。上述信息推送方法,通过构建内容特征向量和用户特征向量,根据用户特征向量计算目标用户与其他用户之间的相似度,根据所述相似度计算目标用户对各个待推送内容的关联系数,根据热度预测结果对所述关联系数进行修正,并根据修正后的关联系数将对应的待推送内容推送给所述目标用户,能够较为准确地反应用户的真实偏好的特点,从而使推送结果更加准确。附图说明图1为本专利技术的信息推送方法流程图。具体实施方式下面结合附图对本专利技术的信息推送方法的实施例进行描述。图1为本专利技术的信息推送方法流程图。如图1所示,所述信息推送方法可包括以下步骤:S1,从数据库中提取待推送内容的特征信息和目标用户的历史操作信息,分别根据所述特征信息和历史操作信息构建内容特征向量和用户特征向量;可根据以下方式构建内容特征向量:首先,可从数据库中提取待推送内容的特征信息;然后,可根据所述特征信息对待推送内容进行建模,得到所述待推送内容的模型,所述模型可包括待推送内容的历史特征信息、类型、关键字和相关时间信息;最后,可根据所述模型构建内容特征向量。在从数据库中提取特征信息之后,还可对待推送内容进行聚类操作,并根据聚类操作的结果对待推送内容进行建模。具体讲,对待推送内容进行聚类操作时,可首先确定聚类的中心点,设置聚类的类别数量,根据所述中心点分别计算各个待推送内容的距离,并根据所述距离和类别数量对各个待推送内容进行分类;然后,可计算分类后各个类别的中心点,若所述中心点的值在预设的阈值范围内,结束计算;否则,返回设置聚类的类别数量的步骤。在本步骤中,所述待推送内容的特征信息可包括待推送内容的类别,待推送内容的历史页面浏览量,待推送内容的页面浏览量与其他所有全局信息的平均页面浏览量的比例,待推送内容不同时段内的页面浏览量,待推送内容的不同时段内的页面浏览量的变化率,待推送内容的生成时间,待推送内容的页面浏览量对应的时间信息和待推送内容在网页中的展示位置。所述待推送内容的类别可以根据待推送内容所处的行业来进行区分,也可以根据待推送内容的其他特征来区分。所述待推送内容的生成时间可以是所述待推送内容的上线时间。所述待推送内容的页面浏览量对应的时间信息可以是生成页面浏览量的时间,例如,工作日、周末等。所述用户特征向量依赖于用户的历史操作信息,用户在操作应用程序或者评论时,可对每个待推送内容生成操作记录,对于所有的操作记录可生成相应的权重与之对应,例如,可设曝光不浏览为0,浏览为1,收藏为2,购买为3,可根据所述历史操作信息构建所述用户特征向量。重复购买后,用户对此待推送内容的权重会继续增加,为衰减之后的增加,防止多次购买之后,用户对某个待推送内容的权重呈现畸形式的增长,以此来构成用户的特征向量。在对用户特征向量进行构建时,可首先利用用户的历史纪录,通过计算一个用户的权重均值来对用户的权重习惯进行调整,例如一个用户A的对于待推送内容的权重为(8,9,9,7),可根据所述权重与权重均值的差来调整所述权重,经过调整后,用户对待推送内容的权重修正为(-0.25,0.75,0.75,-1.25)。同时,可结合用户的操作时间与当前时间的距离,对所述权重进行适当的衰减,衰减有几种不同的方案,指数衰减,均值衰减,同时,衰减的参数可以调整,用于后期评估推送结果与参数的关系。S2,根据所述用户特征向量计算所述目标用户与其他用户之间的相似度,根据所述相似度从其他用户中选择若干个与目标用户相似的相似用户,获取所述相似用户对各个待推送内容的权重,根据所述权重计算目标用户对各个待推送内容的关联系数;计算用户相似度时,可以利用用户的特征向量之间的欧式距离或者皮尔森相似度,或者余弦距离。欧式距离在计算用户的距离时,容易对口味趋势相似、但是平均差距大的用户之间的距离放大,所以,此处选择利用余弦距离计算用户的相似度,设X和Y分别为目标用户和其他用户的特征向量,则相似度为: s i m ( X , Y ) = X · Y | | X | | · | | Y | | , ]]>得到的目标用户与其他用户之间的相似度,根据所述相似度选择相似用户。相似用户的数量可以根据相似度的阈值或者根据相似的情况动态得获得。当相似度较低时,取较少的相似用户,或者直接采用其他推送方式,相似度较高时,可以增加相似用户的数量。相似用户的数量会影响到推送的结果,当相似用户的数量较多时,会导致推送的结果倾向于热门推送,相似用户数量较少时,本文档来自技高网...

【技术保护点】
一种信息推送方法,其特征在于,包括以下步骤:从数据库中提取待推送内容的特征信息和目标用户的历史操作信息,分别根据所述特征信息和历史操作信息构建内容特征向量和用户特征向量;计算所述目标用户与其他用户之间的相似度,根据所述相似度从其他用户中选择若干个与目标用户相似的相似用户,获取所述相似用户对各个待推送内容的权重,根据所述权重计算目标用户对各个待推送内容的关联系数;根据所述内容特征向量对各个待推送内容进行热度预测,并根据热度预测结果对所述关联系数进行修正;根据修正后的关联系数对各个待推送内容进行排序,根据排序结果将对应的待推送内容推送给所述目标用户。

【技术特征摘要】
1.一种信息推送方法,其特征在于,包括以下步骤:
从数据库中提取待推送内容的特征信息和目标用户的历史操作信息,分别
根据所述特征信息和历史操作信息构建内容特征向量和用户特征向量;
计算所述目标用户与其他用户之间的相似度,根据所述相似度从其他用户
中选择若干个与目标用户相似的相似用户,获取所述相似用户对各个待推送内
容的权重,根据所述权重计算目标用户对各个待推送内容的关联系数;
根据所述内容特征向量对各个待推送内容进行热度预测,并根据热度预测
结果对所述关联系数进行修正;
根据修正后的关联系数对各个待推送内容进行排序,根据排序结果将对应
的待推送内容推送给所述目标用户。
2.根据权利要求1所述的信息推送方法,其特征在于,所述待推送内容的
特征信息包括:
待推送内容的类别,待推送内容的历史页面浏览量,待推送内容的页面浏
览量与各个待推送内容的平均页面浏览量的比例,待推送内容不同时段内的页
面浏览量,待推送内容的不同时段内的页面浏览量的变化率,待推送内容的生
成时间,待推送内容的页面浏览量对应的时间信息和待推送内容在网页中的展
示位置。
3.根据权利要求1所述的信息推送方法,其特征在于,根据所述特征信息
构建内容特征向量的步骤包括:
从数据库中提取待推送内容的特征信息;
根据所述特征信息对待推送内容进行建模,得到所述待推送内容的模型;
根据所述模型构建内容特征向量。
4.根据权利要求3所述的信息推送方法,其特征在于,根据所述特征信息
对待推送内容进行建模的步骤还包括:
对各个待推送内容进行聚类操作;
根据聚类操作的结果对待推送内容进行建模。
5.根据权利要求4所述的信息推送方法,其特征在于,对各个待推送内容
进行聚类操作的步骤包括:
确定聚类的中心点;
设置聚类的类别数量;
根据所述中心点分别计算各个待推送内容的距离,根据所述距离和类别数
量对各个待推送内容进行分类;
计算分类后各个类别的中心点,若所述中心点的值在预设的阈值范围内,
结束计算;否则,返回设置聚类的类别数量的步骤。
6.根据权利要求1所述的信息推送方法,其特征在于,根据所述内容特征
向量对各个待推送内容进行热度预测的步骤包括:
构造待推送内容的预测函数;
根据所述预测函数构造损失函数,并对所述损失函数进行正则化操作;
对经正则化的损失函数进行求解,得到热度预测结果。
7.根据权利要求6所述的信息推送方法,其特征在于,所述预测函数为:
h θ ( X ) = g ( θ T ) = 1 1 + e - θ T X ; ]]>其中,
θ 0 + θ 1 x 1 + ... + θ n x n = Σ i = 1 n θ i x i , ]]>式中,g为分类结果,e为自然常数,θi,i=1,2,…,n为所述用户特征向量中
第i个元素的权重,n为所述内容特征向量的维度,hθ(X)为预测函数,T表示转
置,X为用户特征向量,xi为用户特征向量中的第i个元素。
8.根据权利要求7所述的信息推送方法,其特征在于,所述损失函数为:
l ( θ ) = log L ( θ ) = Σ i = 1 n ( y i log h θ ( X ) + ( 1 - y i ) l o g ( 1 - h θ ( X ) ) ) ; ]]>式中,L(θ)为损失函数,l(θ)为优...

【专利技术属性】
技术研发人员:范林博王军谭洪舟
申请(专利权)人:广东顺德中山大学卡内基梅隆大学国际联合研究院中山大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1