内容推送方法及存储介质、计算机设备技术

技术编号:20389819 阅读:55 留言:0更新日期:2019-02-20 02:50
本发明专利技术提供一种内容推送方法及存储介质、计算机设备,所述方法包括:提取待推送内容的多个相关特征;将所述多个相关特征输入基于特征组合的点击率预估模型,得到所述待推送内容的预估点击率;其中,所述基于特征组合的点击率预估模型用于将所述多个相关特征进行组合,根据组合后的所述相关特征的关联性,确定出所述待推送内容的预估点击率;根据所述待推送内容的预估点击率,向用户推送内容。该方法可提高向用户推送内容的精准度。并且,该方法无需进行人工筛选组合特征,可减少人工量。

【技术实现步骤摘要】
内容推送方法及存储介质、计算机设备
本专利技术涉及数据处理
,具体而言,本专利技术涉及一种内容推送方法及存储介质、计算机设备。
技术介绍
随着互联网技术的快速发展,人类进入了大数据时代。这给互联网用户和互联网平台带来了新的挑战。对于用户而言,从大量信息中获取自己感兴趣的信息的难度逐渐增加。对于平台而言,如何给每位用户推荐个性化的信息/广告并以此获取收益也逐渐变成了平台的关键任务之一。因此,个性化推荐技术受到了越来越多的关注。点击率(Click-throughRate,CTR)预估是个性化推荐中的一项核心关键技术,通过机器学习方法建立模型,用于预测“如果给一位用户推荐某个信息/广告,该用户会点击的概率”。一个好的点击率预估模型可以大大提升互联网平台的收益。业界CTR预估的场景中,采集的特征往往都是大规模离散稀疏化的。比如在淘宝的场景中,商品的数量成千上万,每一个商品会有对应的id,假设模型需要使用到商品某个特征,则需要用一个成千上万维的向量去表示商品的该特征。而CTR预估场景中特征之间可能存在比较强的相关性,比如衣服和性别,这两个特征明显存在一个很强的关联关系。当衣服具体表现为“裙子”,性别为“女”时,用户点击的概率会提高。目前在工业界,绝大多数推荐系统工程师需要挖掘出强相关的特征组合。但是挖掘有效的特征组合,需要大量的人工工作,也需要一定的跨领域知识,并且需要不断地尝试,对于推荐系统工程师来说是一个很繁重的任务。
技术实现思路
本专利技术提出一种内容推送方法及存储介质、计算机设备,实现自动化挖掘内容推送的关联特征以向用户进行内容推送,提高内容推送的精准度,并减少人工量。本专利技术提供以下方案:一种内容推送方法,包括:提取待推送内容的多个相关特征;将所述多个相关特征输入基于特征组合的点击率预估模型,得到所述待推送内容的预估点击率;其中,所述基于特征组合的点击率预估模型用于将所述多个相关特征进行组合,根据组合后的所述相关特征的关联性,确定出所述待推送内容的预估点击率;根据所述待推送内容的预估点击率,向用户推送内容。在一实施例中,所述待推送内容包括待推送的短视频内容;所述提取待推送内容的多个相关特征,包括:提取所述待推送的短视频内容的多个用户特征以及多个短视频内容特征;所述将所述多个相关特征输入基于特征组合的点击率预估模型,得到所述待推送内容的预估点击率,包括:将所述多个用户特征以及所述多个短视频内容特征输入所述基于特征组合的点击率预估模型,得到所述待推送的短视频内容的预估点击率;所述根据所述待推送内容的预估点击率,向用户推送内容,包括:根据所述待推送的短视频内容的预估点击率,向用户推送短视频内容。在一实施例中,所述基于特征组合的点击率预估模型包括:输入层,用于对所述多个相关特征进行独热编码,得到独热向量;逻辑回归组件,用于对所述输入层输出的所述独热向量进行逻辑回归运算,得到第一运算值;嵌套模块,用于将所述独热向量的高维度稀疏离散化特征转换成低维度连续值特征,得到低维度连续值向量;内积组件,用于将所述嵌套模块输出的所述低维度连续值向量进行向量内积,得到第二运算值;拼接模块,用于将所述嵌套模块输出的所述低维度连续值向量进行向量拼接,得到拼接向量;隐藏层模块,用于将所述拼接模块输出的所述拼接向量输入深度神经网络隐藏层,得到第三运算值;预估点击率运算模块,用于根据所述第一运算值、所述第二运算值及所述第三运算值计算出所述待推送内容的预估点击率。在一实施例中,所述根据所述第一运算值、所述第二运算值及所述第三运算值计算出所述待推送内容的预估点击率,包括:将所述第一运算值、所述第二运算值及所述第三运算值拼接后进行归一化运算,得到所述待推送内容的预估点击率。在一实施例中,所述将所述第一运算值、所述第二运算值及所述第三运算值拼接后进行归一化运算,得到所述待推送内容的预估点击率,包括:获取所述第一运算值对应的第一权重、所述第二运算值对应的第二权重、所述第三运算值对应的第三权重;将所述第一运算值乘以所述第一权重,得到第一值;所述第二运算值乘以所述第二权重,得到第二值;第三运算值乘以所述第三权重,得到第三值;将所述第一值、所述第二值和所述第三值进行累加,得到所述待推送内容的预估点击率。在一实施例中,所述将所述嵌套模块输出的所述低维度连续值向量进行向量内积,得到第二运算值,包括:获取每个低维度连续值向量对应的权重;将所述每个低维度连续值乘以对应的权重后进行向量内积,得到所述第二运算值。在一实施例中,所述将所述嵌套模块输出的所述低维度连续值向量进行向量拼接,得到拼接向量,包括:将所述低维度连续值向量对应的权重;将所述每个低维度连续值向量乘以对应的权重后,进行向量累加,得到所述拼接向量。在一实施例中,所述基于特征组合的点击率预估模型包括:输入层,用于对所述多个相关特征进行独热编码,得到独热向量;逻辑回归组件,用于对所述输入层输出的所述独热向量进行逻辑回归运算,得到第一运算值;嵌套模块,用于将所述独热向量的高维度稀疏离散化特征转换成低维度连续值特征,得到低维度连续值向量;向量相乘组件,用于通过并行计算方式,采用矩阵乘法对所述二嵌套模块输出的低维度连续值进行向量相乘,得到结果值向量;获取所述结果值向量上三角的值,将所述上三角的值进行累加,将累加结果值作为第二运算值;拼接模块,用于将所述嵌套模块输出的所述低维度连续值向量进行向量拼接,得到拼接向量;隐藏层模块,用于将所述拼接模块输出的所述拼接向量输入深度神经网络隐藏层,得到第三运算值;预估点击率运算模块,用于根据所述第一运算值、所述第二运算值及所述第三运算值计算出所述待推送内容的预估点击率。一种存储介质,其上存储有计算机程序;所述计算机程序适于由处理器加载并执行上述任一实施例所述的内容推送方法。一种计算机设备,其包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行根据上述任一实施例所述的内容推送方法。上述实施例提供的内容推送方法,提取待推送内容的多个相关特征,将该多个相关特征输入基于特征组合的点击率预估模型中,通过点击率预估模型将多个相关特征进行组合,并分析组合后的相关特征的关联性,根据关联性确定出待推送内容的预估点击率,从而可以根据多个待推送内容的预估点击率向用户推送内容。可以是,从多个待推送内容中筛选出预估点击率较高的推送内容,并向用户推送该部分的推送内容。因此,可提高向用户推送内容的精准度。并且,该方法无需进行人工筛选组合特征,可减少人工量。本专利技术附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术提供的一种内容推送方法的一实施例中的方法流程图;图2为本专利技术提供的一种内容推送方法的另一实施例中的方法流程图;图3为本专利技术提供的基于特征组合的点击率预估模型的一实施例中的结构框图;图4为本专利技术提供的基于特征组合的点击率预估模型的一具体实施例中的结构框图;图5为本专利技术提供的向量相乘组件中两向量相乘的一实施例中的示意图;图6为本文档来自技高网...

【技术保护点】
1.一种内容推送方法,其特征在于,包括:提取待推送内容的多个相关特征;将所述多个相关特征输入基于特征组合的点击率预估模型,得到所述待推送内容的预估点击率;其中,所述基于特征组合的点击率预估模型用于将所述多个相关特征进行组合,根据组合后的所述相关特征的关联性,确定出所述待推送内容的预估点击率;根据所述待推送内容的预估点击率,向用户推送内容。

【技术特征摘要】
1.一种内容推送方法,其特征在于,包括:提取待推送内容的多个相关特征;将所述多个相关特征输入基于特征组合的点击率预估模型,得到所述待推送内容的预估点击率;其中,所述基于特征组合的点击率预估模型用于将所述多个相关特征进行组合,根据组合后的所述相关特征的关联性,确定出所述待推送内容的预估点击率;根据所述待推送内容的预估点击率,向用户推送内容。2.根据权利要求1所述的方法,其特征在于,所述待推送内容包括待推送的短视频内容;所述提取待推送内容的多个相关特征,包括:提取所述待推送的短视频内容的多个用户特征以及多个短视频内容特征;所述将所述多个相关特征输入基于特征组合的点击率预估模型,得到所述待推送内容的预估点击率,包括:将所述多个用户特征以及所述多个短视频内容特征输入所述基于特征组合的点击率预估模型,得到所述待推送的短视频内容的预估点击率;所述根据所述待推送内容的预估点击率,向用户推送内容,包括:根据所述待推送的短视频内容的预估点击率,向用户推送短视频内容。3.根据权利要求1所述的方法,其特征在于,所述基于特征组合的点击率预估模型包括:输入层,用于对所述多个相关特征进行独热编码,得到独热向量;逻辑回归组件,用于对所述输入层输出的所述独热向量进行逻辑回归运算,得到第一运算值;嵌套模块,用于将所述独热向量的高维度稀疏离散化特征转换成低维度连续值特征,得到低维度连续值向量;内积组件,用于将所述嵌套模块输出的所述低维度连续值向量进行向量内积,得到第二运算值;拼接模块,用于将所述嵌套模块输出的所述低维度连续值向量进行向量拼接,得到拼接向量;隐藏层模块,用于将所述拼接模块输出的所述拼接向量输入深度神经网络隐藏层,得到第三运算值;预估点击率运算模块,用于根据所述第一运算值、所述第二运算值及所述第三运算值计算出所述待推送内容的预估点击率。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一运算值、所述第二运算值及所述第三运算值计算出所述待推送内容的预估点击率,包括:将所述第一运算值、所述第二运算值及所述第三运算值拼接后进行归一化运算,得到所述待推送内容的预估点击率。5.根据权利要求4所述的方法,其特征在于,所述将所述第一运算值、所述第二运算值及所述第三运算值拼接后进行归一化运算,得到所述待推送内容的预估点击率,包括:获...

【专利技术属性】
技术研发人员:聂照昌
申请(专利权)人:广州市百果园信息技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1