一种面向青少年群体的个性化内容推荐方法技术

技术编号:21914137 阅读:14 留言:0更新日期:2019-08-21 12:28
本发明专利技术公会开了一种面向青少年群体的个性化内容推荐方法,包括如下步骤,S1、收集用户对每条推荐内容的历史浏览行为,并将其作为神经网络模型的训练集;S2、构建神经网络模型;S3、将训练集进行预处理,并将进行预处理后的训练集纳入神经网络模型中,获取纳入结果,得到的纳入结果做均方误差计算,并以最小化均方误差结果为优化目标对神经网络模型进行模型训练;S4、选择用户,并在向其推荐内容时对向其推荐的内容进行推荐打分。优点是:提高推荐内容与用户年龄的符合度;提高了除用户历史兴趣之外的、符合用户年龄特征的内容曝光度,扩宽青少年用户视野;在总体保证内容与用户兴趣的符合度前提下,避免过度拟合用户的历史喜好及形成信息茧房。

A Personalized Content Recommendation Method for Youth Groups

【技术实现步骤摘要】
一种面向青少年群体的个性化内容推荐方法
本专利技术涉及个性化推荐算法领域,尤其涉及一种面向青少年群体的个性化内容推荐方法。
技术介绍
随着信息技术及网络技术的快速发展,全球信息出现爆发性增长,海量数据呈现在人们眼前,让人们在享受丰富的信息资源的同时,也困扰于如何获取到对自己真正有用的那部分信息。面对这种“数据超载”问题,出现了搜索引擎与推荐引擎这两种工具,帮助理解用户的信息需求;其中搜索引擎面向用户的显性意图,即用户有明确的信息获取需求;而推荐引擎则面向用户的隐性意图,即用户不具有明确的信息获取需求。其中推荐引擎,尤其是具备个性化推荐功能的推荐引擎,能较好的解决用户的隐性信息需求,所以个性化推荐技术在近些年受到越来越多人的重视,也逐渐成为内容服务商的重要需求之一。因推荐引擎面向用户的隐性意图,因而如何获取用户的隐性意图成为了个性化推荐技术研究的重点,通常的手段都是基于用户的历史行为分析用户特征,进而形成用户的隐性意图。传统的技术方案有三类协同过滤技术:1、基于内容的协同过滤,即把用户的隐性意图等价于他以前喜欢的东西的特征;2、基于用户的协同过滤,即把用户的隐性意图等价于与他相似的其它用户所以喜欢的东西;3、基于矩阵分解的协同过滤,即把用户的隐性意图与内容的隐性特征通过矩阵运算求解为一组隐向量。前两种协同过滤技术的主要缺点在于,它们无法应对高维稀疏的数据场景,而最后一种基于矩阵分解的协同过滤技术,又因为计算量巨大无法快速进行模型更新,并且它无法处理隐特征之间的非线性关联,无法利用用户画像特征。受基于矩阵分解的协同过滤技术的影响,近些年很多新的个性化推荐技术都将思路集中在用户隐性意图的隐式向量表达上,即用一组隐向量表达用户的信息需求。另外受近些年机器学习技术的发展,出现一批基于神经网络模型的个性化推荐技术,例如因子分解机、Wide&Deep神经网络等;但是在算法设计上,并没有为青少年用户群体做特定的考虑,一味追求ctr的高涨反而造成视野的逐渐收窄,长期形成的信息茧房,会扼杀青少年的创造性。
技术实现思路
本专利技术的目的在于提供一种面向青少年群体的个性化内容推荐方法,从而解决现有技术中存在的前述问题。为了实现上述目的,本专利技术采用的技术方案如下:一种面向青少年群体的个性化内容推荐方法,包括如下步骤,S1、收集用户对每条推荐内容的历史浏览行为,并将其作为神经网络模型的训练集;S2、构建神经网络模型;S3、将训练集进行预处理,并将进行预处理后的训练集纳入神经网络模型中,获取纳入结果,将得到的纳入结果做均方误差计算,并以最小化均方误差结果为优化目标对神经网络模型进行模型训练;S4、选择用户,并在向其推荐内容时对向其推荐的内容进行推荐打分。优选的,将所述训练集记为T,所述T表示如下,T={<X1,y1>,<X2,y2>,...,<XN,yN>}其中,i=1,2,...,N,N为训练集中行为数据的总数,Xi为训练集中第i个行为数据,yi为训练集中第i个行为数据的反馈结果。优选的,根据用户对每条推荐内容对应的历史浏览行为,确定每条推荐内容对应的yi的值;如果用户对推荐内容的历史浏览行为是一次点击行为,则yi=1,如果用户对推荐内容的历史浏览行为是一次曝光未点击行为,则yi=0,如果用户对推荐内容的历史浏览行为一次用户标记不喜欢行为,则yi=-1。优选的,所述Xi如下式所示,Xi=(uidu,ageu,genderu,cated,typed,{tagd1,tagd2,...,tagdM});其中,"uidu,ageu,genderu"为触发第i个行为数据的主体,即第u个用户的特征;"cated,typed,{tagd1,tagd2,...,tagdM}"为第i个行为数据的客体,即第d条内容的特征;uidu是第u个用户的编号,ageu是第u个用户的年龄,genderu是第u个用户的性别,cated是第d条内容的内容类别,typed是第d条内容的展现方式,tagdj是第d条内容的第j个标签,j=1,2,...,M,M为第d条内容的标签总数。优选的,步骤S2包括如下内容,S201、将用户编号作为一个单值离散特征,通过一个嵌入层,转换为32维的数值向量;S202、将用户年龄作为一个单值离散特征,通过一个嵌入层,转换为64维的数值向量;S203、将用户性别作为一个单值离散特征,通过一个嵌入层,转换为32维的数值向量;S204、将步骤S201、S202和S203中所得到数值向量相连,通过第一全连接层,转换为128维的第一数值向量;S205、将内容类别作为一个单值离散特征,通过一个嵌入层,转换为32维的数字向量;S206、将内容展现方式作为一个单值离散特征,通过一个嵌入层,转换为32维的数值向量;S207、将内容的标签集合,作为一个多值离散特征,通过一个稀疏嵌入层,并将多值离散特征的转换结果相加,转换为64维的数值向量;S208、将步骤S205、S206和S207中得到的数值向量相连,通过第二全连接层,转换为128维的第二数值向量;S209、将第一数值向量和第二数值向量进行内积运算,从而得到神经网络模型。优选的,步骤S3包括如下内容,S301、将全部的用户编号做成词典,取出训练集中的第一行为数据的用户编号在词典中的索引,得到该用户编号的单值离散特征,并将该单值离散特征作为步骤S201的输入;S302、针对青少年用户群体,限定用户的年龄区间为0到18,对训练集中的第一个行为数据的用户年龄进行特异值处理,得到该用户年龄的单值离散特征,并将该单值离散特征作为步骤S202的输入;S303、定义用户性别,包括0-未知、1-男性、2-女性,对训练集中的第一个行为数据的用户性别进行数值化,得到用户形变的单值离散特征,并将其作为步骤S203的输入;S304、对训练集中的第一个行为数据的内容类别进行数值化,得到该内容类别的单值离散特征,并将该单值离散特征作为步骤S205的输入;S305、对训练集中的第一个行为数据的内容展现方式进行数值化,得到该内容展现方式的单值离散特征,并将该单值离散特征作为步骤S206的输入;S306、采用fnv32哈希算法对训练集中第一个行为数据的内容标签集合进行哈希化,得到该内容标签集合的多值离散特征,并将该多值离散特征作为步骤S207的输入;S307、采用步骤S209中获取的神经网络模型对上述步骤中的离散特征进行计算,得到神经网络模型的计算结果;将获取的神经网络模型的计算结果与训练集中的第一个行为数据的反馈结果求差值,并将该差值作为第一个行为数据的训练误差;S308、遍历训练集中所有的行为数据,以256条数据为一个批次进行训练,取一个批次的均方误差作为评判结果,并以最小化均方误差结果为优化目标进行优化,从而完成神经网络模型的训练。优选的,步骤S4中向用户推荐内容时,对推荐内容进行打分的打分算法如下,其中,Score为最终的得分;BaseScore为基础分;M是神经网络模型,X'i为第u个用户的特征与第d条内容的特征经预处理后组合成的行为特征;M(X'i)为将X'i作为步骤S209的输入所获取的神经网络模型的计算结果,Threshold为得分阈值;A是模型打分的除权因子;timed是第d条内容的时间;B是时间的除权因子本文档来自技高网
...

【技术保护点】
1.一种面向青少年群体的个性化内容推荐方法,其特征在于:包括如下步骤,S1、收集用户对每条推荐内容的历史浏览行为,并将其作为神经网络模型的训练集;S2、构建神经网络模型;S3、将训练集进行预处理,并将进行预处理后的训练集纳入神经网络模型中,获取纳入结果,将得到的纳入结果做均方误差计算,并以最小化均方误差结果为优化目标对神经网络模型进行模型训练;S4、选择用户,并在向其推荐内容时对向其推荐的内容进行推荐打分。

【技术特征摘要】
1.一种面向青少年群体的个性化内容推荐方法,其特征在于:包括如下步骤,S1、收集用户对每条推荐内容的历史浏览行为,并将其作为神经网络模型的训练集;S2、构建神经网络模型;S3、将训练集进行预处理,并将进行预处理后的训练集纳入神经网络模型中,获取纳入结果,将得到的纳入结果做均方误差计算,并以最小化均方误差结果为优化目标对神经网络模型进行模型训练;S4、选择用户,并在向其推荐内容时对向其推荐的内容进行推荐打分。2.根据权利要求1所述的面向青少年群体的个性化内容推荐方法,其特征在于:将所述训练集记为T,所述T表示如下,T={<X1,y1>,<X2,y2>,…,<XN,yN>}其中,i=1,2,...,N,N为训练集中行为数据的总数,Xi为训练集中第i个行为数据,yi为训练集中第i个行为数据的反馈结果。3.根据权利要求2所述的面向青少年群体的个性化内容推荐方法,其特征在于:根据用户对每条推荐内容对应的历史浏览行为,确定每条推荐内容对应的yi的值;如果用户对推荐内容的历史浏览行为是一次点击行为,则yi=1,如果用户对推荐内容的历史浏览行为是一次曝光未点击行为,则yi=0,如果用户对推荐内容的历史浏览行为一次用户标记不喜欢行为,则yi=-1。4.根据权利要求2所述的面向青少年群体的个性化内容推荐方法,其特征在于:所述Xi如下式所示,Xi=(uidu,ageu,genderu,cated,typed,{tagd1,tagd2,...,tagdM});其中,"uidu,ageu,genderu"为触发第i个行为数据的主体,即第u个用户的特征;"cated,typed,{tagd1,tagd2,...,tagdM}"为第i个行为数据的客体,即第d条内容的特征;uidu是第u个用户的编号,ageu是第u个用户的年龄,genderu是第u个用户的性别,cated是第d条内容的内容类别,typed是第d条内容的展现方式,tagdj是第d条内容的第j个标签,j=1,2,...,M,M为第d条内容的标签总数。5.根据权利要求1所述的面向青少年群体的个性化内容推荐方法,其特征在于:步骤S2包括如下内容,S201、将用户编号作为一个单值离散特征,通过一个嵌入层,转换为32维的数值向量;S202、将用户年龄作为一个单值离散特征,通过一个嵌入层,转换为64维的数值向量;S203、将用户性别作为一个单值离散特征,通过一个嵌入层,转换为32维的数值向量;S204、将步骤S201、S202和S203中所得到数值向量相连,通过第一全连接层,转换为128维的第一数值向量;S205、将内容类别作为一个单值离散特征,通过一个嵌入层,转换为32维的数字向量;S206、将内容展现方式作为一个单值离散特征,通过一个嵌入层,转换为32维的数值向量;S207、将内容的标签集合,作为一个多值离散特征,通过一个稀疏嵌入层,并将多值离散特征...

【专利技术属性】
技术研发人员:战科宇
申请(专利权)人:中国搜索信息科技股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1