【技术实现步骤摘要】
一种面向青少年群体的个性化内容推荐方法
本专利技术涉及个性化推荐算法领域,尤其涉及一种面向青少年群体的个性化内容推荐方法。
技术介绍
随着信息技术及网络技术的快速发展,全球信息出现爆发性增长,海量数据呈现在人们眼前,让人们在享受丰富的信息资源的同时,也困扰于如何获取到对自己真正有用的那部分信息。面对这种“数据超载”问题,出现了搜索引擎与推荐引擎这两种工具,帮助理解用户的信息需求;其中搜索引擎面向用户的显性意图,即用户有明确的信息获取需求;而推荐引擎则面向用户的隐性意图,即用户不具有明确的信息获取需求。其中推荐引擎,尤其是具备个性化推荐功能的推荐引擎,能较好的解决用户的隐性信息需求,所以个性化推荐技术在近些年受到越来越多人的重视,也逐渐成为内容服务商的重要需求之一。因推荐引擎面向用户的隐性意图,因而如何获取用户的隐性意图成为了个性化推荐技术研究的重点,通常的手段都是基于用户的历史行为分析用户特征,进而形成用户的隐性意图。传统的技术方案有三类协同过滤技术:1、基于内容的协同过滤,即把用户的隐性意图等价于他以前喜欢的东西的特征;2、基于用户的协同过滤,即把用户的隐性意图等价于与他相似的其它用户所以喜欢的东西;3、基于矩阵分解的协同过滤,即把用户的隐性意图与内容的隐性特征通过矩阵运算求解为一组隐向量。前两种协同过滤技术的主要缺点在于,它们无法应对高维稀疏的数据场景,而最后一种基于矩阵分解的协同过滤技术,又因为计算量巨大无法快速进行模型更新,并且它无法处理隐特征之间的非线性关联,无法利用用户画像特征。受基于矩阵分解的协同过滤技术的影响,近些年很多新的个性化推荐技术都 ...
【技术保护点】
1.一种面向青少年群体的个性化内容推荐方法,其特征在于:包括如下步骤,S1、收集用户对每条推荐内容的历史浏览行为,并将其作为神经网络模型的训练集;S2、构建神经网络模型;S3、将训练集进行预处理,并将进行预处理后的训练集纳入神经网络模型中,获取纳入结果,将得到的纳入结果做均方误差计算,并以最小化均方误差结果为优化目标对神经网络模型进行模型训练;S4、选择用户,并在向其推荐内容时对向其推荐的内容进行推荐打分。
【技术特征摘要】
1.一种面向青少年群体的个性化内容推荐方法,其特征在于:包括如下步骤,S1、收集用户对每条推荐内容的历史浏览行为,并将其作为神经网络模型的训练集;S2、构建神经网络模型;S3、将训练集进行预处理,并将进行预处理后的训练集纳入神经网络模型中,获取纳入结果,将得到的纳入结果做均方误差计算,并以最小化均方误差结果为优化目标对神经网络模型进行模型训练;S4、选择用户,并在向其推荐内容时对向其推荐的内容进行推荐打分。2.根据权利要求1所述的面向青少年群体的个性化内容推荐方法,其特征在于:将所述训练集记为T,所述T表示如下,T={<X1,y1>,<X2,y2>,…,<XN,yN>}其中,i=1,2,...,N,N为训练集中行为数据的总数,Xi为训练集中第i个行为数据,yi为训练集中第i个行为数据的反馈结果。3.根据权利要求2所述的面向青少年群体的个性化内容推荐方法,其特征在于:根据用户对每条推荐内容对应的历史浏览行为,确定每条推荐内容对应的yi的值;如果用户对推荐内容的历史浏览行为是一次点击行为,则yi=1,如果用户对推荐内容的历史浏览行为是一次曝光未点击行为,则yi=0,如果用户对推荐内容的历史浏览行为一次用户标记不喜欢行为,则yi=-1。4.根据权利要求2所述的面向青少年群体的个性化内容推荐方法,其特征在于:所述Xi如下式所示,Xi=(uidu,ageu,genderu,cated,typed,{tagd1,tagd2,...,tagdM});其中,"uidu,ageu,genderu"为触发第i个行为数据的主体,即第u个用户的特征;"cated,typed,{tagd1,tagd2,...,tagdM}"为第i个行为数据的客体,即第d条内容的特征;uidu是第u个用户的编号,ageu是第u个用户的年龄,genderu是第u个用户的性别,cated是第d条内容的内容类别,typed是第d条内容的展现方式,tagdj是第d条内容的第j个标签,j=1,2,...,M,M为第d条内容的标签总数。5.根据权利要求1所述的面向青少年群体的个性化内容推荐方法,其特征在于:步骤S2包括如下内容,S201、将用户编号作为一个单值离散特征,通过一个嵌入层,转换为32维的数值向量;S202、将用户年龄作为一个单值离散特征,通过一个嵌入层,转换为64维的数值向量;S203、将用户性别作为一个单值离散特征,通过一个嵌入层,转换为32维的数值向量;S204、将步骤S201、S202和S203中所得到数值向量相连,通过第一全连接层,转换为128维的第一数值向量;S205、将内容类别作为一个单值离散特征,通过一个嵌入层,转换为32维的数字向量;S206、将内容展现方式作为一个单值离散特征,通过一个嵌入层,转换为32维的数值向量;S207、将内容的标签集合,作为一个多值离散特征,通过一个稀疏嵌入层,并将多值离散特征...
【专利技术属性】
技术研发人员:战科宇,
申请(专利权)人:中国搜索信息科技股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。