【技术实现步骤摘要】
一种基于新闻图片特点的推荐方法、装置、设备及介质
[0001]本专利技术涉及互联网信息
,尤其涉及一种基于新闻图片特点的推荐方法、装置、设备及介质。
技术介绍
[0002]对于新闻来说,用户能看到的主要是新闻标题和图片。当前,对于资讯特征,现有技术中主要针对新闻标题进行挖掘,例如:关键词、语义信息等,往往无法得到准确的结果。
[0003]新闻图片相对于文字更能影响用户的点击决策。因此,如何更进一步挖掘新闻图片信息进行召回和点击率预估,实现精准的新闻推荐,是本领域技术人员亟待解决的问题。
技术实现思路
[0004]本专利技术的目的在于提供一种基于新闻图片特点的推荐方法、装置、设备及介质,以解决上述技术背景中提出的问题。
[0005]为实现上述目的,本专利技术采用以下技术方案:
[0006]本申请第一个方面提供了一种基于新闻图片特点的推荐方法,包括:
[0007]S1,准备训练样本:从用户点击行为数据中选取页面访问量PV大于第一预设阈值、或者UV点击率大于第二预设阈值且独立访 ...
【技术保护点】
【技术特征摘要】
1.一种基于新闻图片特点的推荐方法,其特征在于,包括:S1,准备训练样本:从用户点击行为数据中选取页面访问量PV大于第一预设阈值、或者UV点击率大于第二预设阈值且独立访问量UV大于第三预设阈值的行为数据作为训练的正样本,选择UV点击率小于第四预设阈值的样本作为训练的负样本,控制负样本的数量为正样本数量的三倍,将正样本和负样本组成的样本数据按照预设比例拆分为训练集和测试集,并以tfrecords文件格式进行保存;S2,训练图片模型:加载tfrecords数据和深度学习模型,调整深度学习模型的配置参数,将tfrecords数据输入深度学习模型对所述深度学习模型进行训练,输出图片的预测概率,计算所述深度学习模型的评估指标AUC,当AUC达到预设指标以上时,保存模型;S3,输出图片特征数据:当有新的新闻图片入库时,使用步骤S2中保存的模型进行预测,获取全连接层的权重作为图片特征,记为f,以及获取输出的预测概率作为热度值,记作p;保存所有图片的特征数据;S4,利用图片特征进行推荐:将p数据输入排序模型,排序模型将p数据进行从大到小进行排序,热点概率排在前N个的新闻作为预测的热点新闻进行优先推荐;将f数据作为一维特征输入至所述排序模型中,根据所述排序模型的排序结果确定用户匹配的待推荐新闻。2.根据权利要求1所述的一种基于新闻图片特点的推荐方法,其特征在于,步骤S1中,所述第一预设阈值为2000,所述第二预设阈值为0.01,所述第三预设阈值为100,所述第四预设阈值为0.0005。3.根据权利要求1所述的一种基于新闻图片特点的推荐方法,其特征在于,步骤S2中,所述预设指标为0.9。4.根据权利要求1所述的一种基于新闻图片特点的推荐方法,其特征在于,调整深度学习模型的配置参数包括如下步骤:选取VGG16作为深度学习模型,将input_shape参数设置为向用户展现新闻时的尺寸,渠道数配置为3,不包含最后3个全连接层,配置固化VGG16深度学习模型的前16层,增加连接层结构分别为128维、64维和12维的三层全连接层,最后一层为simoid激活函数计算概率。5.根据权利要求1所述的一种基于新闻图片特点的推荐方法,其特征在于,所述深度学习模型包括VGG16、ResNet、ImageBert、Faster ...
【专利技术属性】
技术研发人员:黄修斌,
申请(专利权)人:上海二三四五网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。