【技术实现步骤摘要】
本公开涉及计算机,尤其涉及一种内容推荐方法、装置、设备及介质。
技术介绍
1、对内容进行推荐时可以通过点击率、观看时长进行推荐。相关技术中,对样本数据中的噪音数据可以通过人工确定的固定阈值进行截断或采用平均观看时长进行替换的修改方式进行处理,但是这种方式没有顾及内容自身以及不同用户自身导致的差异,导致训练的针对观看时长的内容推荐模型的准确性较低,进而导致内容推荐的准确性较低。
技术实现思路
1、为了解决上述技术问题,本公开提供了一种内容推荐方法、装置、设备及介质。
2、本公开实施例提供了一种内容推荐方法,所述方法包括:
3、获取样本数据集,其中,所述样本数据集包括多个样本数据,每个所述样本数据包括一个内容及其对应的观看时长标签;
4、确定所述样本数据集中各所述样本数据的标准观看时长;
5、基于各所述样本数据的标准观看时长、观看时长标签以及置信区间参数,对所述样本数据集中的噪音数据进行纠正处理,得到目标数据集;
6、基于所述目标数据
...【技术保护点】
1.一种内容推荐方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,确定所述样本数据集中各所述样本数据的标准观看时长,包括:
3.根据权利要求2所述的方法,其特征在于,所述第二样本数据的标准观看时长与所述文本长度、所述图像数量正相关。
4.根据权利要求1所述的方法,其特征在于,基于各所述样本数据的标准观看时长、观看时长标签以及置信区间参数,对所述样本数据集中的噪音数据进行纠正处理,得到目标数据集,包括:
5.根据权利要求4所述的方法,其特征在于,根据多个所述标准观看时长将所述样本数据集划分为多个样本集合,
...
【技术特征摘要】
1.一种内容推荐方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,确定所述样本数据集中各所述样本数据的标准观看时长,包括:
3.根据权利要求2所述的方法,其特征在于,所述第二样本数据的标准观看时长与所述文本长度、所述图像数量正相关。
4.根据权利要求1所述的方法,其特征在于,基于各所述样本数据的标准观看时长、观看时长标签以及置信区间参数,对所述样本数据集中的噪音数据进行纠正处理,得到目标数据集,包括:
5.根据权利要求4所述的方法,其特征在于,根据多个所述标准观看时长将所述样本数据集划分为多个样本集合,包括:
6.根据权利要求4所述的方法,其特征在于,确定各所述样本集...
【专利技术属性】
技术研发人员:喻钢,
申请(专利权)人:北京火山引擎科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。