一种内容推荐方法、装置、设备及介质制造方法及图纸

技术编号:43588375 阅读:20 留言:0更新日期:2024-12-06 17:52
本公开实施例涉及一种内容推荐方法、装置、设备及介质,其中该方法包括:获取样本数据集,其中,样本数据集包括多个样本数据,每个样本数据包括一个内容及其对应的观看时长标签;确定样本数据集中各样本数据的标准观看时长;基于各样本数据的标准观看时长、观看时长标签以及置信区间参数,对样本数据集中的噪音数据进行纠正处理,得到目标数据集;基于目标数据集训练得到观看时长模型,并基于观看时长模型在多个内容中确定推荐内容。本公开实现了基于定义的标准观看时长和正态分布的置信区间参数统计方式对噪音数据进行纠正,顾及内容的差异以及不同用户群体的差异,进而利用纠正后的样本数据训练模型有效提升基于该模型的内容推荐的准确性。

【技术实现步骤摘要】

本公开涉及计算机,尤其涉及一种内容推荐方法、装置、设备及介质


技术介绍

1、对内容进行推荐时可以通过点击率、观看时长进行推荐。相关技术中,对样本数据中的噪音数据可以通过人工确定的固定阈值进行截断或采用平均观看时长进行替换的修改方式进行处理,但是这种方式没有顾及内容自身以及不同用户自身导致的差异,导致训练的针对观看时长的内容推荐模型的准确性较低,进而导致内容推荐的准确性较低。


技术实现思路

1、为了解决上述技术问题,本公开提供了一种内容推荐方法、装置、设备及介质。

2、本公开实施例提供了一种内容推荐方法,所述方法包括:

3、获取样本数据集,其中,所述样本数据集包括多个样本数据,每个所述样本数据包括一个内容及其对应的观看时长标签;

4、确定所述样本数据集中各所述样本数据的标准观看时长;

5、基于各所述样本数据的标准观看时长、观看时长标签以及置信区间参数,对所述样本数据集中的噪音数据进行纠正处理,得到目标数据集;

6、基于所述目标数据集训练得到观看时长模本文档来自技高网...

【技术保护点】

1.一种内容推荐方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,确定所述样本数据集中各所述样本数据的标准观看时长,包括:

3.根据权利要求2所述的方法,其特征在于,所述第二样本数据的标准观看时长与所述文本长度、所述图像数量正相关。

4.根据权利要求1所述的方法,其特征在于,基于各所述样本数据的标准观看时长、观看时长标签以及置信区间参数,对所述样本数据集中的噪音数据进行纠正处理,得到目标数据集,包括:

5.根据权利要求4所述的方法,其特征在于,根据多个所述标准观看时长将所述样本数据集划分为多个样本集合,包括:

...

【技术特征摘要】

1.一种内容推荐方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,确定所述样本数据集中各所述样本数据的标准观看时长,包括:

3.根据权利要求2所述的方法,其特征在于,所述第二样本数据的标准观看时长与所述文本长度、所述图像数量正相关。

4.根据权利要求1所述的方法,其特征在于,基于各所述样本数据的标准观看时长、观看时长标签以及置信区间参数,对所述样本数据集中的噪音数据进行纠正处理,得到目标数据集,包括:

5.根据权利要求4所述的方法,其特征在于,根据多个所述标准观看时长将所述样本数据集划分为多个样本集合,包括:

6.根据权利要求4所述的方法,其特征在于,确定各所述样本集...

【专利技术属性】
技术研发人员:喻钢
申请(专利权)人:北京火山引擎科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1