一种内容处理的方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号:39245742 阅读:21 留言:0更新日期:2023-10-30 11:58
本申请实施例公开了一种内容处理的方法以及相关装置,至少涉及人工智能中机器学习等技术,能够快速地实现对待推荐内容的分类处理,聚类性能和聚类效果均得以提升。上述方法包括:获取待推荐内容;对待推荐内容进行特征提取处理,得到待推荐内容的语义向量;基于待推荐内容的语义向量与N个候选聚类簇中的每个候选聚类簇的目标簇心向量,确定第一标识,第一标识用于标识待推荐内容所属的候选聚类簇,每个候选聚类簇是基于历史推荐内容的初始语义向量与初始聚类簇的簇心向量得到,初始聚类簇的簇心向量是基于历史推荐内容的初始语义向量进行聚类计算得到,N≥2、且N为整数;基于第一标识对待推荐内容进行推荐处理。第一标识对待推荐内容进行推荐处理。第一标识对待推荐内容进行推荐处理。

【技术实现步骤摘要】
一种内容处理的方法、装置、设备、存储介质及程序产品


[0001]本申请实施例涉及计算机
,具体涉及一种内容处理的方法、装置、设备、存储介质及程序产品。

技术介绍

[0002]当前信息流产品,比如新闻、短视频、文本、图像等推荐内容,依托于快速且准确的内容推荐系统。该内容推荐系统需要根据推荐内容的相似程度实现对推荐内容的聚类处理,进而执行排重、打散或者召回等操作。
[0003]在传统的聚类过程中,通常是基于图的概念计算推荐内容之间的相似度,在满足一定条件时构造相似度边,进而使用度数最大的推荐内容作为簇中心。这样,在确定簇中心后,对非簇中心进行预测,从而实现对推荐内容的聚类。然而,使用该传统的聚类方式仅仅计算推荐内容之间的相似度,对于复杂度较高的超大规模数据的场景而言,聚类性能较差,无法准确地实现对推荐内容的聚类,导致聚类效果欠佳。

技术实现思路

[0004]本申请实施例提供了一种内容处理的方法、装置、设备、存储介质及程序产品,能够快速地实现对待推荐内容的分类处理,聚类性能和聚类效果均得以提升。/>[0005]第一本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种内容处理的方法,其特征在于,包括:获取待推荐内容;对所述待推荐内容进行特征提取处理,得到所述待推荐内容的语义向量;基于所述待推荐内容的语义向量与N个候选聚类簇中的每个所述候选聚类簇的目标簇心向量,确定第一标识,所述第一标识用于标识所述待推荐内容所属的候选聚类簇,每个所述候选聚类簇是基于历史推荐内容的初始语义向量与初始聚类簇的簇心向量得到,所述初始聚类簇的簇心向量是基于所述历史推荐内容的初始语义向量进行聚类计算得到,N≥2、且N为整数;基于所述第一标识对所述待推荐内容进行推荐处理。2.根据权利要求1所述的方法,其特征在于,所述基于所述待推荐内容的语义向量与N个候选聚类簇的目标簇心向量,确定第一标识,包括:计算所述待推荐内容的语义向量与所述N个候选聚类簇中的每个所述候选聚类簇的目标簇心向量之间的距离,得到第一预测得分,所述第一预测得分用于指示所述待推荐内容与对应的所述候选聚类簇之间的相似度;从所述第一预测得分中确定目标预测得分,并将所述目标预测得分所对应的候选聚类簇的聚簇标识确定为第一标识。3.根据权利要求1或2所述的方法,其特征在于,所述基于所述第一标识对所述待推荐内容进行推荐处理,包括:获取所述历史推荐内容的第二标识,所述第二标识用于标识所述历史推荐内容所属的候选聚类簇;计算所述第一标识与所述第二标识之间的相似度;基于所述第一标识与所述第二标识之间的相似度,确定所述待推荐内容与所述历史推荐内容之间的内容相似度;基于所述内容相似度对所述待推荐内容进行推荐处理。4.根据权利要求1至3中任一项所述的方法,其特征在于,在基于所述待推荐内容的语义向量与N个候选聚类簇的簇心向量,确定第一标识之前,所述方法还包括:获取所述历史推荐内容的初始语义向量;基于预设聚类模型对所述历史推荐内容的初始语义向量进行聚类处理,得到至少两个所述初始聚类簇;对所述至少两个初始聚类簇的簇心向量进行聚类处理,得到至少一个第一聚类簇;基于每个所述第一聚类簇的簇心向量与对应的所述第一聚类簇中的历史推荐内容的初始语义向量,确定所述N个候选聚类簇。5.根据权利要求4所述的方法,其特征在于,所述对所述至少两个初始聚类簇的簇心向量进行聚类处理,得到至少一个第一聚类簇,包括:计算每个所述初始聚类簇中的所述历史推荐内容的内容个数;对所述历史推荐内容的内容个数大于或等于第一预设阈值时对应的初始聚类簇的簇心向量进行聚类处理,得到至少一个所述第一聚类簇。6.根据权利要求5所述的方法,其特征在于,所述对所述历史推荐内容的内容个数大于或等于第一预设阈值时对应的初始聚类簇的簇心向量进行聚类处理,得到至少一个所述第
一聚类簇,包括:计算所述历史推荐内容的内容个数大于或等于所述第一预设阈值时对应的初始聚类簇的簇心向量的平均值,得到第一向量;将所述第一向量作为所述第一聚类簇的簇心向量,以得到对应的所述第一聚类簇。7.根据权利要求4所述的方法,其特征在于,基于每个所述第一聚类簇的簇心向量与对应的所述第一聚类簇中的历史推荐内容的初始语义向量,确定所述N个候选聚类簇,包括:基于每个所述第一聚类簇的簇心向量与对应的所述第一聚类簇中的历史推荐内容的初始语义向量,确定所述历史推荐内容的目标语义向量;对所述历史推荐内容的目标语义向量进行聚类处理,得到所述N个候选聚类簇。8.根据权利要求4所述的方法,其特征在于,在基...

【专利技术属性】
技术研发人员:刘楚妮司建锋
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1