内容推荐方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:38071108 阅读:8 留言:0更新日期:2023-07-06 08:40
本申请实施例公开了内容推荐方法、装置、电子设备和计算机可读介质。该方法的实施例包括:获取内容集中各内容在目标特征空间中的初始特征向量,初始特征向量通过对多维特征进行融合后得到;基于扩展卡尔曼滤波器对各内容的初始特征向量进行更新,得到各内容的当前特征向量;对所得到的当前特征向量进行聚类,得到多个类簇;获取目标用户的历史浏览内容在目标特征空间中的目标特征向量,基于目标特征向量与所得到的类簇的关系,从内容集中选取目标内容,并向目标用户推送目标内容。该实施方式提高了内容归类以及内容推荐的准确性。高了内容归类以及内容推荐的准确性。高了内容归类以及内容推荐的准确性。

【技术实现步骤摘要】
内容推荐方法、装置、电子设备和计算机可读介质


[0001]本申请实施例涉及计算机
,具体涉及内容推荐方法、装置、电子设备和计算机可读介质。

技术介绍

[0002]随着互联网技术的发展,用户可通过互联网浏览各种类型的内容,如影片、短视频、文章等。通常,服务端可主动向用户推送其所感兴趣的内容,以节省用户的搜索时间。
[0003]现有技术中,通常预先对内容类别等进行划分(如针对影片,可将其类别划分为动作、科幻、冒险等),从而基于内容的特征来判定各内容的类别,进而基于类别进行内容推荐。然而,这种方式无法自动动态变更所划分的内容类别,因此内容归类不够准确。此外,无法动态地考虑播放量、收藏量、评分数等特征发生变化时对内容整体产生的影响,导致所推送的内容与用户需求的关联度较低,造成内容推荐不够准确。

技术实现思路

[0004]本申请实施例提出了内容推荐方法、装置、电子设备和计算机可读介质,以解决现有技术中内容归类以及内容推荐不够准确的技术问题。
[0005]第一方面,本申请实施例提供了一种内容推荐方法,该方法包括:获取内容集中各内容在目标特征空间中的初始特征向量,所述初始特征向量通过对多维特征进行融合后得到;基于扩展卡尔曼滤波器对各内容的初始特征向量进行更新,得到各内容的当前特征向量;对所得到的当前特征向量进行聚类,得到多个类簇;获取目标用户的历史浏览内容在所述目标特征空间中的目标特征向量,基于所述目标特征向量与所得到的类簇的关系,从所述内容集中选取目标内容,并向所述目标用户推送所述目标内容。
[0006]第二方面,本申请实施例提供了一种内容推荐装置,该装置包括:获取单元,用于获取内容集中各内容在目标特征空间中的初始特征向量,所述初始特征向量通过对多维特征进行融合后得到;更新单元,用于基于扩展卡尔曼滤波器对各内容的初始特征向量进行更新,得到各内容的当前特征向量;聚类单元,用于对所得到的当前特征向量进行聚类,得到多个类簇;推送单元,用于获取目标用户的历史浏览内容在所述目标特征空间中的目标特征向量,基于所述目标特征向量与所得到的类簇的关系,从所述内容集中选取目标内容,并向所述目标用户推送所述目标内容。
[0007]第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面中所描述的方法。
[0008]第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面中所描述的方法。
[0009]本申请实施例提供的内容推荐方法、装置、电子设备和计算机可读介质,通过对内容集中各内容的多维特征进行融合,可以得到各内容在目标特征空间中的初始特征向量,
由于该初始特征向量融合了多维度特征,因此反应了多维度特征及其相互关联状态,相较于仅针对内容类别进行内容推荐的方式,可使内容推荐结果更加准确。另外,基于扩展卡尔曼滤波器对各内容的初始特征向量进行更新,可动态计算出在目标特征空间中的当前特征向量,考虑了特征动态变化的情况,提高了特征的准确性,进而提高了内容推荐的准确性。此外,对所得到的当前特征向量进行聚类,基于目标用户的历史浏览内容在目标特征空间中的目标特征向量与所得到的类簇的关系,从内容集中选取目标内容并进行推送,可动态地进行内容归类,相较于预先划分固定类别的方式,提高了内容归类的准确性,同时,这种归类方式可确定出关联度不足的影片内容,避免无效的内容推荐,进一步提高了内容推荐的准确性。
附图说明
[0010]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0011]图1是根据本申请的内容推荐方法的一个实施例的流程图;
[0012]图2是根据本申请的内容推荐方法的特征向量更新过程的流程图;
[0013]图3是根据本申请的内容推荐方法的聚类过程的流程图;
[0014]图4是根据本申请的内容推荐装置的一个实施例的结构示意图;
[0015]图5是用于实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
[0016]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。
[0017]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0018]请参考图1,其示出了根据本申请的内容推荐方法的一个实施例的流程100。该内容推荐方法,包括以下步骤:
[0019]步骤101,获取内容集中各内容在目标特征空间中的初始特征向量。
[0020]在本实施例中,内容推荐方法的执行主体(如服务器等电子设备)可以获取内容集中各内容在目标特征空间中的初始特征向量。其中,内容集中可包括大量的内容。内容可以包括但不限于以下至少一项:影视内容、文字内容。影视内容可包括但不限于各题材的影片、短视频等。
[0021]在本实施例中,目标特征空间可以预设维度的特征空间,如三维特征空间、四位特征空间等。初始特征向量可通过对多维特征(大于目标特征空间的维度)进行融合后得到。以影视内容为例,多维特征可包括但不限于以下至少一项:播放量、收藏量、评分数、点赞数、影片类型(动作、科幻、冒险)、年份。初始特征向量中的每个特征值即为融合多个特征之后所得到的值。每个内容的初始特征向量即为目标特征空间中的一个坐标,可表现为目标特征空间中的一个点。
[0022]在本实施例的一些可选的实现方式中,初始特征向量通过如下步骤得到:首先,获
取内容集中各内容的多维特征,并对多维特征进行编码。此处,原始的多维特征可以是字符型特征,可使用独热编码(One

Hot Encoding)将字符串型特征转化为数值型特征。之后,可通过主成分分析算法(Principal components analysis,PCA)利用降维的方式对编码后的多维特征(如数值型的多维特征)进行融合,并对融合后的特征进行归一化(即将融合后的所得到的各特征缩放到(0

1)区间内),得到各内容在目标特征空间中的初始特征向量。第n个内容的初始特征向量可表示为X(n)=[x,y,z]。
[0023]由于每个内容的初始特征向量由该内容的多维特征融合得到,因此考虑了多种特征以及特征间的相互关联状态,因此,相较于仅针对内容类别进行内容推荐的方式,可使内容推荐结果更加准确。
[0024]步骤102,基于扩展卡尔曼滤波器对各内容的初始特征向量进行更新,得到各内容的当前特征向量。
[0025]在本实施例中,上述执行主体可以基于扩展卡尔曼滤波器对各内容的初始特征向量进行更新,得到各内容的当前特征向量。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种内容推荐方法,其特征在于,所述方法包括:获取内容集中各内容在目标特征空间中的初始特征向量,所述初始特征向量通过对多维特征进行融合后得到;基于扩展卡尔曼滤波器对各内容的初始特征向量进行更新,得到各内容的当前特征向量;对所得到的当前特征向量进行聚类,得到多个类簇;获取目标用户的历史浏览内容在所述目标特征空间中的目标特征向量,基于所述目标特征向量与所得到的类簇的关系,从所述内容集中选取目标内容,并向所述目标用户推送所述目标内容。2.根据权利要求1所述的方法,其特征在于,所述初始特征向量通过如下步骤得到:获取内容集中各内容的多维特征,并对所述多维特征进行编码;通过主成分分析算法对编码后的多维特征进行融合,并对融合结果进行归一化,得到各内容在目标特征空间中的初始特征向量。3.根据权利要求1所述的方法,其特征在于,所述基于扩展卡尔曼滤波器对各内容的初始特征向量进行更新,得到各内容的当前特征向量,包括:对于每一个内容,迭代执行如下步骤:基于所述初始特征向量,确定协方差;基于所述协方差确定卡尔曼增益值;基于所述卡尔曼增益值,对内容当前的特征向量进行预估,得到第一预估特征向量;若所述第一预估特征向量与所述初始特征向量的偏差大于预设阈值,则基于预设系数更新所述第一预估特征向量,得到第二预估特征向量,并将所述初始特征向量更新为所述第二预估特征向量;若所述第一预估特征向量与所述初始特征向量的偏差小于或等于预设阈值,将所述初始特征向量更新为所述第一预估特征向量;在满足迭代停止条件时,将最终得到的第一预估特征向量确定内容的当前特征向量。4.根据权利要求1所述的方法,其特征在于,所述对所得到的当前特征向量进行聚类,得到多个类簇,包括:迭代执行如下步骤:利用具有噪声的基于密度的聚类算法DBSCAN对所得到的当前特征向量进行聚类,以得到多个类簇;基于每个内容的当前特征向量到同类簇中其他内容的当前特征向量的平均距离,以及,到非同类簇中各内容的当前特征向量的平均距离,确定评价值,所述评价值用于评价聚类结果的优劣;基于邻域参数取值范围,更新所述DBSCAN的邻域参数;选用评价值最大时所得到的类簇。5.根据权利要求1所述的方法,其特征在于,所述基于所述目标特征向量与所得到的类簇的关系,从所述内容集中选取目标内容,包括:若所述目标特征向量位于所述多个类簇中的其中一个类簇,则将所述目标特征向量所位于的类簇作为第一目标类簇,确定所述第一目标类簇中各内容的当前特征向量与所述目标特征向量...

【专利技术属性】
技术研发人员:闫帅胡治满于亚洲王毅成郑智鹏钱鑫陶和平
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1