【技术实现步骤摘要】
一种信息推荐方法、装置、设备及存储介质
本专利技术涉及互联网技术,尤其涉及一种信息推荐方法、装置、设备及存储介质。
技术介绍
信息推荐是指服务器根据用户的身份属性、兴趣属性等从数据库中匹配出对应的推荐内容,然后将推荐内容呈现在用户的终端上的过程。相关技术中,服务器会将具有相同或类似的身份属性、兴趣属性的用户划为一类,即为用户确定出用户类别,然后将某个用户类别中的一些用户所感兴趣内容作为推荐内容,推荐给该用户类别中的其他用户。常用的用户类别划分方式有直接根据用户的原始属性数据进行划分,以及根据从原始属性数据中提取出特征的进行划分等。然而,原始属性数据中往往可能包含对用户的类别划分的影响较低,甚至是对用户的类别划分具有负面影响的特征。此时,利用原始属性数据,以及利用从原始属性数据中所提取出的特征进行用户类别划分的准确度较低,从而导致信息推荐的准确度较低。
技术实现思路
本专利技术实施例提供一种信息推荐方法、装置、设备及存储介质,能够提高信息推荐的准确度。本专利技术实施例的技术方案是这样实现的:本专利技术实施例提供一种信息推荐方法,应用于服务器,包括:获取预设好的至少一个用户类别对应的所至少一个类别中心、特征权重信息和目标对象对应的属性特征;所述特征权重信息表征所述属性特征对用户类别划分的重要程度;所述至少一个类别中心是由所述服务器对所述训练样本数据进行训练得到的;根据所述属性特征生成待聚类数据;基于所述待聚类数据和所述特征权重信息确定出带权重的待聚类数据 ...
【技术保护点】
1.一种信息推荐方法,其特征在于,应用于服务器,包括:/n获取预设好的至少一个用户类别所对应的至少一个类别中心、特征权重信息和目标对象对应的属性特征;所述特征权重信息表征所述属性特征对用户类别划分的重要程度;所述至少一个类别中心是由所述服务器对所述训练样本数据进行训练得到的;/n根据所述属性特征生成待聚类数据;/n基于所述待聚类数据和所述特征权重信息确定出带权重的待聚类数据,并根据所述带权重的待聚类数据和所述至少一个类别中心,分别确定出所述目标对象属于所述至少一个用户类别的至少一个类别概率;/n根据所述至少一个类别概率从推荐内容库中获取到推荐信息;/n将所述推荐信息发送给所述目标对象对应的终端。/n
【技术特征摘要】
1.一种信息推荐方法,其特征在于,应用于服务器,包括:
获取预设好的至少一个用户类别所对应的至少一个类别中心、特征权重信息和目标对象对应的属性特征;所述特征权重信息表征所述属性特征对用户类别划分的重要程度;所述至少一个类别中心是由所述服务器对所述训练样本数据进行训练得到的;
根据所述属性特征生成待聚类数据;
基于所述待聚类数据和所述特征权重信息确定出带权重的待聚类数据,并根据所述带权重的待聚类数据和所述至少一个类别中心,分别确定出所述目标对象属于所述至少一个用户类别的至少一个类别概率;
根据所述至少一个类别概率从推荐内容库中获取到推荐信息;
将所述推荐信息发送给所述目标对象对应的终端。
2.根据权利要求1所述的方法,其特征在于,所述基于所述待聚类数据、和所述特征权重信息确定出带权重的待聚类数据,并根据所述带权重的待聚类数据和所述至少一个类别中心,分别确定出所述目标对象属于所述至少一个用户类别的至少一个类别概率,包括:
利用所述特征权重信息,为所述待聚类数据中的各个子数据分配权重,得到所述带权重的待聚类数据;
对所述带权重的待聚类数据,与所述至少一个类别中心中的每个类别中心分别进行距离运算,得到至少一个类别距离信息;
对所述至少一个类别距离信息中的每个类别距离信息进行归一化,得到归一化结果,并利用所述归一化结果计算出所述至少一个类别概率。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述至少一个类别概率从推荐内容库中获取到推荐信息,包括:
将所述至少一个类别概率中的每个类别概率,作为所述每个用户类别对应的内容获取比例,并按照所述内容获取比例,从所述推荐内容库中分别获取到所述每个用户类别对应的推荐内容;
按照所述每个类别概率的大小,为所述每个用户类别对应的推荐内容进行排序,得到所述推荐信息。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述属性特征包括:一个或多个子特性;所述根据所述属性特征生成待聚类数据,包括:
根据预设好的子特征与子数据之间的对应关系,为所述一个或多个子特征中的每个子特征确定出对应的子数据,进而得到一个或多个子数据;
将所述一个或多个子数据进行整合,得到所述待聚类数据。
5.根据权利要求1至4任一项所述的方法,其特征在于,在所述获取预设好的至少一个用户类别对应的至少一个类别中心、特征权重信息和目标对象对应的属性特征之前,所述方法还包括:
获取初始指示概率、初始特征权重信息、惩罚参数以及多个训练样本数据;指示概率表征训练样本数据属于用户类别的概率;
基于所述初始指示概率、所述初始特征权重信息和所述多个训练样本数据中的每个训练样本数据,计算出所述至少一个用户类别中的每个用户类别对应的临时类别中心;
根据所述临时类别中心、所述初始特征权重信息、所述初始指示概率、所述惩罚参数和所述每个训练样本数据,确定出临时指示概率;
利用所述临时指示概率、所述初始特征权重信息、所述临时类别中心和所述每个训练样本数据,计算出临时特征权重信息;
重复上述计算出所述临时类别中心,确定出临时指示概率以及计算出临时特征权重信息的过程,直至所述临时指示概率的变化幅度处于预设阈值之内时停止训练,得到所述至少一个类别中心和所述特征权重信息。
6.根据权利要求5所述的方法,其特征在于,所述基于所述初始指示概率、所述初始特征权重信息和所述多个训练样本数据中的每个训练样本数据,计算出所述至少一个用户类别中的每个用户类别对应的临时类别中心,包括:
利用所述初始特征权重信息,为所述每个训练样本数据中的各个子数据分配权重,得到带权重的训练样本数据;
将所述初始指示概率按照所述用户类别进行划分,得到与所述每个用户类别对应的类别指示概率集合;所述类别指示概率集合表征一个用户类别中每个训练样本数据所对应的初始指示概率的集合;
根据所述带权重的训练样本数据,和所述类别指示概率集合中的每个初始指示概率,计算出所述每个用户类别对应的第一临时中心参数;
对所述类别指示概率集合中的初始指示概率进行累加,得到所述每个用户类别对应的第二临时中心参数;
根据所述第一临时中心参数和所述第二临时中心参数,计算出所述每个用户类别对应的所述临时类别中心。
7.根据权利要求5所述的方法,其特征在于,所述根据所述临时类别中心、所述初始特征权重信息、所述初始指示概率、所述惩罚参数和所述每个训练样本数据,确定出临时指示概率,包括:
将所述初始指示概率按照训练样本数据进行划分,得到所述每个训练样本数据对应的样本数据指示概率集合;所述样本数据指示概率集合表征一个训练样本数据对应到所述每个用户类别的初始指示概率的集合;
利用所述每个用户类别对应的所述临时类别中心、所述初始特征权重信息、所述惩罚参数和所述每个训练样本数据,构造出类别参数向量;
计算所述类别参数向量和所述样本数据指示概率集合之间的距离,得到第一指示概率参数;
对所述样本数据指示概率集合中的每个初始指示概率进行一次或多次调整,得到一个或多个调整后的样本数据指示...
【专利技术属性】
技术研发人员:黎功福,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。