用户分类模型生成方法、装置、设备和计算机可读介质制造方法及图纸

技术编号:35022585 阅读:9 留言:0更新日期:2022-09-24 22:52
本公开的实施例公开了用户分类模型生成方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取标注样本集和未标注用户行为特征向量集;对于标注样本集中的每个标注样本,从未标注用户行为特征向量集中,确定与标注样本的样本用户行为特征向量的相似度满足预设条件的至少一个未标注用户行为特征向量;将各个样本用户行为特征向量和所确定的各个未标注用户行为特征向量作为顶点,两个顶点的相似度作为连接两个顶点的边的权重,构建用户关系网络;将用户关系网络转化为图嵌入矩阵,以及利用图嵌入矩阵训练得到用户分类模型。该实施方式与人工智能有关,实现了提高模型分类精度。模型分类精度。模型分类精度。

【技术实现步骤摘要】
用户分类模型生成方法、装置、设备和计算机可读介质


[0001]本公开的实施例涉及计算机
,具体涉及用户分类模型生成方法、装置、设备和计算机可读介质。

技术介绍

[0002]各类内容推荐场景下,可以根据用户分类,为用户推荐针对性的内容。在为用户针对性推荐内容的过程中,需要确定用户的分类。相关的用户分类模型包括采用聚类算法或按照规则来进行分类。
[0003]然而,当采用上述分类模型对用户进行分类时,往往存在以下技技术问题:
[0004]第一,采用聚类算法进行分类时,需要对数以亿计的用户数据,需要通过不断的迭代计算和初始点的欧氏距离,从而逼近真实聚类中心,计算时间开销非常大。
[0005]第二,基于规则进行分类时,依赖于人工进行用户特征挑选,不能基于历史数据进行挖掘,导致分类精度不高。

技术实现思路

[0006]本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0007]本公开的一些实施例提出了用户分类模型生成方法、装置、设备和计算机可读介质,来解决以上
技术介绍
部分提到的技术问题中的一项或多项。
[0008]第一方面,本公开的一些实施例提供了一种用户分类模型生成方法,该方法包括:获取标注样本集和未标注用户行为特征向量集,其中,标注样本集中的每个标注样本包括样本用户行为特征向量和用户分类标签;对于标注样本集中的每个标注样本,从未标注用户行为特征向量集中,确定与标注样本的样本用户行为特征向量的相似度满足预设条件的至少一个未标注用户行为特征向量;将各个样本用户行为特征向量和所确定的各个未标注用户行为特征向量作为顶点,两个顶点的相似度作为连接两个顶点的边的权重,构建用户关系网络;将用户关系网络转化为图嵌入矩阵,以及利用图嵌入矩阵训练得到用户分类模型。
[0009]第二方面,本公开的一些实施例提供了一种用户分类模型生成装置,包括:获取单元,被配置成获取标注样本集和未标注用户行为特征向量集,其中,标注样本集中的每个标注样本包括样本用户行为特征向量和用户分类标签;确定单元,被配置成对于标注样本集中的每个标注样本,从未标注用户行为特征向量集中,确定与标注样本的样本用户行为特征向量的相似度满足预设条件的至少一个未标注用户行为特征向量;网络构建单元,被配置成将各个样本用户行为特征向量和所确定的各个未标注用户行为特征向量作为顶点,两个顶点的相似度作为连接两个顶点的边的权重,构建用户关系网络;转化及训练单元,被配置成将用户关系网络转化为图嵌入矩阵,以及利用图嵌入矩阵训练得到用户分类模型。
[0010]第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。
[0011]第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。
[0012]本公开的上述各个实施例具有如下有益效果:提升用户分类模型的分类精度,较少训练耗时。相关的分类模型的分类精度不高的原因在于,依赖于人工进行用户特征挑选。基于此,本公开的一些实施例,基于用户行为之间的相似性来构建用户关系网络,并进一步将用户关系网转化为图嵌入矩阵,这样得到的用户特征中包含了不同用户行为之间的关系。由于用户行为能够极大程度的影响用户分类,因此考虑了用户行为之间的相似性的用户特征,有助于提高用户分类模型的分类精度。除此之外,利用用户行为特征向量之间的相似度,对标注样本集进行扩充,以及利用扩充后的数据训练得到用户分类模型,从而减少训练耗时。
附图说明
[0013]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
[0014]图1是本公开的一些实施例的用户分类模型生成方法的一个应用场景示意图;
[0015]图2是根据本公开的用户分类模型生成方法的一些实施例的流程图;
[0016]图3是根据本公开的一些实施例的用户分类模型生成方法中的一个示例性的用户关系网络示意图;
[0017]图4是根据本公开的用户分类模型生成方法的另一些实施例的流程图;
[0018]图5是根据本公开的用户分类模型生成装置的一些实施例的结构示意图;
[0019]图6是适于用来实现本公开的一些实施例的电子设备的结构示意图。
具体实施方式
[0020]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0021]另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
[0022]需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
[0023]需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
[0024]本公开中所涉及的用户个人信息(例如用户行为特征向量)的收集、存储、使用等操作,在执行相应操作之前,相关组织或个人尽到包括开展个人信息安全影响评估、向个人
信息主体履行告知义务、事先征得个人信息主体的授权同意等义务。
[0025]本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
[0026]下面将参考附图并结合实施例来详细说明本公开。
[0027]图1是根据本公开一些实施例的用户分类模型生成方法的一个应用场景的示意图。
[0028]如图1所示,用户分类模型生成方法的执行主体可以首先获取标注样本集和未标注用户行为特征向量集。其中,作为示例,标注样本集中的每个标注样本包括的样本用户行为特征可以是用户点击序列。图1中示例性列出了三个用户的用户点击序列。作为示例,标注样本中的用于分类标签可以是人工定义标签。用点击序列可以是在历史时间段内用户点击数据组成的序列。在此基础上,利用局部哈希敏感算法对于标注样本集中的每个标注样本,从未标注用户行为特征向量集中,确定与标注样本的样本用户行为特征向量的相似度满足预设条件的至本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户分类模型生成方法,包括:获取标注样本集和未标注用户行为特征向量集,其中,所述标注样本集中的每个标注样本包括样本用户行为特征向量和用户分类标签;对于所述标注样本集中的每个标注样本,从所述未标注用户行为特征向量集中,确定与所述标注样本的样本用户行为特征向量的相似度满足预设条件的至少一个未标注用户行为特征向量;将各个样本用户行为特征向量和所确定的各个未标注用户行为特征向量作为顶点,两个顶点的相似度作为连接两个顶点的边的权重,构建用户关系网络;将所述用户关系网络转化为图嵌入矩阵,以及利用所述图嵌入矩阵训练得到所述用户分类模型。2.根据权利要求1所述的方法,其中,所述将所述用户关系网络转化为图嵌入矩阵,包括:将两个顶点间的统计检验作为偏移概率,以及根据所述偏移概率进行采样,得到所述用户关系网络中每个顶点对应的序列;将所述序列输入词向量生成模型,得到每个顶点的顶点向量,各个顶点的顶点向量组成所述图嵌入矩阵。3.根据权利要求1所述的方法,其中,所述统计检验为卡方检验。4.根据权利要求1所述的方法,其中,所述从所述未标注用户行为特征向量集中,确定与所述标注样本的样本用户行为特征向量的相似度满足预设条件的至少一个未标用户行为注特征向量,包括:基于所述各个样本用户行为特征向量和所确定的各个未标注用户行为特征向量,确定用户编码矩阵;基于所述用户编码矩阵确定签名矩阵;基于所述签名矩阵,确定与所述标注样本的样本用户行为特征向量的相似度满足预设条件的至少一个未标用户行为注特征向量。5.根据权利要求1

4中任一所述的方法,其中,所述方法还包括:通过目标评价指标对所述用户分类模型进行检验,以得到所述用户分类模型的检验值,所述目标评价指标包括基于预测为负的正样本数量、预测为正的负样本数量、预测为正的正样本数量以及所述预测为正的正样本数量对应的权重确...

【专利技术属性】
技术研发人员:李靖恺
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1