用户分群方法和装置、电子设备及存储介质制造方法及图纸

技术编号:38899019 阅读:7 留言:0更新日期:2023-09-22 14:19
本申请实施例提供了一种用户分群方法和装置、电子设备及存储介质,属于人工智能和金融科技技术领域。该方法包括:获取待分群用户的原始点击数据;其中,所述原始点击数据为所述待分群用户预先对候选物品进行点击操作产生的点击数据;根据预设的目标物品数据对所述原始点击数据进行过滤处理,得到有效点击数据;根据预设的物品参考数据将所述有效点击数据进行物品聚合处理,得到点击数据集;根据所述点击数据集进行相似度计算,得到行为相似度数据;根据所述行为相似度数据对所述待分群用户进行分群处理,得到目标用户群组。本申请实施例能够提高用户分群的准确性,且适用于物品数量较少(如百量级物品数量)的应用场景中。数量较少(如百量级物品数量)的应用场景中。数量较少(如百量级物品数量)的应用场景中。

【技术实现步骤摘要】
用户分群方法和装置、电子设备及存储介质


[0001]本申请涉及人工智能和金融科技
,尤其涉及一种用户分群方法和装置、电子设备及存储介质。

技术介绍

[0002]相关技术中,传统的用户分群主要通过聚类算法来实现,从底层用户数据中发现用户偏好规律从而将相似用户划分为一个共同群体。但这种方法无法消除热门物品对用户真实偏好判断的影响,在实物商城中,实物商品的种类数量在万量级以上,用户的可选择物品较多,选择热门物品对用户真实偏好需求的判断影响较小;而在物品数量较少的场景中,以金融商城中的基金为例,基金类物品数量通常在百量级,容易出现用户点击的基金物品集合重合过多的热门基金物品的情况,导致用户的真实偏好需求信息被覆盖,使得用户分群的准确性较低。因此,如何提高用户分群的准确性,成为了亟待解决的技术问题。

技术实现思路

[0003]本申请实施例的主要目的在于提出一种用户分群方法和装置、电子设备及存储介质,旨在提高用户分群的准确性,且适用于物品数量较少(如百量级物品数量)的应用场景中。
[0004]为实现上述目的,本申请实施例的第一方面提出了一种用户分群方法,所述方法包括:
[0005]获取待分群用户的原始点击数据;其中,所述原始点击数据为所述待分群用户预先对候选物品进行点击操作产生的点击数据;
[0006]根据预设的目标物品数据对所述原始点击数据进行过滤处理,得到有效点击数据;
[0007]根据预设的物品参考数据将所述有效点击数据进行物品聚合处理,得到点击数据集;
[0008]根据所述点击数据集进行相似度计算,得到行为相似度数据;
[0009]根据所述行为相似度数据对所述待分群用户进行分群处理,得到目标用户群组。
[0010]在一些实施例中,在所述根据预设的目标物品数据对所述原始点击数据进行过滤处理,得到有效点击数据的步骤之前,所述方法还包括:
[0011]获取所述候选物品被点击的用户数量,得到点击人数;
[0012]根据所述点击人数和预设的目标点击阈值从所述候选物品中筛选出目标物品;
[0013]根据所述目标物品的物品属性信息构建所述目标物品数据。
[0014]在一些实施例中,所述根据预设的目标物品数据对所述原始点击数据进行过滤处理,得到有效点击数据的步骤,包括:
[0015]根据所述目标物品数据从所述原始点击数据中筛选出选定点击数据;其中,所述选定点击数据为所述原始点击数据中关于所述目标物品的点击数据;
[0016]将所述原始点击数据中的所述选定点击数据进行删除处理,得到所述有效点击数据。
[0017]在一些实施例中,所述物品参考数据包括参考标识信息;所述有效点击数据包括有效标识信息;所述根据预设的物品参考数据将所述有效点击数据进行物品聚合处理,得到点击数据集的步骤,包括:
[0018]对每一用户组的所述有效标识信息进行相同标识比对,得到每一所述用户组的第一物品数量;其中,任意两个所述待分群用户为一个所述用户组;
[0019]对每一所述用户组的所述有效标识信息进行差异标识比对,得到每一所述用户组的第二物品数量;
[0020]对所述参考标识信息和所述有效标识信息进行空缺标识比对,得到每一所述用户组的第三物品数量;
[0021]根据所述第一物品数量、所述第二物品数量和所述第三物品数量构建数据集合,得到所述点击数据集。
[0022]在一些实施例中,所述根据所述点击数据集进行相似度计算,得到行为相似度数据的步骤,包括:
[0023]将所述点击数据集输入至预设的行为相似度计算模型;其中,所述行为相似度计算模型包括:矩阵熵计算层、行熵计算层和列熵计算层;
[0024]通过矩阵熵计算层对所述第一物品数量、所述第二物品数量和所述第三物品数量进行矩阵熵计算,得到矩阵熵数据;
[0025]通过行熵计算层对所述第一物品数量、所述第二物品数量和所述第三物品数量进行行熵计算,得到行熵数据;
[0026]通过列熵计算层对所述第一物品数量、所述第二物品数量和所述第三物品数量进行列熵计算,得到列熵数据;
[0027]根据所述矩阵熵数据、所述行熵数据和所述列熵数据进行对数似然比相似度计算,得到所述行为相似度数据。
[0028]在一些实施例中,所述获取待分群用户的原始点击数据的步骤,包括:
[0029]获取所述待分群用户的历史点击数据;其中,所述历史点击数据为所述待分群用户预先对所有物品进行点击操作产生的点击数据;
[0030]根据所述历史点击数据进行点击物品数量计算,得到物品点击数量;
[0031]根据预设的点击量范围和所述物品点击数量对所述历史点击数据进行筛选处理,得到所述原始点击数据。
[0032]在一些实施例中,所述行为相似度数据包括行为相似值;所述根据所述行为相似度数据对所述待分群用户进行分群处理,得到目标用户群组的步骤,包括:
[0033]从所述待分群用户中获取参考用户;
[0034]根据所述行为相似度数据获取所述参考用户和所述待分群用户之间的所述行为相似值;
[0035]根据所述行为相似值将所述待分群用户进行排序,得到用户排序信息;其中,所述参考用户作为排序中心;
[0036]根据预设的用户数量阈值和所述用户排序信息将所述待分群用户进行分群,得到
所述目标用户群组。
[0037]为实现上述目的,本申请实施例的第二方面提出了一种用户分群装置,所述装置包括:
[0038]数据获取模块,用于获取待分群用户的原始点击数据;其中,所述原始点击数据为所述待分群用户预先对候选物品进行点击操作产生的点击数据;
[0039]数据过滤模块,用于根据预设的目标物品数据对所述原始点击数据进行过滤处理,得到有效点击数据;
[0040]数据聚合模块,用于根据预设的物品参考数据将所述有效点击数据进行物品聚合处理,得到点击数据集;
[0041]数据计算模块,用于根据所述点击数据集进行相似度计算,得到行为相似度数据;
[0042]用户分群模块,用于根据所述行为相似度数据对所述待分群用户进行分群处理,得到目标用户群组。
[0043]为实现上述目的,本申请实施例的第三方面提出了一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的方法。
[0044]为实现上述目的,本申请实施例的第四方面提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的方法。
[0045]本申请提出的用户分群方法和装置、电子设备及存储介质,将热门物品的数据作为目标物品数据,通过获取待分群用户的原始点击数据,并根据表征热门物品信息的目标物品数据对原始点击数据进行过滤处理,从而得到反映用户真实行为偏好的有效点击数据,对有效点击数据进行聚合处理得到点击数据集,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户分群方法,其特征在于,所述方法包括:获取待分群用户的原始点击数据;其中,所述原始点击数据为所述待分群用户预先对候选物品进行点击操作产生的点击数据;根据预设的目标物品数据对所述原始点击数据进行过滤处理,得到有效点击数据;根据预设的物品参考数据将所述有效点击数据进行物品聚合处理,得到点击数据集;根据所述点击数据集进行相似度计算,得到行为相似度数据;根据所述行为相似度数据对所述待分群用户进行分群处理,得到目标用户群组。2.根据权利要求1所述的方法,其特征在于,在所述根据预设的目标物品数据对所述原始点击数据进行过滤处理,得到有效点击数据的步骤之前,所述方法还包括:获取所述候选物品被点击的用户数量,得到点击人数;根据所述点击人数和预设的目标点击阈值从所述候选物品中筛选出目标物品;根据所述目标物品的物品属性信息构建所述目标物品数据。3.根据权利要求2所述的方法,其特征在于,所述根据预设的目标物品数据对所述原始点击数据进行过滤处理,得到有效点击数据的步骤,包括:根据所述目标物品数据从所述原始点击数据中筛选出选定点击数据;其中,所述选定点击数据为所述原始点击数据中关于所述目标物品的点击数据;将所述原始点击数据中的所述选定点击数据进行删除处理,得到所述有效点击数据。4.根据权利要求1所述的方法,其特征在于,所述物品参考数据包括参考标识信息;所述有效点击数据包括有效标识信息;所述根据预设的物品参考数据将所述有效点击数据进行物品聚合处理,得到点击数据集的步骤,包括:对每一用户组的所述有效标识信息进行相同标识比对,得到每一所述用户组的第一物品数量;其中,任意两个所述待分群用户为一个所述用户组;对每一所述用户组的所述有效标识信息进行差异标识比对,得到每一所述用户组的第二物品数量;对所述参考标识信息和所述有效标识信息进行空缺标识比对,得到每一所述用户组的第三物品数量;根据所述第一物品数量、所述第二物品数量和所述第三物品数量构建数据集合,得到所述点击数据集。5.根据权利要求4所述的方法,其特征在于,所述根据所述点击数据集进行相似度计算,得到行为相似度数据的步骤,包括:将所述点击数据集输入至预设的行为相似度计算模型;其中,所述行为相似度计算模型包括:矩阵熵计算层、行熵计算层和列熵计算层;通过矩阵熵计算层对所述第一物品数量、所述第二物品数量和所述第三物品数量进行矩阵熵计算,得到...

【专利技术属性】
技术研发人员:温晓康
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1