一种数据分析方法、装置、电子设备及计算机存储介质制造方法及图纸

技术编号:34740186 阅读:32 留言:0更新日期:2022-08-31 18:32
本申请公开了一种数据分析方法、装置、电子设备及计算机存储介质,可应用于大数据领域。所述方法包括:获取门户型网站上目标客户的第一行为数据,并将所述第一行为数据汇总生成第一行为数据集;将所述第一行为数据集作为分类模型的输入,基于所述分类模型对所述第一行为数据集进行分类,确定N个客户群体对应的第二行为数据集;基于N个客户群体对应的第二行为数据集,确定每一客户群体对应的类别标签;推荐与所述类别标签对应的服务给所述客户群体下的所述目标客户。在本方案示出的分类模型无需训练,可直接基于kmeans聚类方法构建。通过上述方式能够避免表现数据分类不准确,以及分类模型迭代困难的问题。及分类模型迭代困难的问题。及分类模型迭代困难的问题。

【技术实现步骤摘要】
一种数据分析方法、装置、电子设备及计算机存储介质


[0001]本专利技术涉及数据处理
,尤其涉及一种数据分析方法、装置、电子设备及计算机存储介质。

技术介绍

[0002]对于门户型网站来说,客户群体,即客群分析是以来访客户的需求和网站自身的诉求为出发点,分析来访客户的行为数据,对其进行分类并推送不同的服务,从而实现精细化运营,提供更精准、更优质的服务内容。
[0003]目前客户群体数据的分类常基于监督的学习训练模型来实现,需要大量客户数据作为训练集来构建分类模型。由于构建模型的过程相对复杂因此分类模型不易更新迭代。不同于电子商务类的网站,门户型网站面向的客户量较少,客户群比较固定且类型相对单一。因此通过上述方式得到的分类模型容易出现数据分类不准确,以及分类模型迭代困难的问题。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供一种数据分析方法、装置、电子设备及计算机存储介质,以解决现有技术中出现的数据分类不准确,以及分类模型迭代困难的问题。
[0005]为实现上述目的,本专利技术实施例提供如下技术方案:
[0006]本专利技术实施例第一方面示出了一种数据分析方法,所述方法包括:
[0007]获取门户型网站上目标客户的第一行为数据,并将所述第一行为数据汇总生成第一行为数据集;
[0008]将所述第一行为数据集作为分类模型的输入,基于所述分类模型对所述第一行为数据集进行分类,确定N个客户群体对应的第二行为数据集,其中,N为大于等于2的正整数,所述客户群体对应的第二行为数据集是指至少由两个目标客户的第一行为数据组成的数据集,所述分类模型由kmeans聚类方法构建;
[0009]基于N个客户群体对应的第二行为数据集,确定每一客户群体对应的类别标签;
[0010]推荐与所述类别标签对应的服务给所述客户群体下的所述目标客户。
[0011]可选的,所述获取门户型网站上多个客户的第一行为数据,并将所述第一行为数据汇总生成第一行为数据集,包括:
[0012]遍历门户型网站的后台数据库中记录的每一客户的所有行为数据;
[0013]基于所述每一客户的所有行为数据,确定所有行为数据的数据量达到预设数据量的目标客户;
[0014]收集所述目标客户的所有行为数据;
[0015]针对每一目标客户,根据所述预配置数据项从所述所有行为数据中获取所述目标客户对应的第一行为数据;
[0016]将所述每一目标客户的第一行为数据汇总生成第一行为数据集。
[0017]可选的,所述基于所述分类模型对所述第一行为数据集进行分类,确定N个客户群体对应的第二行为数据集,包括:
[0018]所述分类模块利用最小生成树算法将第一行为数据集进行分类,得到N个客户群体对应的初始行为数据集;
[0019]所述分类模块对每一客户群体对应的初始行为数据集进行迭代聚类,得到N个客户群体对应的第二行为数据集。
[0020]可选的,所述基于N个客户群体对应的第二行为数据集,确定每一客户群体对应的类别标签,包括:
[0021]针对每一个客户群体对应的第二行为数据集,基于所述第二行为数据集,确定对应的共同特征;
[0022]基于所述共同特征确定所述客户群体的类别标签。
[0023]本专利技术实施例第二方面示出的一种数据分析装置,所述装置包括:
[0024]获取单元,用于获取门户型网站上目标客户的第一行为数据,并将所述第一行为数据汇总生成第一行为数据集;
[0025]分类模型,用于将所述第一行为数据集作为分类模型的输入,基于所述分类模型对所述第一行为数据集进行分类,确定N个客户群体对应的第二行为数据集,其中,N为大于等于2的正整数,所述客户群体对应的第二行为数据集是指至少由两个目标客户的第一行为数据组成的数据集,所述分类模型由kmeans聚类方法构建;
[0026]确定单元,用于基于N个客户群体对应的第二行为数据集,确定每一客户群体对应的类别标签;
[0027]推荐单元,用于推荐与所述类别标签对应的服务给所述客户群体下的所述目标客户。
[0028]可选的,所述获取单元,具体用于:
[0029]遍历门户型网站的后台数据库中记录的每一客户的所有行为数据;基于所述每一客户的所有行为数据,确定所有行为数据的数据量达到预设数据量的目标客户;收集所述目标客户的所有行为数据;针对每一目标客户,根据所述预配置数据项从所述所有行为数据中获取所述目标客户对应的第一行为数据;将所述每一目标客户的第一行为数据汇总生成第一行为数据集。
[0030]可选的,所述分类模型,具体用于:所述分类模块利用最小生成树算法将第一行为数据集进行分类,得到N个客户群体对应的初始行为数据集;所述分类模块对每一客户群体对应的初始行为数据集进行迭代聚类,得到N个客户群体对应的第二行为数据集。
[0031]本专利技术实施例第三方面示出了一种电子设备,所述电子设备用于运行程序,其中,所述程序运行时执行如本专利技术实施例第一方面示出的数据分析方法。
[0032]本专利技术实施例第四方面示出了一种计算机存储介质,所述存储介质包括存储程序,其中,在所述程序运行时控制所述存储介质所在设备执行如本专利技术实施例第一方面示出的数据分析方法。
[0033]基于上述本专利技术实施例提供的一种数据分析方法、装置、电子设备及计算机存储介质,所述方法包括:获取门户型网站上目标客户的第一行为数据,并将所述第一行为数据汇总生成第一行为数据集;将所述第一行为数据集作为分类模型的输入,基于所述分类模
型对所述第一行为数据集进行分类,确定N个客户群体对应的第二行为数据集,其中,N为大于等于2的正整数,所述客户群体对应的第二行为数据集是指至少由两个目标客户的第一行为数据组成的数据集,所述分类模型由kmeans聚类方法构建;基于N个客户群体对应的第二行为数据集,确定每一客户群体对应的类别标签;推荐与所述类别标签对应的服务给所述客户群体下的所述目标客户。在本专利技术实施例中,分类模型无需训练,可直接基于kmeans聚类方法构建。通过对所述第一行为数据集进行分类,确定N个客户群体对应的第二行为数据集,进而确定对应的类别标签,以及与类别标签对应的服务,从而推荐的客户。通过上述方式能够避免表现数据分类不准确,以及分类模型迭代困难的问题。
附图说明
[0034]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0035]图1为本专利技术实施例示出的一种数据分析方法的流程示意图;
[0036]图2为本专利技术实施例示出的另一种数据分析方法的流程示意图;
[0037]图3为本专利技术实施例示出的一种数据分析装置的结构示意图;
[0038]图4为本专利技术实施例示出本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据分析方法,其特征在于,所述方法包括:获取门户型网站上目标客户的第一行为数据,并将所述第一行为数据汇总生成第一行为数据集;将所述第一行为数据集作为分类模型的输入,基于所述分类模型对所述第一行为数据集进行分类,确定N个客户群体对应的第二行为数据集,其中,N为大于等于2的正整数,所述客户群体对应的第二行为数据集是指至少由两个目标客户的第一行为数据组成的数据集,所述分类模型由kmeans聚类方法构建;基于N个客户群体对应的第二行为数据集,确定每一客户群体对应的类别标签;推荐与所述类别标签对应的服务给所述客户群体下的所述目标客户。2.根据权利要求1所述的方法,其特征在于,所述获取门户型网站上多个客户的第一行为数据,并将所述第一行为数据汇总生成第一行为数据集,包括:遍历门户型网站的后台数据库中记录的每一客户的所有行为数据;基于所述每一客户的所有行为数据,确定所有行为数据的数据量达到预设数据量的目标客户;收集所述目标客户的所有行为数据;针对每一目标客户,根据所述预配置数据项从所述所有行为数据中获取所述目标客户对应的第一行为数据;将所述每一目标客户的第一行为数据汇总生成第一行为数据集。3.根据权利要求1所述的方法,其特征在于,所述基于所述分类模型对所述第一行为数据集进行分类,确定N个客户群体对应的第二行为数据集,包括:所述分类模块利用最小生成树算法将第一行为数据集进行分类,得到N个客户群体对应的初始行为数据集;所述分类模块对每一客户群体对应的初始行为数据集进行迭代聚类,得到N个客户群体对应的第二行为数据集。4.根据权利要求1所述的方法,其特征在于,所述基于N个客户群体对应的第二行为数据集,确定每一客户群体对应的类别标签,包括:针对每一个客户群体对应的第二行为数据集,基于所述第二行为数据集,确定对应的共同特征;基于所述共同特征确定所述客户群体的类别标签。5.根据权利要求1所述的方法,其特征在于,还包括:在将所述第一行为数据汇总生成...

【专利技术属性】
技术研发人员:王妍
申请(专利权)人:中银金融科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1