一种大数据挖掘方法技术

技术编号:17007525 阅读:42 留言:0更新日期:2018-01-11 03:52
本发明专利技术实施例提供了一种大数据挖掘方法,所述方法包括:获取用户浏览数据中的商品的数量;根据每个用户浏览数据中的商品的数量对用户进行分类,确定目标用户集合;根据所述目标用户集合中每个用户的单用户特征向量;根据所述单用户特征向量,基于聚类算法对所述目标用户集合进行分级,确定分级用户集合,其中,分级用户集合的数量与预定分级数量相等。应用本发明专利技术实施例,一方面能够更有针对性,减少运算的数据量,另一方面能排除不同类的用户数据对于聚类效果的干扰,使用户群体划分更加准确,便于根据用户群体划分结果进行精准式、个性化的服务。

【技术实现步骤摘要】
一种大数据挖掘方法
本专利技术涉及数据处理领域,特别是涉及一种大数据挖掘方法。
技术介绍
随着社会工业化、信息化水平的不断提高,如今数据已取代计算成为信息计算的中心,云计算、大数据正在成为一种趋势和潮流,包括存储容量、可用性、I/O性能、数据安全性、可扩展性等诸多方面。大数据是规模非常巨大和复杂的数据集。大数据有4V:Volume(大量),数据量持续快速增加;Velocity(高速),数据I/O速度更快;Variety(多样),数据类型和来源多样化;Value(价值),其存在各方面的可用价值。如何从海量的数据中提取、获得想要的知识或感兴趣的信息,这是利用好大数据,进而更好地服务于社会发展的要求。因此,数据挖掘方法应运而生。数据挖掘是作为一门学科诞生于20世纪80年代,从技术的角度看就是从大量复杂的、不规则的、随机的、模糊的数据中获取隐含的、人们事先没有发觉的、有潜在价值的信息和知识的过程。在大数据应用领域,往往可以根据用户的各种行为特征将用户群体划分成若干类,以便于针对用户群的特征进行精准式、个性化的服务。聚类是对用户群体进行划分一种方式。聚类是将数据对象分成类的过程,使同一个类中的本文档来自技高网...
一种大数据挖掘方法

【技术保护点】
一种大数据挖掘方法,其特征在于,所述方法包括:获取用户浏览数据中的商品的数量;根据每个用户浏览数据中的商品的数量对用户进行分类,确定目标用户集合;根据所述目标用户集合中每个用户的单用户特征向量;根据所述单用户特征向量,基于聚类算法对所述目标用户集合进行分级,确定分级用户集合,其中,分级用户集合的数量与预定分级数量相等。

【技术特征摘要】
1.一种大数据挖掘方法,其特征在于,所述方法包括:获取用户浏览数据中的商品的数量;根据每个用户浏览数据中的商品的数量对用户进行分类,确定目标用户集合;根据所述目标用户集合中每个用户的单用户特征向量;根据所述单用户特征向量,基于聚类算法对所述目标用户集合进行分级,确定分级用户集合,其中,分级用户集合的数量与预定分级数量相等。2.根据权利要求1所述的方法,其特征在于,所述根据每个用户浏览数据中的商品的数量对用户进行分类,确定目标用户集合,包括:将每个用户浏览数据中的商品的数量输入到预先训练好的神经网络,对用户分类,确定目标用户集合。3.根据权利要求1所述的方法,其特征在于,所述根据每个用户浏览数据中的商品的数量对用户进行分类,确定目标用户集合,包括:采用聚类的方法对每个用户浏览数据中的商品的数量进行聚类,按照聚类结果对用户分类,确定目标用户集合。4.根据权利要求1所述的方法,其特征在于,所述根据所述单用户特征向量,基于聚类算法对所述目标用户集合进行分级,确定分级用户集合包括:根据每个用户的所述单用户特征...

【专利技术属性】
技术研发人员:徐秋养
申请(专利权)人:佛山市深研信息技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1