数据挖掘方法以及装置制造方法及图纸

技术编号:14350210 阅读:90 留言:0更新日期:2017-01-04 20:58
本发明专利技术公开了一种数据挖掘方法以及装置,涉及计算机技术领域。本发明专利技术利用访客访问网站的大数据分析访客的行为和价值信息,通过对访问数据进行降维简化,然后再利用降维简化后的数据对访客进行分类,将访问行为相近的访客分为一类,进而对分类后的访客进行分析确定访客的价值,实现了通过访客访问网站的大数据分析访客行为,确定访客价值,进一步的,对访客的访问网站行为进行分析,而不只是对购买商品的用户的购买行为进行分析,能够更全面的分析用户,更准确地确定访客价值。此外,便于网站利用访客价值的分析结果丰富访客的画像数据,调整营销策略,优化个性化推荐机制,提升用户体验。

【技术实现步骤摘要】

本专利技术涉及计算机
,特别涉及一种数据挖掘方法以及装置
技术介绍
近年来,随着互联网技术的发展,网上购物已经成为生活中必不可少的消费方式。每天数以亿计的访客访问电商网站产生海量的访问数据。访客访问电商网站的行为反映了访客的购物心理和购物倾向,进而反映了访客的价值和创利能力。访客的访问行为是衡量访客是否有价值的一项重要因素,也是衡量网站本身用户体验的重要指标。此外,通过对网站访客的行为进行分析,确定访客的价值,便于网站据此调整会员营销策略,优化个性化推荐机制,提升用户体验和转化率等。因此,如何对访客的行为进行分析,确定访客的价值,成为企业越来越关注的信息。
技术实现思路
本专利技术所要解决的一个技术问题是:如何对访客的行为进行分析,确定访客的价值。根据本专利技术的一个方面,提供的一种数据挖掘方法,包括:选取访客访问网站的访问行为相关的多个指标数据;获取访客的各个公因子的因子得分以及权重,公因子是利用因子分析的方法将多个指标数据进行降维得到的;根据各个访客的公因子的因子得分以及权重对访客进行分类;根据分类的结果确定每类访客的价值信息。根据本专利技术的第二个方面,提供的一种数据挖掘装置,包括:指标选取模块,用于选取访客访问网站的访问行为相关的多个指标数据;因子分析模块,用于获取访客的各个公因子的因子得分以及权重,公因子是利用因子分析的方法将多个指标数据进行降维得到的;分类模块,用于根据各个访客的公因子的因子得分以及权重对访客进行分类;访客价值分析模块,用于根据分类的结果确定每类访客的价值信息。根据本专利技术的第三个方面,提供的一种数据挖掘装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器设备中的指令,执行前述任一个实施例中的数据挖掘方法。本专利技术利用访客访问网站的大数据分析访客的行为和价值信息,通过对访问数据进行降维简化,然后再利用降维简化后的数据对访客进行分类,将访问行为相近的访客分为一类,进而对分类后的访客进行分析确定访客的价值,实现了通过访客访问网站的大数据分析访客行为,确定访客价值。进一步的,对访客的访问网站行为进行分析,而不只是对购买商品的用户的购买行为进行分析,能够更全面的分析用户,更准确地确定访客价值。此外,便于网站利用访客价值的分析结果丰富访客的画像数据,调整营销策略,优化个性化推荐机制,提升用户体验。通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出本专利技术的一个实施例的数据挖掘装置的结构示意图。图2示出本专利技术的另一个实施例的数据挖掘装置的结构示意图。图3示出本专利技术的一个实施例的数据挖掘方法的流程示意图。图4示出本专利技术的一个应用例的数据挖掘方法的流程示意图。图5示出本专利技术的一个应用例的对访客进行分类的结果的示意图。图6示出本专利技术的又一个实施例的数据挖掘装置的结构示意图。图7示出本专利技术的再一个实施例的数据挖掘装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。针对如何利用访客访问网站的大数据对访客的行为进行分析,确定访客的价值,提出本方案。本专利技术的实施例中的数据挖掘装置可各由各种计算设备或计算机系统来实现,下面结合图1以及图2进行描述。图1为本专利技术数据挖掘装置的一个实施例的结构图。如图1所示,该实施例的装置10包括:存储器110以及耦接至该存储器110的处理器120,处理器120被配置为基于存储在存储器110中的指令,执行本专利技术中任意一个实施例中的数据挖掘方法。其中,存储器110例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(BootLoader)、数据库以及其他程序等。图2为本专利技术数据挖掘装置的另一个实施例的结构图。如图2所示,该实施例的装置10包括:存储器110以及处理器120,还可以包括输入输出接口230、网络接口240、存储接口250等。这些接口230,240,750以及存储器110和处理器120之间例如可以通过总线260连接。其中,输入输出接口230为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口240为各种联网设备提供连接接口,例如可以连接到数据库服务器或者云端存储服务器等。存储接口250为SD卡、U盘等外置存储设备提供连接接口。以下参考图3至图5描述本法明的识别访客价值信息的方法。图3为本专利技术数据挖掘方法一个实施例的流程图。如图3所示,该实施例的方法包括:步骤S302,选取访客访问网站的访问行为相关的多个指标数据。其中,从访客的网站访问信息中选取访客访问网站的访问行为相关的多个指标数据,网站访问信息包括访客登陆后的访问信息(例如访客登陆后的购买信息)和访客未登陆时的访问信息(例如,访客未登陆时的浏览网页的信息等点击数据流)。其中,访客登陆后的访问信息可以由服务器进行记录和保存,需要时则直接调用。访客未登陆时的访问信息例如通过浏览器cookie技术进行访客标识,当访客再次访问该网站时能够自动识别访客身份,并通过在网页部署JavaScript代码,收集访客访问网站的访问数据。通常获取一段时间内访问数据,能够更全面的反映的访客的行为,此外,可以周期性的,每隔预设时间获取访客访问行为相关的多个指标数据,用于后续访客价值信息的确定,能够及时的反映访客行为及价值的变化。步骤S304,获取访客的各个公因子的因子得分以及权重,其中,公因子可以利用因子分析的方法将多个指标数据进行降维得到的。例如,通过将步骤S302中的多个指标数据输入SPSS(StatisticalProductandServiceSolutions,统计产品与服务解决方案)等因子分析软件,将多个指标数据进行降维获得公因子,并获得各个公因子的因子得分以及权重,后续应用例中将对因子分析的具体方法进行详细介绍。利用因子分析方法可以对访客访问行为相关的多个指标进行降维,能够用尽量少的信息反映访客的访问行为,便于后续对访客进行分类。步骤S306,根据各个访客的公因子的因子得分以及权重对访客进行分类。可以将每个访客的数据作为一个数据点,数据点仅用各个公因子的因子得分等多维数据进行表示,利用聚类分析的方法,对访客进行分类。也可以将每个访客的数据作为一个数据点,数据点用各个公因子的因子得分和权重等多维数据进行表示,利用聚类分析的方法,对访客进行分类。进一步的,可以根据各个公因子的业务含义将公因子划分为正面效应公因子和负面效应公因子;利用正面效应公因子的加权值减去负面效应公因子的加权值得到访客的特征指数,其中,每个公因子本文档来自技高网...
数据挖掘方法以及装置

【技术保护点】
一种数据挖掘方法,其特征在于,包括:选取访客访问网站的访问行为相关的多个指标数据;获取访客的各个公因子的因子得分以及权重,所述公因子是利用因子分析的方法将所述多个指标数据进行降维得到的;根据各个访客的公因子的因子得分以及权重对访客进行分类;根据分类的结果确定每类访客的价值信息。

【技术特征摘要】
1.一种数据挖掘方法,其特征在于,包括:选取访客访问网站的访问行为相关的多个指标数据;获取访客的各个公因子的因子得分以及权重,所述公因子是利用因子分析的方法将所述多个指标数据进行降维得到的;根据各个访客的公因子的因子得分以及权重对访客进行分类;根据分类的结果确定每类访客的价值信息。2.根据权利要求1所述的方法,其特征在于,从访客的网站访问信息中选取访客访问网站的访问行为相关的多个指标数据,所述网站访问信息包括访客登陆后的访问信息和访客未登陆时的访问信息。3.根据权利要求1所述的方法,其特征在于,所述公因子采用以下方法确定:利用因子分析的方法计算指标矩阵对应的因子载荷矩阵,所述指标矩阵包括各个访客的指标数据;利用因子载荷矩阵计算每个因子的方差贡献信息,将方差贡献信息大于预设值的因子确定为公因子。4.根据权利要求3所述的方法,其特征在于,所述访客的各个公因子的因子得分采用以下方法确定:利用因子载荷矩阵计算得到因子得分系数矩阵;利用指标矩阵和因子得分系数矩阵计算得到因子得分矩阵;从因子得分矩阵中确定每个访客的各个公因子的因子得分。5.根据权利要求3所述的方法,其特征在于,所述访客的各个公因子的权重采用以下方法确定:将每个公因子的方差贡献与所有公因子的方差贡献总和的比值确定为该公因子的权重。6.根据权利要求1所述的方法,其特征在于,所述根据各个访客的公因子的因子得分以及权重对访客进行分类包括:根据各个公因子的业务含义将公因子划分为正面效应公因子和负面效应公因子;利用正面效应公因子的加权值减去负面效应公因子的加权值得到访客的特征指数,其中,每个公因子的加权值根据该公因子的因子得分以及权重确定;利用各个访客的各个公因子的因子得分、权重以及特征指数对访客进行分类。7.根据权利要求6所述的方法,其特征在于,所述利用各个访客的各个公因子的因子得分、权重以及特征指数对访客进行分类包括:随机选择多个访客的数据点作为训练数据点,并将各训练数据点随机分为预设数量的类别,每个访客的数据点包括该访客的各个公因子的因子得分、权重以及特征指数;针对除所述训练数据点之外剩余的每个访客的数据点,选出与该剩余的访客的数据点距离最近的预设数量的训练数据点;根据所述预设数量的训练数据点所属的类别确定该剩余的访客的数据点所属的类别。8.一种数据挖掘装置,其特征在于,包括:指标选取模块,用于选取访客访问网站的访问行为相关的多个指标数据;因子分析模块,用于获取访客的各个公因...

【专利技术属性】
技术研发人员:焦文健王海旭李鑫张蕾
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1