数据挖掘方法及装置制造方法及图纸

技术编号:13927936 阅读:65 留言:0更新日期:2016-10-28 10:50
本发明专利技术公开了一种数据挖掘方法和装置,涉及大数据领域。其中的方法包括:确定用户品牌粘度的多项影响因素;通过因子分析确定所述多项影响因素的因子载荷矩阵;根据所述因子载荷矩阵以及所述多项影响因素确定每个公共因子对用户品牌粘度的影响力;将各个公共因子对用户品牌粘度的影响力进行加权求和确定出用户品牌粘度。从而降低大数据分析的复杂度,能够更加高效地分析用户品牌粘度。

【技术实现步骤摘要】

本专利技术涉及大数据领域,特别涉及一种数据挖掘方法及装置
技术介绍
品牌粘度是指消费者在购买决策中,多次表现出来对某个品牌有偏向性的而非随意的行为反应。品牌粘度的形成不完全是依赖于产品的品质、知名度、品牌联想及传播,还与消费者本身的特性,例如消费者的产品使用经历,密切相关。提高品牌的粘度,对于电子商务企业的生存与发展有着非常重要的意义,品牌粘度对于企业的价值还体现在扩大市场份额,降低营销成本,增加利润,吸引新顾客,提高销售渠道拓展能力以及提高竞争门槛等方面。现有技术通常利用用户对品牌重复购买、价格敏感等因素进行品牌粘度的度量。当采用数量较多的因素进行衡量时,分析复杂度较高。
技术实现思路
本专利技术的一个目的是提出一种数据挖掘方案,降低多因素业务数据分析的复杂度。根据本专利技术实施例的一个方面,提供了一种数据推送方法,包括:确定用户品牌粘度的多项影响因素;通过因子分析确定多项影响因素的因子载荷矩阵;根据因子载荷矩阵以及多项影响因素确定每个公共因子对用户品牌粘度的影响力;将各个公共因子对用户品牌粘度的影响力进行加权求和确定出用户品牌粘度。在一些实施例中,通过因子分析确定多项影响因素的因子载荷矩阵包括:根据模型X=A*F以及X的输入数据,采用回归方法确定出A;其中,X表示多项影响因素组成的p行1列的矩阵,p为多项影响因素的项数;A表示p行m列的因子载荷矩阵,m为公共因子的数量;F表示公共因子组成的m行1列的矩阵。在一些实施例中,每个公共因子对用户品牌粘度的影响力的权重根据该公共因子在所有公共因子中的方差贡献度占比确定。在一些实施例中,公共因子的数量根据各个公共因子在所有公共因子中的方差贡献度占比累计值满足设定阈值时的数量确定,其中,各个公共因子按照方差贡献度占比降序排列。在一些实施例中,第j个公共因子的方差贡献度为因子载荷矩阵第j列数据的平方和,其中j表示1至m的自然数,m为所述公共因子的数量。在一些实施例中,根据因子载荷矩阵以及多项影响因素确定每个公共因子对用户品牌粘度的影响力包括:根据因子载荷矩阵的第j列数据分别与每个影响因素输入数据均值的乘积确定第j个公共因子对用户品牌粘度的影响力,其中j表示1至m的自然数,m为公共因子的数量。在一些实施例中,数据挖掘方法还包括:根据用户品牌粘度的最大值和最小值对各个用户品牌粘度进行标准化处理。在一些实施例中,用户品牌粘度的影响因素包括用户行为类别因素和用户情感类别因素中的至少一种;用户行为类别因素包括:购买品牌数量、累计购买次数、累计购买金额、重复购买品牌数量、重复购买次数、重复购买金额、使用品牌时长、用户从注册至第一次购买的时长、品牌迁移概率、优惠订单量、优惠订单金额、推荐品牌次数、推荐品牌销量中的至少一种;用户情感类别因素包括:用户好评率、用户投诉率、用户退货率、用户拒收率中的至少一种。根据本专利技术实施例的另一个方面,提供了一种数据挖掘装置,包括:影响因素确定模块,用于确定用户品牌粘度的多项影响因素;因子分析模块,用于通过因子分析确定多项影响因素的因子载荷矩阵;因子影响力确定模块,用于根据因子载荷矩阵以及多项影响因素确定每个公共因子对用户品牌粘度的影响力;用户品牌粘度确定模块,用于将各个公共因子对用户品牌粘度的影响力进行加权求和确定出用户品牌粘度。在一些实施例中,因子分析模块包括:数据输入单元,用于输入数据X;回归计算单元,用于根据模型X=A*F以及数据输入单元输入的数据X,通过回归计算确定A;其中,X表示多项影响因素组成的p行1列的矩阵,p为多项影响因素的项数;A表示p行m列的因子载荷矩阵,m为公共因子的数量;F表示公共因子组成的m行1列的矩阵。在一些实施例中,因子影响力确定模块包括:公共因子权重确定单元,用于根据每个公共因子在所有公共因子中的方差贡献度占比确定每个公共因子对用户品牌粘度的影响力的权重。在一些实施例中,因子影响力确定模块还包括:公共因子数量确定单元,用于根据各个公共因子在所有公共因子中的方差贡献度占比累计值满足设定阈值时的数量确定公共因子的数量,其中,各个公共因子按照方差贡献度占比降序排列。在一些实施例中,第j个公共因子的方差贡献度为因子载荷矩阵第j列数据的平方和,其中j表示1至m的自然数,m为所述公共因子的数量。在一些实施例中,因子影响力确定模块还包括:因子影响力确定单元,用于根据因子载荷矩阵的第j列数据分别与每个影响因素输入数据均值的乘积确定第j个公共因子对用户品牌粘度的影响力,其中j表示1至m的自然数,m为公共因子的数量。在一些实施例中,数据挖掘装置还包括:标准化模块,用于根据用户品牌粘度的最大值和最小值对各个用户品牌粘度进行标准化处理。在一些实施例中,用户品牌粘度的影响因素包括用户行为类别因素和用户情感类别因素中的至少一种;用户行为类别因素包括:购买品牌数量、累计购买次数、累计购买金额、重复购买品牌数量、重复购买次数、重复购买金额、使用品牌时长、用户从注册至第一次购买的时长、品牌迁移概率、优惠订单量、优惠订单金额、推荐品牌次数、推荐品牌销量中的至少一种;用户情感类别因素包括:用户好评率、用户投诉率、用户退货率、用户拒收率中的至少一种。根据本专利技术实施例的又一个方面,提供了一种数据挖掘装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器中的指令,执行上述的数据挖掘方法。本专利技术通过因子分析确定用户品牌粘度的多项影响因素的因子载荷矩阵,并根据因子载荷矩阵以及多项影响因素确定每个公共因子对用户品牌粘度的影响力,从而将各个公共因子对用户品牌粘度的影响力进行加权求和确定出用户品牌粘度,进而降低了大数据分析的复杂度,能够更加高效地分析用户品牌粘度。通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1示出本专利技术数据挖掘方法的一个实施例的流程示意图。图2示出本专利技术数据挖掘装置的一个实施例的结构示意图。图3示出本专利技术因子分析模块的一个实施例的结构示意图。图4示出本专利技术影响力确定模块的一个实施例的结构示意图。图5示出本专利技术数据挖掘装置的另一个实施例的结构示意图。图6示出本专利技术数据挖掘装置的又一个实施例的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1示出本专利技术数据挖掘方法的一个实施例的流程示意图。本实施例能够降低大数据分析的复杂度。如图1所示,该实施例的数据挖掘方法包括:步骤S102,确定用户品牌粘度的多项影响因素。基于电子商务业务特点,可以针对用户和品牌间购买特征,确定影响用户品牌忠诚度的影响因素指标。本文档来自技高网...

【技术保护点】
一种数据挖掘方法,其特征在于,包括:确定用户品牌粘度的多项影响因素;通过因子分析确定所述多项影响因素的因子载荷矩阵;根据所述因子载荷矩阵以及所述多项影响因素确定每个公共因子对用户品牌粘度的影响力;将各个公共因子对用户品牌粘度的影响力进行加权求和确定出用户品牌粘度。

【技术特征摘要】
1.一种数据挖掘方法,其特征在于,包括:确定用户品牌粘度的多项影响因素;通过因子分析确定所述多项影响因素的因子载荷矩阵;根据所述因子载荷矩阵以及所述多项影响因素确定每个公共因子对用户品牌粘度的影响力;将各个公共因子对用户品牌粘度的影响力进行加权求和确定出用户品牌粘度。2.根据权利要求1所述的方法,其特征在于,所述通过因子分析确定所述多项影响因素的因子载荷矩阵包括:根据模型X=A*F以及X的输入数据,采用回归方法确定出A;其中,X表示所述多项影响因素组成的p行1列的矩阵,p为所述多项影响因素的项数;A表示p行m列的因子载荷矩阵,m为所述公共因子的数量;F表示公共因子组成的m行1列的矩阵。3.根据权利要求1所述的方法,其特征在于,其中,每个公共因子对用户品牌粘度的影响力的权重根据该公共因子在所有公共因子中的方差贡献度占比确定。4.根据权利要求1所述的方法,其特征在于,其中,公共因子的数量根据各个公共因子在所有公共因子中的方差贡献度占比累计值满足设定阈值时的数量确定,其中,各个公共因子按照方差贡献度占比降序排列。5.根据权利要求3或4所述的方法,其特征在于,其中,第j个公共因子的方差贡献度为因子载荷矩阵第j列数据的平方和,其中j表示1至m的自然数,m为所述公共因子的数量。6.根据权利要求1所述的方法,其特征在于,所述根据所述因子载荷矩阵以及所述多项影响因素确定每个公共因子对用户品牌粘度的影响力包括:根据所述因子载荷矩阵的第j列数据分别与每个影响因素输入数据均值的乘积确定第j个公共因子对用户品牌粘度的影响力,其中j表示1至m的自然数,m为所述公共因子的数量。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据用户品牌粘度的最大值和最小值对各个用户品牌粘度进行标准化处理。8.根据权利要求1所述的方法,其特征在于,所述用户品牌粘度的影响因素包括用户行为类别因素和用户情感类别因素中的至少一种;所述用户行为类别因素包括:购买品牌数量、累计购买次数、累计购买金额、重复购买品牌数量、重复购买次数、重复购买金额、使用品牌时长、用户从注册至第一次购买的时长、品牌迁移概率、优惠订单量、优惠订单金额、推荐品牌次数、推荐品牌销量中的至少一种;所述用户情感类别因素包括:用户好评率、用户投诉率、用户退货率、用户拒收率中的至少一种。9.一种数据挖掘装置,其特征在于,包括:影响因素确定模块,用于确定用户品牌粘度的多项影响因素;因子分析模块,用于通过因子分析确定所述多项影响因素的因子载荷矩阵;因子影响力确定模块,用于根据所述因子...

【专利技术属性】
技术研发人员:刘朋飞王晓葛胜利李爱华
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1