用于航空客户数据的数据分析方法、装置和存储介质制造方法及图纸

技术编号:39332989 阅读:22 留言:0更新日期:2023-11-12 16:08
本公开涉及一种用于航空客户数据的数据分析方法、装置和存储介质。数据分析方法包括:从航空客户数据库中提取待分析客户的消费数据,消费数据的维度包括客户编号ID、里程数m、最近一次飞行记录R、飞行次数F和消费总额M;对消费数据进行预处理;基于预处理的消费数据生成多维度向量[m,R,F,M],从而形成消费数据的向量集;使用聚类算法将该向量集划分为预定数量k的类别,获得待分析客户的分类结果以及各类别所对应的数据特征。类别所对应的数据特征。类别所对应的数据特征。

【技术实现步骤摘要】
用于航空客户数据的数据分析方法、装置和存储介质


[0001]本公开涉及用于航空客户数据的数据分析方法、系统和存储介质,并且具体地,涉及基于航空客户的消费数据进行聚类和分析的方法、系统和存储介质。

技术介绍

[0002]随着航空领域的不断发展,围绕航空客户的消费数据等建立的营销分析平台(Customer Data Platform,简称CDP)作用日益凸显。面对数量巨大、行为模式各异的客户群体,合理评估客户价值并以此为基础完成客户细分,分析各类别客户维护方式或流失趋势,从而提供差异化的营销和服务策略,是航空公司实现客户资源利益最大化、增强客户粘性的重要途径。
[0003]当前基于消费数据的客户分类方法中,较为广泛应用的是RFM模型,即针对最近一次消费(Recency)、消费频率(Frequency)、消费金额(Monetary)的分析模型。作为衡量客户价值和客户创造利益能力的重要工具,RFM模型与包括k均值(k

means)聚类算法模型在内的数据分析算法相结合,能够得到基于客户消费行为的精细化分类结果。具体到航空领域,RFM模型的分析对象主要集中在客户的最近一次飞行记录、飞行次数和消费金额。然而在航空业场景下直接应用传统RFM模型存在一定的局限性,考虑到民航消费产品的特有属性,诸如存在大量飞行次数极少的单个数据样本,以及习惯两舱的客户与常飞长线的客户之间不易区分的相似数据样本,会影响聚类结果的准确度,进而导致对客群特征的分析出现偏差。

技术实现思路

[0004]本申请提出了一种用于航空客户数据的数据分析方法、系统和存储介质。
[0005]根据本公开的实施例的第一方面,提供了一种用于航空客户数据的数据分析方法,包括:从航空客户数据库中提取待分析客户的消费数据,消费数据的维度包括客户编号ID、里程数m、最近一次飞行记录R、飞行次数F和消费总额M;对消费数据进行预处理;基于预处理的消费数据生成多维度向量[m,R,F,M],从而形成消费数据的向量集;使用聚类算法将该向量集划分为预定数量k的类别,获得待分析客户的分类结果以及各类别所对应的数据特征。
[0006]根据本公开的实施例的第二方面,提供了一种从航空客户数据库中提取待分析客户的消费数据,消费数据的维度包括客户编号ID、里程数m、最近一次飞行记录R、飞行次数F和消费总额M;对消费数据进行预处理,其中,对消费数据进行标准化处理得到标准化的里程数m
s
、最近一次飞行记录R
s
、飞行次数F
s
和消费总额M
s
;基于预处理的消费数据生成多维度向量[m
s
,R
s
,F
s
,M
s
],从而形成消费数据的标准化向量集;使用聚类算法将该标准化向量集划分为预定数量k的类别,获得待分析客户的分类结果以及各类别所对应的数据特征。
[0007]根据本公开的实施例的第三方面,提供了一种用于航空客户数据的数据分析装置,包括:存储器,其上存储有指令;以及处理器,被配置为执行存储在存储器上的指令,以执行以下处理:从航空客户数据库中提取待分析客户的消费数据,消费数据的维度包括客
户编号ID、里程数m、最近一次飞行记录R、飞行次数F和消费总额M;对消费数据进行预处理;基于预处理的消费数据生成多维度向量[m,R,F,M],从而形成消费数据的向量集;使用聚类算法将向量集划分为预定数量k的类别,获得待分析客户的分类结果以及各类别所对应的数据特征。
[0008]根据本公开的实施例的第四方面,提供了一种用于航空客户数据的数据分析装置,包括:存储器,其上存储有指令;以及处理器,被配置为执行存储在存储器上的指令,以执行以下处理:从航空客户数据库中提取待分析客户的消费数据,消费数据的维度包括客户编号ID、里程数m、最近一次飞行记录R、飞行次数F和消费总额M;对消费数据进行预处理,其中,对消费数据进行标准化处理得到标准化的里程数m
s
、最近一次飞行记录R
s
、飞行次数F
s
和消费总额M
s
;基于预处理的消费数据生成多维度向量[m
s
,R
s
,F
s
,M
s
],从而形成消费数据的标准化向量集;使用聚类算法将该标准化向量集划分为预定数量k的类别,获得待分析客户的分类结果以及各类别所对应的数据特征。
[0009]根据本公开的实施例的第五方面,提供了一种其上存储有程序指令的计算机可读存储介质,该程序指令在执行时使计算机实现根据本公开的实施例的第一方面或第二方面所述的数据分析方法。
[0010]根据本公开的实施例的第六方面,提供了一种计算机程序产品,包括计算机程序指令,该计算机程序指令被处理器执行时实现根据本公开的实施例的第一方面或第二方面所述的数据分析方法。
[0011]根据本公开的实施例的优点在于基于民航消费产品的特有属性对传统RFM模型进行修改,为聚类算法提供针对行业优化的数据样本集合,从而获得更具参考价值的分类结果,以便后续进行营销分析。
[0012]根据本公开的实施例的另一优点在于对航空客户的消费数据进行预处理,排除客户数据样本中的孤立点或噪音点;同时,基于消费数据在多周期间的变化趋势验证修改的RFM模型的聚类准确度,为模型的各维度设置权重并调整权重关系,以进一步提升聚类的准确度。
[0013]应当认识到,上述优点不需全部集中在一个或一些特定实施例中实现,而是可以部分分散在根据本公开的不同实施例中。根据本公开的实施例可以具有上述优点中的一个或一些,也可以替代地或者附加地具有其它的优点。
[0014]通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得更为清楚。
附图说明
[0015]图1是示出了根据本公开的实施例的用于航空客户数据的数据分析系统的示意图。
[0016]图2是示出了根据本公开的实施例的用于航空客户数据的数据分析装置的示例性配置框图。
[0017]图3是示出了根据本公开的实施例的用于航空客户数据的数据分析方法的示例性流程图。
[0018]图4是示出了根据本公开的另一实施例的用于航空客户数据的数据分析装置的示
例性配置框图。
[0019]图5是示出了根据本公开的另一实施例的用于航空客户数据的数据分析方法的示例性流程图。
[0020]图6示出了可以实现根据本公开的实施例的计算设备的示例性配置。
具体实施方式
[0021]下面将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
[0022]以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。也就是说,本文中的结构及方法是以示例性本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于航空客户数据的数据分析方法,包括:从航空客户数据库中提取待分析客户的消费数据,消费数据的维度包括客户编号ID、里程数m、最近一次飞行记录R、飞行次数F和消费总额M;对消费数据进行预处理;基于预处理的消费数据生成多维度向量[m,R,F,M],从而形成消费数据的向量集;使用聚类算法将所述向量集划分为预定数量k的类别,获得待分析客户的分类结果以及各类别所对应的数据特征。2.根据权利要求1所述的数据分析方法,还包括:基于消费数据的维度设置阈值条件,将消费数据满足阈值条件的客户确定为待分析客户。3.根据权利要求1所述的数据分析方法,其中:对消费数据的预处理包括对缺失信息的数据进行忽略处理,对冲突信息的数据进行唯一化处理,以及对数据瑕疵进行排除。4.根据权利要求1所述的数据分析方法,其中,对所述向量集进行分类的聚类算法包括以下步骤:(1)随机选择预定数量k的向量样本作为k个向量簇的初始均值向量作为所述k个向量簇的当前均值向量;(2)计算所述向量集中的每个向量与所述k个向量簇的当前均值向量的距离,并且将该向量划分到与该向量距离最小的当前均值向量所对应的向量簇;(3)划分完成后更新k个向量簇的当前均值向量;(4)重复执行步骤(2)和(3),直到步骤(3)中得到的当前均值向量不再改变或者对步骤(2)和(3)的重复次数达到预设迭代值为止。5.根据权利要求1所述的数据分析方法,其中:从航空数据库中提取第一周期的消费数据用于生成多维度向量[m,R,F,M],获得待分析客户的第一分类结果;以及从航空数据库中提取第二周期的消费数据,使用第二周期的消费数据相对于第一周期的消费数据的变化情况来验证第一分类结果的准确度。6.根据权利要求1所述的数据分析方法,其中:当预定数量k为5时,将待分析客户的消费数据划分为常飞人群、高消费人群、可发展人群、将流失人群以及流失人群的类别。7.一种用于航空客户数据的数据分析方法,包括:从航空客户数据库中提取待分析客户的消费数据,消费数据的维度包括客户编号ID、里程数m、最近一次飞行记录R、飞行次数F和消费总额M;对消费数据进行预处理,其中,对消费数据进行标准化处理得到标准化的里程数m
s
、最近一次飞行记录R
s
、飞行次数F
s
和消费总额M
s
;基于预处理的消费数据生成多维度向量[m
s
,R
s
,F
s
,M
s
],从而形成消费数据的标准化向量集;使用聚类算法将所述标准化向量集划分为预定数量k的类别,获得待分析客户的分类结果以及各类别所对应的数据特征。
8.根据权利要求7所述的数据分析方法,其中:从航空数据库中提取第一周期的消费数据用于生成多维度向量[m
s
,R
s
,F
s
,M
s
],获得待分析客户的第一分类结果;以及从航空数据库中提取第二周期的消费数据,使用第二周期的消费数据相对于第一周期的消费数据的变化情况来验证第一分类结果的准确度。9.根据权利要求8所述的数据分析方法,其中:为消费数据的各个维度分别设置权重系数μ
m
、μ
R
、μ
F
和μ
M
,将所述权重系数应用到所述聚类算法中,获得加权分类结果;将加权分类结果作为待分析客户的第一分类结果进行验证,调整所述权重系数使得所述准确度满足预设阈值。10.根据权利要求9所述的数据分析方法,其中:基于加权分类结果获取各类别所对应的数据特征。11.一种用于航空客户数据的数据分析装置,...

【专利技术属性】
技术研发人员:戴鋆叶亮徐晓明涂东方陈捷
申请(专利权)人:东航技术应用研发中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1