一种民航会员旅客流失的预测方法及装置制造方法及图纸

技术编号:27252178 阅读:22 留言:0更新日期:2021-02-04 12:29
本申请公开了一种民航会员旅客流失的预测方法及装置,获取待测会员旅客当前预设时间段内所产生的行为数据,从行为数据中提取各个特征变量,构建待测样本。将待测样本输入预先构建的预测模型中,得到预测模型的输出结果,预设标签用于指示,样本会员旅客在预设时间段的下一过去时间段内流失或未流失。输出结果指示待测会员旅客的流失概率。基于预测模型预测待测会员旅客的流失概率,无需对待测会员旅客的行为进行分析,效率明显提高。此外,从待测会员旅客的行为数据中提取特征变量,并对特征变量进行数据降维处理,数据降维处理后的特征变量所指示的数值,相较于原有行为数据所指示的字段,更具有科学性和说服力,预测模型的预测结果更加可靠。结果更加可靠。结果更加可靠。

【技术实现步骤摘要】
一种民航会员旅客流失的预测方法及装置


[0001]本申请涉及民航
,尤其涉及一种民航会员旅客流失的预测方法及装置。

技术介绍

[0002]在激烈的市场竞争中,航空公司面临着会员流失、会员旅客不活跃等问题。就航空公司而言,会员流失是指会员旅客在一定时间内不再乘坐该航空公司航班、或者注销会员卡等行为。
[0003]会员旅客流失是一个受技术、市场、季节、文化和监管等诸多因素影响的非线性混沌系统。会员旅客和航空公司之间的关系越长久,给航空公司带来的利益就会越高,反之,会员旅客的流失,就会对航空公司造成巨大损失。为了避免会员旅客流失,需要时刻关注会员旅客的行为,并对其行为进行分析预测。
[0004]现有技术中,对会员旅客的行为进行人工分析预测,需要耗费大量人力物力,效率也较为低下。并且,人工预测的结果大多凭借主观经验所得,缺乏合理性和说服力,准确性较差。

技术实现思路

[0005]本申请提供了一种民航会员旅客流失的预测方法及装置,目的在于提高民航会员旅客的流失预测结果的准确性。
[0006]为了实现上述目的,本申请提供了以下技术方案:
[0007]一种民航会员旅客流失的预测方法,包括:
[0008]获取待测会员旅客当前预设时间段内所产生的行为数据,所述行为数据用于指示所述待测会员旅客的个人信息、航班信息、航班变更信息、以及行为变更信息;
[0009]从所述行为数据中提取各个特征变量,构建待测样本;所述特征变量包括直接特征变量和间接特征变量,所述直接特征变量基于所述个人信息和所述行为变更信息单独提取得到,所述间接特征变量基于所述航班信息和所述航班变更信息联合提取得到;
[0010]将所述待测样本输入预先构建的预测模型中,得到所述预测模型的输出结果;其中,所述预测模型基于样本会员旅客在过去预设时间段内所产生的所述行为数据、所述样本会员旅客的预设标签、以及预设模型训练得到;所述预设标签用于指示,所述样本会员旅客在所述过去预设时间段的下一过去时间段内流失或未流失;所述输出结果用于指示,所述待测会员旅客的流失概率。
[0011]可选的,所述从所述行为数据中提取各个特征变量,构建待测样本,包括:
[0012]从所述行为数据中提取各个特征变量;
[0013]对各个所述特征变量进行数据降维处理;
[0014]集合数据降维处理后的各个所述特征变量,构建所述待测样本。
[0015]可选的,所述对各个所述特征变量进行数据降维处理,包括:
[0016]针对每个所述特征变量,依据所述特征变量所指示的各个特征值,计算得到信息
熵,将所述信息熵作为所述特征变量的离散特征;
[0017]计算各个所述离散特征所包含的证据权重;
[0018]统计各个所述离散特征所包含的所述证据权重的拐点个数;
[0019]针对每个所述离散特征,判断所述拐点个数是否大于预设第一阈值;
[0020]在所述拐点个数大于所述第一预设阈值的情况下,删除所述离散特征;
[0021]在所述拐点个数不大于所述第一预设阈值的情况下,利用所述证据权重充当所述离散特征;
[0022]所述集合数据降维处理后的各个所述特征变量,构建所述待测样本,包括:
[0023]集合各个目标离散特征,构建所述待测样本;其中,所述目标离散特征为,所述拐点个数不大于所述第一预设阈值的所述离散特征。
[0024]可选的,所述集合各个目标离散特征,构建所述待测样本,包括:
[0025]计算两两所述目标离散特征之间的相关性;
[0026]判断两两所述目标离散特征之间的所述相关性是否大于第二预设阈值;
[0027]在两两所述目标离散特征之间的所述相关性大于所述第二预设阈值的情况下,计算两两所述目标离散特征的信息价值;
[0028]比较两两所述目标离散特征的信息价值,并依据比较结果,删除第一目标离散特征,保留第二目标离散特征;其中,所述第一目标离散特征的信息价值,小于所述第二目标离散特征的信息价值;所述第一目标离散特征和所述第二目标离散特征共同组成两两所述目标离散特征,所述第一目标离散特征和所述第二目标离散特征均为各个所述目标离散特征中的任意一个;
[0029]集合所述第二目标离散特征,构建所述待测样本;
[0030]在两两所述目标离散特征之间的所述相关性不大于所述第二预设阈值的情况下,集合两两所述目标离散特征,构建所述待测样本。
[0031]可选的,所述将所述待测样本输入预先构建的预测模型中,得到所述预测模型的输出结果,包括:
[0032]获取所述待测会员旅客的民航会员等级;
[0033]依据所述民航会员等级与所述预测模型之间的预设对应关系,将所述待测样本输入目标预测模型中,得到所述目标预测模型的输出结果;其中,所述目标预测模型为,与所述待测会员旅客的所述民航会员等级对应的所述预测模型;所述预测模型构建过程中所使用的训练样本,来源于对应的所述民航会员等级内的所述样本会员旅客在所述过去预设时间段内所产生的所述行为数据。
[0034]可选的,所述预测模型的构建过程包括:
[0035]从所述样本会员旅客在所述过去预设时间段内所产生的所述行为数据中,提取各个样本特征变量;
[0036]对各个所述样本特征变量进行数据降维处理;
[0037]集合数据降维处理后的各个所述样本特征变量,构建训练样本;
[0038]将所述训练样本输入至所述预设模型,获得所述训练样本的预测结果,并基于所述预测结果和所述样本会员旅客的所述预设标签,利用所述预设模型的损失函数训练调整所述预设模型的参数,得到所述预测模型;其中,所述预测结果用于指示所述样本会员旅客
在所述预设时间段的下一时间段内流失或者未流失。
[0039]可选的,所述预设模型包括预设的基于遗传算法的模型参数组优化模块;
[0040]其中,所述基于遗传算法的模型参数组优化模块用于,利用遗传算法调整所述预设模型的预设超参数;
[0041]利用遗传算法调整所述预设模型的预设超参数包括:
[0042]针对所述预设超参数,建立表现型和映射型的映射关系,并从所述预设模型的训练样本中选取多个离散特征构建初始种群;其中,所述离散特征为对所述特征变量进行数据降维处理后所得到;
[0043]重复执行预设步骤,直至完成预设的迭代次数,输出所述预设超参数的当前取值;
[0044]所述预设步骤包括:
[0045]调用预设的适应度函数,对种群中的每个所述离散特征进行适应度评估,得到每个所述离散特征的适应度值;
[0046]遍历每个所述离散特征,判断所述适应度值是否大于预设阈值;
[0047]若所述适应度值大于所述预设阈值,保留所述离散特征;
[0048]若所述适应度值不大于所述预设阈值,删除所述离散特征;
[0049]依据所述适应度值从高至低的顺序,对保留的各个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种民航会员旅客流失的预测方法,其特征在于,包括:获取待测会员旅客当前预设时间段内所产生的行为数据,所述行为数据用于指示所述待测会员旅客的个人信息、航班信息、航班变更信息、以及行为变更信息;从所述行为数据中提取各个特征变量,构建待测样本;所述特征变量包括直接特征变量和间接特征变量,所述直接特征变量基于所述个人信息和所述行为变更信息单独提取得到,所述间接特征变量基于所述航班信息和所述航班变更信息联合提取得到;将所述待测样本输入预先构建的预测模型中,得到所述预测模型的输出结果;其中,所述预测模型基于样本会员旅客在过去预设时间段内所产生的所述行为数据、所述样本会员旅客的预设标签、以及预设模型训练得到;所述预设标签用于指示,所述样本会员旅客在所述过去预设时间段的下一过去时间段内流失或未流失;所述输出结果用于指示,所述待测会员旅客的流失概率。2.根据权利要求1所述的方法,其特征在于,所述从所述行为数据中提取各个特征变量,构建待测样本,包括:从所述行为数据中提取各个特征变量;对各个所述特征变量进行数据降维处理;集合数据降维处理后的各个所述特征变量,构建所述待测样本。3.根据权利要求2所述的方法,其特征在于,所述对各个所述特征变量进行数据降维处理,包括:针对每个所述特征变量,依据所述特征变量所指示的各个特征值,计算得到信息熵,将所述信息熵作为所述特征变量的离散特征;计算各个所述离散特征所包含的证据权重;统计各个所述离散特征所包含的所述证据权重的拐点个数;针对每个所述离散特征,判断所述拐点个数是否大于预设第一阈值;在所述拐点个数大于所述第一预设阈值的情况下,删除所述离散特征;在所述拐点个数不大于所述第一预设阈值的情况下,利用所述证据权重充当所述离散特征;所述集合数据降维处理后的各个所述特征变量,构建所述待测样本,包括:集合各个目标离散特征,构建所述待测样本;其中,所述目标离散特征为,所述拐点个数不大于所述第一预设阈值的所述离散特征。4.根据权利要求3所述的方法,其特征在于,所述集合各个目标离散特征,构建所述待测样本,包括:计算两两所述目标离散特征之间的相关性;判断两两所述目标离散特征之间的所述相关性是否大于第二预设阈值;在两两所述目标离散特征之间的所述相关性大于所述第二预设阈值的情况下,计算两两所述目标离散特征的信息价值;比较两两所述目标离散特征的信息价值,并依据比较结果,删除第一目标离散特征,保留第二目标离散特征;其中,所述第一目标离散特征的信息价值,小于所述第二目标离散特征的信息价值;所述第一目标离散特征和所述第二目标离散特征共同组成两两所述目标离散特征,所述第一目标离散特征和所述第二目标离散特征均为各个所述目标离散特征中的
任意一个;集合所述第二目标离散特征,构建所述待测样本;在两两所述目标离散特征之间的所述相关性不大于所述第二预设阈值的情况下,集合两两所述目标离散特征,构建所述待测样本。5.根据权利要求1所述的方法,其特征在于,所述将所述待测样本输入预先构建的预测模型中,得到所述预测模型的输出结果,包括:获取所述待测会员旅客的民航会员等级;依据所述民航会员等级与所述预测模型之间的预设对应关系,将所述待测样本输入目标预测模型中,得到所述目标预测模型的输出结果;其中,所述目标预测模型为,与所述待测会员旅客的所述民航会员等级对应的所述预测模型;所述预测模型构建过程中所使用的训练样本,来源...

【专利技术属性】
技术研发人员:吴新宇
申请(专利权)人:沈阳民航东北凯亚有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1