车辆流失预警自动化营销系统技术方案

技术编号:37568082 阅读:9 留言:0更新日期:2023-05-15 07:47
本发明专利技术提供了一种车辆流失预警自动化营销系统,其包括:数据ETL模块,特征工程模块,模型训练预测模块和自动化营销触达模块。所述数据ETL模块用于同步车企大数据集群的数据。特征工程模块用于对数据ETL模块输出的原始数据进行清洗,生成特征宽表,以及对流失等级进行标注。模型训练预测模块使用lightGBM多分类模型进行样本训练和推断。自动化营销触达模块用于按照预设的营销规则向特定车主自动地下发相应权益。本发明专利技术基于车主和车辆画像、车主历史行为活动,该流失预警自动化营销系统能够向定向车主自动下发营销权益,并收集用户反馈,实现了从车企数据同步到营销权益下发的营销全自动化。全自动化。全自动化。

【技术实现步骤摘要】
车辆流失预警自动化营销系统


[0001]本专利技术涉及数字化营销
,融入数据分析及机器学习技术,实现车辆流失预警自动化营销及运营。

技术介绍

[0002]传统车企在售车后一般承诺三年保修期及两次左右的免费保养,意味着在保修期外或免费次数用尽后,车主回站(回4s店保养/维修)需自费。统计发现,随着时间的推移,车主回站的意愿逐步降低进而流失(长期不回站/不再回站)。若能对有流失风险的人群做出精准圈群,提供针对性的营销活动并成功挽回,对主机厂将产生不菲的经济收益,亦能提升车主对品牌的认可度、粘性。传统方法使用规则判断,仅考虑最近一次进站时间这一维度,时间间隔越长则流失程度/概率越大;但在不同城市、不同年龄段、车子本身新旧程度等因素的影响下,车主的回站保养习惯(反映为进站时间间隔)可能会存在一定差异。此时,机器学习模型考虑多因子多维度组合的优势得以体现,能在“最近进站时间距今”这一维的基础上,纳入用户画像、车辆画像、用户行为等因素,让多因子对最终流失等级的判定给予贡献,使结果更加可靠。模型层面,业界有尝试使用logistic regression,但该模型仅考虑特征的线性加和,且输出为流失概率值,表达能力有限。

技术实现思路

[0003]为了克服上述技术缺陷,本专利技术的目的在于提供一种车辆流失预警自动化营销系统,其包括:
[0004]数据ETL模块,所述数据ETL模块用于将车企大数据集群的数据同步至域外的数据仓库中从而提供建模所需的原始数据,所述原始数据包括车辆画像、车主画像和车主历史行为活动
[0005]特征工程模块,特征工程模块用于对数据ETL模块输出的原始数据进行清洗,用于生成包含车辆信息维度、车主信息维度和车主历史行为维度的特征宽表,以及用于依据预设的流失等级规则对有监督学习的多个流失等级进行标注,所述标注作为标签打在车辆信息中的车辆唯一标识上;
[0006]模型训练预测模块,模型训练预测模块使用集成学习方法中的lightGBM多分类模型进行模型训练和预测,并输出预测结果,所述预测结果包括车辆唯一标识及其车主、流失等级和模型预测日期;
[0007]自动化营销触达模块,自动化营销触达模块用于读取模型训练预测模块的预测结果,将其中特定流失等级所对应的车辆唯一标识及其车主作为营销重点关注对象,并按照预设的营销规则向该车主自动下发相应权益。
[0008]进一步地,车辆流失预警自动化营销系统进一步包括线上效果分析模块,线上效果分析模块用于分析在下发权益后的用户回站率,还用于分析长期未使用权益的用户的投诉反馈信息,以调整对应营销策略。
[0009]进一步地,车辆流失预警自动化营销系统进一步包括模型效果分析模块,模型效果分析模块依据信息增益或者节点分裂次数输出特征重要性结果,还用于输出模型的分类报告与正确率。
[0010]进一步地,流失等级规则包括:1级,代表流失概率极低;2级,代表流失概率较低;3级,代表未流失,但有流失风险,需防流失;4级,代表准流失,有向更高程度的流失转化的风险,挽回价值相对高;5级,代表流失概率较高;6级,代表流失概率极高,几乎不可能挽回;其中,3级和4级所对应的车辆唯一标识及其车主为营销重点关注对象。
[0011]进一步地,模型训练预测模块的训练和预测过程包括:
[0012]步骤1:读取特征宽表,保留1级和6级的对应车辆标识和流失等级以作为不包含特征的数据集1,将2级

5级的人群筛出以作为包含特征的数据集2,对样本的离散型特征做“category”转换指定,对数值型特征做“float”转换;
[0013]步骤2:为避免过拟合,按一定比例抽样2级

5级的人群以作为包含特征的数据集3(即抽样数据集2得到数据集3),并将抽样的数据集随机划分为训练集和验证集;
[0014]步骤3:使用lightGBM多分类模型拟合特征,以流失等级作为标签,根据信息增益寻找特征的最佳分裂点,得到样本在多类别上的概率分布,计算交叉熵;加入“early stopping”的机制,当验证集上的损失值不再发生显著变化或者出现上升时,终止模型训练;
[0015]步骤4:训练过程加入交叉验证网格搜索,得到多组模型参数,保存在验证集上表现最佳的一组,并输出指定存储格式的模型文件;
[0016]步骤5:模型预测数据集2与数据集3的差集,得到结果,并与数据集1合并,然后输出流失等级和样本处在各等级的概率。
[0017]采用了上述技术方案后,与现有技术相比,具有以下有益效果:
[0018]本专利技术基于车主和车辆画像、车主历史行为活动的流失预警自动化营销系统,采用能实现多维特征组合的树模型lightGBM,且采用多分类(共6种流失等级)模型训练和预测的方案,周期性(例如每月一次)输出不同的流失等级,再结合自动化营销平台,向定向人群自动下发、触达营销权益,并收集用户反馈,实现了车企数据同步到营销权益下发的营销全自动化。此外,为提升营销的效率,规则划分的等级会与模型判定等级相结合(最大和最小程度的流失人群将由规则圈定);为避免近期已发券用户重复发券等情况,系统将对3个月内已发券的车主进行下次下发权益的剔除。
附图说明
[0019]图1为自动化营销系统的结构模块图;
[0020]图2是自动化营销系统的自动化营销流程示意图;
[0021]图3为流失等级标注规则。
具体实施方式
[0022]以下结合附图与具体实施例进一步阐述本专利技术的优点。本领域技术人员应当理解,下面所具体描述的内容是说明性的而非限制性的,不应以此限制本专利技术的保护范围。
[0023]如图1所示,本实施例的车辆流失预警自动化营销系统包括:数据ETL模块,特征工
程模块,模型训练预测模块,自动化营销触达模块,线上效果分析模块和模型效果分析模块。图1中实线箭头代表的流程可实现完全自动化,虚线箭头表示的流程还需通过人工干预(如数据分析,特征增减等)实现。
[0024]如图2所示,采用上述车辆流失预警自动化营销系统进行车辆流失预警自动化营销的方法包括如下步骤:
[0025]步骤1:数据ETL模块将车企大数据集群的数据同步至域外的数据仓库中,提供建模所需的原始数据。
[0026]所述原始数据包括车辆画像、车主画像和车主历史行为活动等。数据ETL模块还用于对建模前期的数据分布枚举值探查特征筛选,分析营销方案触达后的挽回效果,以及统计多梯度流失等级人群分布。
[0027]该模块的功能是将车企大数据集群的数据,在设计完成既定的表结构后同步至域外的数据仓库/湖中。过程牵涉到原始表的合并、出于通用性考量的字段类型更改、隐私信息脱敏等事项。(车主、车辆等)画像表全量更新,行为事件相关表增量更新,主机厂大数据集群通常为T+1,模块同步数据的工作在此基础上约延迟半日,故数据更新规则为T+2。ETL模块的产出固然提了供建模所需的原始数据,此外还对建模前期的数据分布枚举值探查特征筛选、营销方案本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种车辆流失预警自动化营销系统,其特征在于,包括:数据ETL模块,所述数据ETL模块用于将车企大数据集群的数据同步至域外的数据仓库中从而提供建模所需的原始数据,所述原始数据包括车辆画像、车主画像和车主历史行为活动;特征工程模块,特征工程模块用于对数据ETL模块输出的原始数据进行清洗,用于生成包含车辆信息维度、车主信息维度和车主历史行为维度的特征宽表,以及用于依据预设的流失等级规则对有监督学习的多个流失等级进行标注,所述标注作为标签打在车辆信息中的车辆唯一标识上;模型训练预测模块,模型训练预测模块使用lightGBM多分类模型进行模型训练和推断,并输出推断结果,所述推断结果包括车辆唯一标识及其车主、流失等级和模型计算日期;自动化营销触达模块,自动化营销触达模块首先读取模型训练预测模块的预测结果,将其中特定流失等级所对应的车辆唯一标识及其车主作为营销重点关注对象,并按照预设的营销规则向该车主自动地下发相应权益。2.如权利要求1所述的车辆流失预警自动化营销系统,其特征在于,进一步包括线上效果分析模块,线上效果分析模块用于分析在下发权益后的用户回站率,还用于分析长期未使用权益的用户的投诉反馈信息。3.如权利要求1所述的车辆流失预警自动化营销系统,其特征在于,进一步包括模型效果分析模块,模型效果分析模块用于依据信息增益或者节点分裂次数输出特征重要性结果,还用于输出模型的分类报告与精度。4.如权利要求1所述的车辆流失预警自动化营销系统,其特征在于,流失等级规则包括:1级,代表...

【专利技术属性】
技术研发人员:周振宇杨波吴宇豪都晟华
申请(专利权)人:上海欣兆阳信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1