基于机器学习的汽车客户画像分析方法、系统及存储介质技术方案

技术编号:24687657 阅读:64 留言:0更新日期:2020-06-27 09:08
本发明专利技术公开了一种基于机器学习的汽车客户画像分析方法、系统及存储介质,包括:确定售价与其他数值型特征的对应关系;确定售价与车型的对应关系;将售价与其他数值型特征的对应关系和售价与车型的对应关系进行整合,得到车型、售价与其他数值型特征的对应关系;确定车型与其他字符型特征的对应关系;将车型与其他字符型特征的对应关系和车型、售价与其他数值型特征的对应关系进行整合,得到车型、售价与其他数值型特征、其他字符型特征的对应关系;描绘汽车客户画像,每组对应关系自动成为一个客户群。本发明专利技术通过将车企的客户人群进行分类,能够帮助车企及经销商了解每类人群的特征,进而能够进行精准营销及差异化服务。

Analysis method, system and storage medium of automobile customer portrait based on machine learning

【技术实现步骤摘要】
基于机器学习的汽车客户画像分析方法、系统及存储介质
本专利技术属于汽车用户画像分析方法
,具体涉及一种基于机器学习的汽车客户画像分析方法、系统及存储介质。
技术介绍
汽车企业基于经销商管理系统中存在大量购车客户数据,拥有着许多隐藏在购车客户数据背后的重要信息。目前对汽车客户画像的分析基本还处在较低层次,主要使用的是数据统计的方法,该传统方法能对客户基本情况、消费能力、消费习惯等变量进行单一维度的统计,比如单一地统计出全体客户的年龄段分布、全体客户性别占比、全体客户的家庭收入分布等。但是如果想对客户进行精准营销及差异化服务,此传统画像分析方法则无法实现,这需要对客户进行分群,得到不同人群的性别、年龄等特征,需要进一步挖掘各数据特征之间的联系。因此,如何挖掘各基础数据之间的联系,对客户进行分群,是现有车企在面对大量购车数据时面临的一个问题。
技术实现思路
本专利技术的目的是提供一种基于机器学习的汽车客户画像分析方法、系统及存储介质,将车企的客户人群进行分类,以帮助车企及经销商了解每类人群的特征,进而能进行精准营销及差异化服务。第一方面,本专利技术所述的一种基于机器学习的汽车客户画像分析方法,包括以下步骤:确定售价与其他数值型特征的对应关系;确定售价与车型的对应关系;将售价与其他数值型特征的对应关系和售价与车型的对应关系进行整合,得到车型、售价与其他数值型特征的对应关系;确定车型与其他字符型特征的对应关系;将车型与其他字符型特征的对应关系和车型、售价与其他数值型特征的对应关系进行整合,得到车型、售价与其他数值型特征、其他字符型特征的对应关系;描绘汽车客户画像,每组对应关系自动成为一个客户群。进一步,所述其他数值型特征包括客户年龄、客户家庭收入中的一项或两项。进一步,所述其他字符型特征包括颜色、性别、付款方式、购车用途中的一项或多项。进一步,所述确定售价与其他数值型特征的对应关系包括:获取客户历史购车数据;从所述客户历史购车数据中提取数值型特征;对所述数值型特征进行聚类;得到聚类结果,即售价与其他数值型特征的对应关系。进一步,所述确定售价与车型的对应关系包括:获取客户历史购车数据;统计不同车型的售价均值,并将售价均值作为对应车型的售价,得到售价与车型的对应关系。进一步,所述确定车型与其他字符型特征的对应关系包括:获取客户历史购车数据;从所述客户历史购车数据中提取字符型特征;对所述字符型特征进行关联分析;筛选关联分析结果,即得到车型与其他字符型特征的对应关系。进一步,对所述字符型特征进行关联分析,具体为:先找出满足支持度最小阈值的频繁项集,再从频繁项集中找出满足最小置信度的所有关联规则;其中:所述频繁项集是指满足支持度的最小阈值的所有项集;所述支持度是指在所有项集中{X,Y}出现的可能性,即项集中同时含有X和Y的概率;所述置信度是表示在关联规则的先决条件X发生的条件下,关联结果Y发生的概率,即含有X的项集中,同时含有Y的可能性;进一步,所述筛选关联分析结果是指从关联规则中筛选出含有车型项的关联规则。第二方面,本专利技术所述的一种基于机器学习的汽车客户画像分析系统,包括存储器和处理器,所述存储器内存储有一个或多个计算机可读程序,所述计算机可读程序被一个或多个处理器调用执行时,能实现如本专利技术所述的基于机器学习的汽车客户画像分析方法的步骤。第三方面,本专利技术所述的一种存储介质,其存储有一个或多个计算机可读程序,所述计算机可读程序被一个或多个控制器调用执行时,能实现如本专利技术所述的基于机器学习的汽车客户画像分析方法的步骤。本专利技术具有以下优点:它克服了传统汽车客户画像分析时只对单一维度或特征进行统计分析的不足,而是采用机器学习理论中的关联分析和聚类,将各种维度或特征进行了整合,进而能够对客户进行分类,帮助车企和经销商了解掌握各类主要人群的特征,从而能够进行精准营销和差异化服务。附图说明图1是本实施例中基于机器学习的汽车客户画像分析方法的流程图;图2是本实施例中对客户数据进行聚类的流程图;图3是本实施例中对客户数据进行关联分析的流程图。具体实施方式下面结合附图对本专利技术作进一步说明。如图1所示,一种基于机器学习的汽车客户画像分析方法,包括以下步骤:步骤101,确定售价与其他数值型特征的对应关系。其中,数值型特征是指可以呈现为某个范围内数值的特征,比如年龄就是一个数值型特征,它能够表示像23或45这样的值以及其他合理的数值,数值型特征适合采用机器学习里的聚类算法。本实施例中,所述数值型特征包括售价和其他数值型特征。其他数值特征包括客户年龄、客户家庭收入中的一项或两项。对所述数值型特征进行聚类;本实施例中,聚类结果的数目设定为车型的数目,为便于理解,聚类结果举例如下:假设企业共有4种车型,聚类结果为4类,分别为:售价6万,年龄25岁,家庭收入5万;售价9万,年龄30岁,家庭收入10万;售价12万,年龄35岁,家庭收入15万;售价18万,年龄40岁,家庭收入20万。需求说明的是,聚类时可以先将聚类的结果设定为多于企业实际的车型数目,这样会出现这样一个情况:有些聚类结果的类别数量很少,可以删掉或者按售价归并到其他的类别,只保留数量多的类别,然后依次减少聚类数目,最后的聚类结果数目建议逐步迭代到与企业实际车型数目一致。步骤102,确定售价与车型的对应关系。所述确定售价与车型的对应关系,本实施例中,方法是直接统计不同车型的售价均值,同一车型的售价由于经销商折扣等多方面原因可能不完全一样,但是误差也不会很大,这种情况取售价的均值作为该款车型的售价。承接上例,确定售价与车型的对应关系的结果如下:售价6.1万,车型1;售价9.5万,车型2;售价12.4万,车型3;售价16.9万,车型4。步骤103,将售价与其他数值型特征的对应关系和售价与车型的对应关系进行整合,得到车型、售价与其他数值型特征的对应关系。本实施例中,以售价为中间桥梁,将步骤101和步骤102两步的结果整合,得到车型、售价与其他数值型特征的对应关系。所述以售价为中间特征,需要说明的是,步骤102中的售价与步骤101中的聚类结果对应的售价不可能完全一致,相应的会有误差,比如步骤102中售价最低的为6.1万,步骤101中售价最低的为6万,此时认为这俩是同一个车型。承接上例,该步结果如下:车型1,售价6万,年龄25岁,家庭收入5万;车型2,售价9万,年龄30岁,家庭收入10万;车型3,售价12万,年龄35岁,家庭收入15万;车型4,售价18万,年龄40岁,家庭收入20万。步骤104,确定车型与其他字符型特征的对应关系。所述字符型特征是指用字符表示的特征,比如性别就是一个字本文档来自技高网...

【技术保护点】
1.一种基于机器学习的汽车客户画像分析方法,其特征在于:/n确定售价与其他数值型特征的对应关系;/n确定售价与车型的对应关系;/n将售价与其他数值型特征的对应关系和售价与车型的对应关系进行整合,得到车型、售价与其他数值型特征的对应关系;/n确定车型与其他字符型特征的对应关系;/n将车型与其他字符型特征的对应关系和车型、售价与其他数值型特征的对应关系进行整合,得到车型、售价与其他数值型特征、其他字符型特征的对应关系;/n描绘汽车客户画像,每组对应关系自动成为一个客户群。/n

【技术特征摘要】
1.一种基于机器学习的汽车客户画像分析方法,其特征在于:
确定售价与其他数值型特征的对应关系;
确定售价与车型的对应关系;
将售价与其他数值型特征的对应关系和售价与车型的对应关系进行整合,得到车型、售价与其他数值型特征的对应关系;
确定车型与其他字符型特征的对应关系;
将车型与其他字符型特征的对应关系和车型、售价与其他数值型特征的对应关系进行整合,得到车型、售价与其他数值型特征、其他字符型特征的对应关系;
描绘汽车客户画像,每组对应关系自动成为一个客户群。


2.根据权利要求1所述的基于机器学习的汽车客户画像分析方法,其特征在于:所述其他数值型特征包括客户年龄、客户家庭收入中的一项或两项。


3.根据权利要求1或2所述的基于机器学习的汽车客户画像分析方法,其特征在于:所述其他字符型特征包括颜色、性别、付款方式、购车用途中的一项或多项。


4.根据权利要求3所述的基于机器学习的汽车客户画像分析方法,其特征在于:所述确定售价与其他数值型特征的对应关系包括:
获取客户历史购车数据;
从所述客户历史购车数据中提取数值型特征;
对所述数值型特征进行聚类;
得到聚类结果,即售价与其他数值型特征的对应关系。


5.根据权利要求1或2或4所述的基于机器学习的汽车客户画像分析方法,其特征在于:所述确定售价与车型的对应关系包括:
获取客户历史购车数据;
统计不同车型的售价均值,并将售价均值作为对应车型的售价,得到售价与车型的对应关系。


6.根据权利要...

【专利技术属性】
技术研发人员:王贤军刁冠通贺小栩张敏李宗华翟钧
申请(专利权)人:重庆长安新能源汽车科技有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1