本发明专利技术提供了一种汽车行业客户ID识别系统、方法及介质,包括:基础数据处理模块:对客户主机厂的ID数据进行采集、整合和标准化,建立非营销名单库,用于ID信息过滤;ID修复模块:根据机器学习算法对ID数据进行分析,使用正确ID替换错误ID;ID亲密度计算模块:计算子网络中ID之间的亲密度;转移关系链判定模块:根据ID之间的亲密度,对ID配对关系进行更新;可视化展现模块:对子网络中ID关系的人机物分层、对子网络的拓扑结构进行可视化展现,实现子网络数据的查询和ID的识别。本发明专利技术通过采用SIL库对ID数据进行清洗的方式,简化了ID关系网络结构,减少了后续数据处理量级,解决了原先图计算运算效率低的问题。
【技术实现步骤摘要】
汽车行业客户ID识别系统、方法及介质
本专利技术涉及汽车行业数据分析领域
,具体地,涉及一种汽车行业客户ID识别系统、方法及介质。
技术介绍
近年来,伴随互联网特别是移动互联网的发展,客户需求呈现出个性化趋势,汽车行业传统的全覆盖、轰炸式的营销方式已经无法满足客户的需求,主机厂只有提供更加差异化的产品或服务,才能真正打动客户,而这一切的基础是对客户数据的分析和应用。但长期以来,汽车行业数据分析的投入产出低,无法形成稳定的价值输出,其主要问题是:(1)车与人并不是简单的车与车主这种一对一的关系,而是存在购车人、送修人、车主等复杂的多对多的关系网络。(2)由于目前主要的客户数据都是有经销商手工填写而不是机器自动获取,导致很多客户信息是错误的。专利文献CN109446215A(申请号:201811294114.6)公开了一种基于优先级的实时ID拉通引擎方法,主要用于消费行为日志数据的处理,从中抽取ID数据,并建立ID与ID之间的关系,计算ID关系的权重并进行排序,逐级计算ID归属关系,最终实现基于superID的客户ID打通。这也是一种ID识别并打通的方法。但其:1、仅适用于消费日志数据的ID打通,不具备多业务数据间ID打通的功能;2、不具备ID相似度计算,并对错误ID信息修复的功能。专利文献CN110223168A(申请号:201910546944.1)公开了一种基于企业关系图谱的标签传播反欺诈检测方法及系统,主要用于金融信贷领域企业自建黑名单库,并构建构建黑名单关系图谱,预估业务反欺诈概率。这是一种的黑名单库的构建和应用方法,类似SIL名单库,但其不包含客户ID配对关系的判定、相似度计算、以及错误ID信息修复。
技术实现思路
针对现有技术中的缺陷,本专利技术的目的是提供一种汽车行业客户ID识别系统、方法及介质。根据本专利技术提供的汽车行业客户ID识别系统,包括:基础数据处理模块:对客户主机厂的ID数据进行采集、整合和标准化,建立非营销名单库,用于ID信息过滤;ID修复模块:根据机器学习算法对ID数据进行分析,使用正确ID替换错误ID;ID亲密度计算模块:计算子网络中ID之间的亲密度;转移关系链判定模块:根据ID之间的亲密度,对ID配对关系进行更新;可视化展现模块:对子网络中ID关系的人机物分层、对子网络的拓扑结构进行可视化展现,实现子网络数据的查询和ID的识别。优选的,更新ID配对关系时,保留符合预设业务逻辑的ID配对关系,将其他关系通过拆分和整合归入主关系,对缺损的子网络进行ID补全。根据本专利技术提供的汽车行业客户ID识别方法,包括:基础数据处理步骤:对客户主机厂的ID数据进行采集、整合和标准化,建立非营销名单库,用于ID信息过滤;ID修复步骤:根据机器学习算法对ID数据进行分析,使用正确ID替换错误ID;ID亲密度计算步骤:计算子网络中ID之间的亲密度;转移关系链判定步骤:根据ID之间的亲密度,对ID配对关系进行更新;可视化展现步骤:对子网络中ID关系的人机物分层、对子网络的拓扑结构进行可视化展现,实现子网络数据的查询和ID的识别。优选的,所述基础数据处理步骤包括:对客户ID信息进行清洗,清洗规则包括特殊符号去除和合并相同ID;建立非营销名单库,非营销名单库包括手机号码、车架号、车辆牌照号和身份证信息。优选的,所述ID修复步骤包括:在ID信息和ID配对关系中,排除非营销名单库中的客户ID,更新ID信息和ID配对关系;针对身份证、车架号、车辆牌照号的修复,搜索子网络中的错误ID,并找到与之相似度最高的同类正确ID,利用同类正确ID来替换错误ID;针对手机号码的修复,修复方法包括:-找到错误ID,并以同一子网络中,相似度最高的同类正确ID进行替换;-对于同一子网络中,相似度高于一定阈值的手机号码,依据通讯运营商确认的正确手机号码与错号、空号分别组成正负样本,通过机器学习算法对手机号码错误概率进行推算,得到可能性最高的手机号码再进行替换。优选的,所述ID亲密度计算步骤包括:基于ID修复后的ID信息和ID配对关系,设置初始ID亲密度,初始值范围在[0,1]内,初始值越大表示ID配对关系的可信度越大;根据业务数据设置系统置信度,范围在[0,1]内,置信度值越大表示该业务数据的可信度越大;根据初始ID亲密度、系统置信度、ID更新频次和ID新鲜度对ID亲密度进行调整。优选的,所述转移关系链判定步骤包括:ID关系转移,包括:-手机号码与车辆牌照号的ID关系转移至车架号与车辆牌照号;-手机号码与车架号的ID关系转移至身份证与手机号码或者身份证与车架号;ID补全,若身份证与手机号码、身份证与车架号的关系中信息缺失,则构造虚拟客户身份证ID进行补全。优选的,所述可视化展现步骤包括:子网络分层展现步骤,包括:-基于配对关系包括:身份证与手机号码、身份证与车架号、车架号与车辆牌照号,对ID进行人机物三个层次的分层;-通过录入客户ID,对与所录入的客户ID相关的子网络进行人机物分层展现。优选的,所述可视化展现步骤包括:统计数据查询步骤:通过可视化界面的形式展现子网络相关的数量,包括子网络的节点信息、关系信息、节点PR值和节点出入度。根据本专利技术提供的一种存储有计算机程序的计算机可读存储介质,所述计算机程序被处理器执行时实现上述的方法的步骤。与现有技术相比,本专利技术具有如下的有益效果:1、本专利技术通过采用SIL库对ID数据进行清洗的方式,简化了ID关系网络结构,减少了后续数据处理量级,解决了原先图计算运算效率低的问题;2、本专利技术通过制定客户ID数据标准、结合业务规则和机器学习算法,对相似度高的手机号码配对进行分析,解决了判断正确/错误手机号码的问题;3、本专利技术通过采用子网络计算的方式,将全网分割成子网络,基于子网络的运算,降低了运算量,解决了全网计算能力不足的问题。附图说明通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1为系统功能模块关系图;图2为基础数据处理模块流程图;图3为ID修复模块数据流程;图4为ID亲密度计算模块数据流程;图5为转移关系链判定模块数据流程。具体实施方式下面结合具体实施例对本专利技术进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本专利技术,但不以任何形式限制本专利技术。应当指出的是,对本领域的普通技术人员来说,在不脱离本专利技术构思的前提下,还可以做出若干变化和改进。这些都属于本专利技术的保护范围。实施例1:本系统通过打通主机厂多个业务系统数据,对客户ID进行采集、整合和标准化,结合机器学习算法和业务规则,对人车关系进行分类本文档来自技高网...
【技术保护点】
1.一种汽车行业客户ID识别系统,其特征在于,包括:/n基础数据处理模块:对客户主机厂的ID数据进行采集、整合和标准化,建立非营销名单库,用于ID信息过滤;/nID修复模块:根据机器学习算法对ID数据进行分析,使用正确ID替换错误ID;/nID亲密度计算模块:计算子网络中ID之间的亲密度;/n转移关系链判定模块:根据ID之间的亲密度,对ID配对关系进行更新;/n可视化展现模块:对子网络中ID关系的人机物分层、对子网络的拓扑结构进行可视化展现,实现子网络数据的查询和ID的识别。/n
【技术特征摘要】
1.一种汽车行业客户ID识别系统,其特征在于,包括:
基础数据处理模块:对客户主机厂的ID数据进行采集、整合和标准化,建立非营销名单库,用于ID信息过滤;
ID修复模块:根据机器学习算法对ID数据进行分析,使用正确ID替换错误ID;
ID亲密度计算模块:计算子网络中ID之间的亲密度;
转移关系链判定模块:根据ID之间的亲密度,对ID配对关系进行更新;
可视化展现模块:对子网络中ID关系的人机物分层、对子网络的拓扑结构进行可视化展现,实现子网络数据的查询和ID的识别。
2.根据权利要求1所述的汽车行业客户ID识别系统,其特征在于,更新ID配对关系时,保留符合预设业务逻辑的ID配对关系,将其他关系通过拆分和整合归入主关系,对缺损的子网络进行ID补全。
3.一种汽车行业客户ID识别方法,其特征在于,包括:
基础数据处理步骤:对客户主机厂的ID数据进行采集、整合和标准化,建立非营销名单库,用于ID信息过滤;
ID修复步骤:根据机器学习算法对ID数据进行分析,使用正确ID替换错误ID;
ID亲密度计算步骤:计算子网络中ID之间的亲密度;
转移关系链判定步骤:根据ID之间的亲密度,对ID配对关系进行更新;
可视化展现步骤:对子网络中ID关系的人机物分层、对子网络的拓扑结构进行可视化展现,实现子网络数据的查询和ID的识别。
4.根据权利要求3所述的汽车行业客户ID识别方法,其特征在于,所述基础数据处理步骤包括:
对客户ID信息进行清洗,清洗规则包括特殊符号去除和合并相同ID;
建立非营销名单库,非营销名单库包括手机号码、车架号、车辆牌照号和身份证信息。
5.根据权利要求4所述的汽车行业客户ID识别方法,其特征在于,所述ID修复步骤包括:
在ID信息和ID配对关系中,排除非营销名单库中的客户ID,更新ID信息和ID配对关系;
针对身份证、车架号、车辆牌照号的修复,搜索子网络中的错误ID,并找到与之相似度最高的同类正确ID,利用同类正确ID来替换错误ID;
针对手...
【专利技术属性】
技术研发人员:王海,黄蓉蓉,邬凯乐,李红明,张椿琳,
申请(专利权)人:上海数策软件股份有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。