一种基于迁移联邦学习的客户价值分层方法技术

技术编号:35059674 阅读:11 留言:0更新日期:2022-09-28 11:11
本发明专利技术公开了一种基于迁移联邦学习的客户价值分层方法,包括以下步骤:S1、对客户大数据进行汇总,用于从基础数据平台获取数据,为标签库模块提供基础数据来源,并做预处理;S2、建立大数据汇总共享模块,每个孤立的小基站计算到邻接小基站的加权距离和,负载就可以简化为连接到小基站的用户的数量;S3:构建辅助模型,包括分类标签,得到联邦学习模型;S4、利用联邦学习模型设置数据权重:S5、对数据质量进行检验,对于存在异常值的评价权重值以及评价权重值增长率指标,将异常值设置为该类客户群对应属性的均值、中位数,实现最终分层,能准确评价客户的价值,使最终得到的价值评分能全面展现客户的价值。值。值。

【技术实现步骤摘要】
一种基于迁移联邦学习的客户价值分层方法


[0001]本专利技术涉及客户价值评估处理
,具体为一种基于迁移联邦学习的客户价值分层方法。

技术介绍

[0002]近年来,随着隐私保护的重要性逐渐显现,联邦学习成为一种大量终端设备联合训练深度学习模型同时保证数据不流出本地的流行的机器学习范式。目前,横向联邦学习聚合了终端本地化无需大量数据传输与物联网海量设备的优势,将模型的推断过程由云端下沉至靠近用户的边端,加强数据隐私的同时,避免不稳定网络状态的影响,提高服务的响应时间,成为了一个理想的研究方向。然而,考虑到设备异构的数据分布情况与不稳定的网络连接,提供高准确率、快速收敛的联邦学习计算模式格外重要。
[0003]数据异构是影响联邦学习全局模型收敛最大的挑战。现已有研究者在联邦学习经典算法FedAvg的各个阶段做了改进,如混合联邦学习、设备本地训练、与服务器通信内容、设备模型聚合方式等,其中混合联邦学习是一种新颖的、从数据层面缓和联邦学习中数据异构的方法。混合联邦学习是在联邦学习训练之前,通过共享数据或筛选数据改变数据的分布情况,使得各个设备的数据分布情况变得相同,再混合数据集中式机器学习算法与联邦学习算法进行模型训练。为了保护数据隐私安全与数据传输开销,共享的数据总量一般不超过各个设备数据总量之和的1%。如Hybr基础数据地址

FL协议相比传统联邦学习算法,首先加入了数据选择的步骤,通过对设备数据分布情况进行采样,对有共享意愿的设备选择少量数据进行收集,从而在服务器构建一个各类别完备,数量均衡的数据集,再基于该数据集训练出一个额外的设备模型加入训练。现有技术的缺点在于,只试图减弱设备的数据异构性,而没有从根本上解决数据异构的问题。
[0004]在服务领域,为了给不同客户提供相匹配的服务,往往需要考虑客户的交易消费能力、客户的需求等多方面内容。具体可以根据服务人员主观判断客户的整体价值,并提供相应的服务、资源配置、营销等。但是这种基于人为主观判断的价值显然缺乏客观性,确定的客户价值不能准确反映客户的真实价值。而且,认为判断的客户价值难以量化,不容易统计与记录。

技术实现思路

[0005]本专利技术的目的在于提供一种基于迁移联邦学习的客户价值分层方法,以解决上述
技术介绍
中提出的问题。
[0006]为实现上述目的,本专利技术提供如下技术方案:。
[0007]一种基于迁移联邦学习的客户价值分层方法,包括以下步骤:S1、对客户大数据进行汇总,用于从基础数据平台获取数据,为标签库模块提供基础数据来源,并做预处理;S2、建立大数据汇总共享模块,每个孤立的小基站计算到邻接小基站的加权距离
和,假设所有用户以相同的频率迁移请求内容,负载就可以简化为连接到小基站的用户的数量;S3:构建辅助模型,包括分类标签,形成的标签库与数据汇总模块相连以获取数据,并根据获取数据进行标签的分析、判断,得到联邦学习模型;S4、利用联邦学习模型设置数据权重:设定客户经济基础、客户发展潜力、客户信用价值、客户社会信任度的维度作为准则层,以上述维度指标作为价值分层的评价尺度,再将评价尺度分为多个等级;并按各指标的重要性得到客户评价权重值;S5、对数据质量进行检验,包括:首先,用户基础数据地址的唯一性;其次,将缺失值调整为某个固定值;最后,对于存在异常值的评价权重值以及评价权重值增长率指标,将异常值设置为该类客户群对应属性的均值、中位数,实现最终分层。
[0008]作为优选的,所述步骤S3的标签库模块包含标签管理、客户属性及客户标签三个子模块;标签管理子模块以标签元数据为基础,进行标签查询、分析、评估、推送服务;客户属性子模块组织、存储、管理客户数据,数据包括基础信息、客户行为、接触记录、业务办理;客户标签子模块组织、存储、管理客户标签;客户属性子模块与客户标签模块形成完整的客户全景视图,全方位、多层次、立体化地描述客户,为标签应用提供基础;。
[0009]作为优选的,所述步骤S3的标签库模块建立企业客户价值评价星级模型,企业客户价值评价星级模型以高压客户为目标基础群;对于户龄达到5年的客户,从经济价值、发展潜力、信用价值、社会价值四个维度出发,利用层次分析法构建企业客户价值评价星级模型,并根据得分分布确定等级阈值,输出优质大客户评价等级标签;对于户龄未满5年的客户,基于在数据观察期内指标数据不完整,其需按照当前合同容量进行评级,且在考察期满5年后将按照企业客户价值评价星级模型进行评分输出等级。
[0010]作为优选的,对所述步骤S4中的区间打分:根据历史数据对用户四个维度区间进行赋值,确定变量分箱阈值。
[0011]作为优选的,如果两个指标的重要性在两个评价等级之间,则可以取中间的分值,如果指标i相对于指标j有一个评分值,则指标j相对于指标i的评分制为其倒数。
[0012]作为优选的,根据同一层次的指标两两比较来确定指标的相对重要性,如果认为两个指标的影响重要性相当,则取值为1,前者比后者稍微重要则取值为3,前者比后者稍微不重要,则取值为1/3,同理,如果认为前者比后者比较重要,则取5,十分重要则取7,绝对重要则取9。
[0013]作为优选的,所述步骤S5中,所述用户基础数据地址的唯一性具体指:建模基础数据集中,每个用户为一条观测数据,因此每个基础数据地址变量应该仅出现一次,否则需要核查原因,调整数据;所述缺失值:将缺失值调整为某个固定值,如对于暂时缺失社会价值指标的企业,将其设置为一个固定的基准值;所述异常值:对于存在异常值的评价权重值以及评价权重值增长率指标,将异常值设置为该类客户群对应属性的均值、中位数。
[0014]作为优选的,所述动态迁移在联邦学习的每一轮发生,根据深度神经网络浅层数目决定迁移的初始层数,每过若干轮后,减少一层复制的层数,直至复制的层数为0;所述数据分布情况包括样本类别信息和各类别样本数量。
[0015]作为优选的,所述迁移联邦学习的客户价值分层烦的整个过程以一个共享的初始分类器基础值开始,所述基础值是由宏基站在预热阶段使用自己收集到的统计值训练得到的。
[0016]作为优选的,通过迭代多个本地训练、中心聚合的过程,才能生成最终的全局模型;在每次迭代中,都会为下一次迭代生成一个新的共享分类器。在该方案中,簇头作为FedAvg中的工作节点负责整合所有簇内成员的统计值来训练本地分类器,而位于中心的宏基站则作为参数服务器负责以加权平均的方式聚合所有本地分类器,与现有技术相比,本专利技术的有益效果是:1.本技术方案以高压客户为目标基础群,运用数理统计方法及数据挖掘技术,通过对企业客户基础信息、社会信用信息、社会影响力等数据进行系统性清洗与分析,提炼并衍生出多个影响客户价值的评价指标体系,构建企业客户价值评级模型,根据评级结果并结合实际情况对迁移联邦学习的客户实施个性化管理,提高服务质量;2.本技术方案从实际业务需要出发,重点选择构建客户价值分级体系,解决当前客户分层的关键问题,保证在系统实施后能根据客户等级不同,提供个性化、优质化服务,提高工作本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于迁移联邦学习的客户价值分层方法,其特征在于:包括以下步骤:S1、对客户大数据进行汇总,用于从基础数据平台获取数据,为标签库模块提供基础数据来源,并做预处理;S2、建立大数据汇总共享模块,每个孤立的小基站计算到邻接小基站的加权距离和,假设所有用户以相同的频率迁移请求内容,负载就可以简化为连接到小基站的用户的数量;S3:构建辅助模型,包括分类标签,形成的标签库与数据汇总模块相连以获取数据,并根据获取数据进行标签的分析、判断,得到联邦学习模型;S4、利用联邦学习模型设置数据权重:设定客户经济基础、客户发展潜力、客户信用价值、客户社会信任度的维度作为准则层,以上述维度指标作为价值分层的评价尺度,再将评价尺度分为多个等级;并按各指标的重要性得到客户评价权重值;S5、对数据质量进行检验,包括:首先,用户基础数据地址的唯一性;其次,将缺失值调整为某个固定值;最后,对于存在异常值的评价权重值以及评价权重值增长率指标,将异常值设置为该类客户群对应属性的均值、中位数,实现最终分层。2.根据权利要求1所述的一种基于迁移联邦学习的客户价值分层方法,其特征在于:所述步骤S3的标签库模块包含标签管理、客户属性及客户标签三个子模块;标签管理子模块以标签元数据为基础,进行标签查询、分析、评估、推送服务;客户属性子模块组织、存储、管理客户数据,数据包括基础信息、客户行为、接触记录、业务办理;客户标签子模块组织、存储、管理客户标签;客户属性子模块与客户标签模块形成完整的客户全景视图,全方位、多层次、立体化地描述客户,为标签应用提供基础。3.根据权利要求2所述的一种基于迁移联邦学习的客户价值分层方法,其特征在于:所述步骤S3的标签库模块建立企业客户价值评价星级模型,企业客户价值评价星级模型以高压客户为目标基础群;对于户龄达到5年的客户,从经济价值、发展潜力、信用价值、社会价值四个维度出发,利用层次分析法构建企业客户价值评价星级模型,并根据得分分布确定等级阈值,输出优质大客户评价等级标签;对于户龄未满5年的客户,基于在数据观察期内指标数据不完整,其需按照当前合同容量进行评级,且在考察期满5年后将按照企业客户价值评价星级模型进行评分输出等级。4.根据权利要求1所述的一种基于迁移联邦学习的客户价值分层方法,其特征在于:对所...

【专利技术属性】
技术研发人员:江元元
申请(专利权)人:创络上海数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1