本发明专利技术提供一种温度会员标签预测方法、装置、电子设备及存储介质,该方法包括:从大数据平台数据源获取会员标签数据和会员历史消费数据;根据会员标签数据和会员历史消费数据,提取会员历史消费特征及对应的预测标签数据;基于3σ法则对异常特征数据进行清除,并通过embedded方法进行特征选择;构建ligthGBM算法,选取预订比例的清洗后的特征数据作为训练数据对ligthGMB模型进行训练,确定模型参数;通过GridSearch网格调参后,将最优参数代入ligthGBM模型,以基于ligthGBM模型进行会员标签预测。通过该方案解决了现有温度会员标签定义不准确的问题,可以实现对会员标签的准确定义,实时监控预测温度会员消费行为及价值。
【技术实现步骤摘要】
一种温度会员标签预测方法、装置、电子设备及存储介质
本专利技术涉及医药大数据领域,尤其涉及一种温度会员标签预测方法、装置、电子设备及存储介质。
技术介绍
一般药企行业会员的体量都比较大,且流动性强,每天都有成千上万的会员购买其所需药品,会员真实的消费意愿及消费能力时刻在发生变化。对于药企管理者而言,需要某种管理标准监控门店海量会员实时变化的指标,即会员温度,基于会员温度可以实时了解门店会员状况,方便管理者作出准确的运营决策。通过温度会员标签可以方便对客户分类,确定客户价值。目前,关于会员温度标签的定义往往会从商业利润角度直接定义,如客单价或毛利额等直接反应,这种方式定义的温度会员标签仅能反映会员的历史或当前利润价值,而对于将来的会员价值,定义的温度会员标签准确度不高。
技术实现思路
有鉴于此,本专利技术实施例提供了一种温度会员标签预测方法、装置、电子设备及存储介质,以解决的现有温度会员标签定义不准确的问题。在本专利技术实施例的第一方面,提供了一种温度会员标签预测方法,包括:从大数据平台数据源获取会员标签数据和会员历史消费数据;根据会员标签数据和会员历史消费数据,提取会员历史消费特征及对应的预测标签数据;基于3σ法则对异常特征数据进行清除,并通过embedded方法进行特征选择;构建ligthGBM算法,选取预订比例的清洗后的特征数据作为训练数据对ligthGMB模型进行训练,确定模型参数;通过GridSearch网格调参后,将最优参数代入ligthGBM模型,以基于ligthGBM模型进行会员标签预测。在本专利技术实施例的第二方面,提供了一种用于温度会员标签预测的装置,包括:获取模块,用于从大数据平台数据源获取会员标签数据和会员历史消费数据;提取模块,用于根据会员标签数据和会员历史消费数据,提取会员历史消费特征及对应的预测标签数据;清除模块,用于基于3σ法则对异常特征数据进行清除,并通过embedded方法进行特征选择;训练模块,用于构建ligthGBM算法,选取预订比例的清洗后的特征数据作为训练数据对ligthGMB模型进行训练,确定模型参数;调参模块,用于通过GridSearch网格调参后,将最优参数代入ligthGBM模型,以基于ligthGBM模型进行会员标签预测。在本专利技术实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本专利技术实施例第一方面所述方法的步骤。在本专利技术实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本专利技术实施例第一方面提供的所述方法的步骤。本专利技术实施例中,基于会员历史消费数据提取行为特征及历史预测值,对历史特征进行异常点清除及特征选择后,训练ligthGMB模型,并通过GridSearch网格调参,通过最优参数对应的ligthGMB模型对会员标签进行预测,可以实现对温度会员的准确刻画,方便对会员行为进行实时预测,以便通过调整营销策略实现会员价值最大化,从而解决了温度会员标签准确度不高的问题。与传统的以药企平均毛利额等指标反应用户活跃度相比,此方案刻画粒度更加细致精确,定义的标签可直接综合反映客户价值,能够随根据用户实时行为而实时动态调整,达到动态监控会员行为的目的,具有较高的实用价值。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单介绍,显而易见地,下面描述的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获取其他附图。图1为本专利技术的一个实施例提供的温度会员标签预测方法的流程示意图;图2为本专利技术的一个实施例提供的用于温度会员标签预测装置结构示意图。具体实施方式为使得本专利技术的专利技术目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本专利技术一部分实施例,而非全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。本专利技术的说明书或权利要求书及上述附图中的术语“包括”以及其他相近意思表述,意指覆盖不排他的包含,如包含一系列步骤或单元的过程、方法或系统、设备没有限定于已列出的步骤或单元。当前会员温度的定义直接从商业利润角度体现,如以客单价或毛利额等直接反映,此种方式从药企的商业利润销量等角度,不能反应每个会员带来的商业价值,而且会员温度多是基于过去公布的财务报表,不能反映会员将来或实时的动态变化,对于管理者未来的运营决策及方向帮助有限,同时会员标签并没有体现会员的消费行为。因此,对温度会员的定义应当综合会员的历史消费行为,并能实时反映会员价值。请参阅图1,本专利技术实施例提供的一种温度会员标签预测方法的流程示意图,包括:S101、从大数据平台数据源获取会员标签数据和会员历史消费数据;所述大数据平台数据源一般可以是相关医药网站或应用APP等数据平台上,在其服务器中存储的药品销售数据及会员数据。会员购买药物后,平台会录入会员的消费信息,基于海量销售数据的录入存储,可以方便对销售数据进行分析。所述会员标签数据一般包含有会员卡号、积分、最后消费时间、会员消费等级等,还可以包括会员个人信息,如姓名、性别、年龄、职业、出生地、居住地、家庭成员和工作单位等。所述会员历史消费数据可以为当前时间之前一段时间的会员消费数据,如一个月、六个月、一年等,在此不作限定。所述会员历史消费数据中可以包括消费时间、金额、药物名称、等级、地点等,基于会员历史消费行为特征可以分析预测会员消费行为,进而对会员价值进行评估S102、根据会员标签数据和会员历史消费数据,提取会员历史消费特征及对应的预测标签数据;其中,所述预测标签数据一般指的是会员的价值标签,可以为具体的计算数值,用以衡量温度会员价值。在一个实施例中,将会员历史消费数据进行划分为第一分段历史消费数据和第二分段历史消费数据;通过Spark集群对第一分段历史消费数据进行统计分析,获取会员历史消费行为特征,生成多维用户标签数据。可以理解的是,第一分段历史消费数据用于提取用户消费行为特征,第二分段历史消费数据用于提取会员的价值标签,根据第一分段、第二分段历史消费数据对模型训练,可以通过模型进行会员价值标签预测。示例性的,以12个月的历史消费数据为例,利用Spark集群分析前1-11个月,统计特征会按照会员进行聚合统计,包括:最后一次消费距离现在时间、用户消费的总频次、用户平均每次消费的金额,以及按照时间区别,分本文档来自技高网...
【技术保护点】
1.一种温度会员标签预测方法,其特征在于,包括:/n从大数据平台数据源获取会员标签数据和会员历史消费数据;/n根据会员标签数据和会员历史消费数据,提取会员历史消费特征及对应的预测标签数据;/n基于3σ法则对异常特征数据进行清除,并通过embedded方法进行特征选择;/n构建ligthGBM算法,选取预订比例的清洗后的特征数据作为训练数据对ligthGMB模型进行训练,确定模型参数;/n通过GridSearch网格调参后,将最优参数代入ligthGBM模型,以基于ligthGBM模型进行会员标签预测。/n
【技术特征摘要】
1.一种温度会员标签预测方法,其特征在于,包括:
从大数据平台数据源获取会员标签数据和会员历史消费数据;
根据会员标签数据和会员历史消费数据,提取会员历史消费特征及对应的预测标签数据;
基于3σ法则对异常特征数据进行清除,并通过embedded方法进行特征选择;
构建ligthGBM算法,选取预订比例的清洗后的特征数据作为训练数据对ligthGMB模型进行训练,确定模型参数;
通过GridSearch网格调参后,将最优参数代入ligthGBM模型,以基于ligthGBM模型进行会员标签预测。
2.根据权利要求1所述的方法,其特征在于,所述根据会员标签数据和会员历史消费数据,提取会员历史消费特征及对应的预测标签数据包括:
将会员历史消费数据进行划分为第一分段历史消费数据和第二分段历史消费数据;
通过Spark集群对第一分段历史消费数据进行统计分析,获取会员历史消费行为特征,生成多维用户标签数据。
3.根据权利要求1所述的方法,其特征在于,所述根据会员标签数据和会员历史消费数据,提取会员历史消费特征及对应的预测标签数据还包括:
通过word2vec对用户购药习惯进行特征抽取,按照会员购药的时间维度对购药商品进行聚合。
4.根据权利要求2所述的方法,其特征在于,所述将会员历史消费数据进行划分为第一分段历史消费数据和第二分段历史消费数据还包括:
计算第二分段用户历史消费数据对应的客单价、消费总额、消费次数、毛利润;
将客单价、消费总额、消费次数、毛利润作为特征因子,按照时间衰减因子对所述特征因子进行加权求取标签值,所述标签值为会员标签预测结果,用于衡量会员价值。
5.根据权利要求1所述的方法,其特征在于,所述通过GridSearch网格调参包括:
以AUC为模型评价指标,采用k折交叉验证计算ligthGBM模型的最优参数;
降低ligthGB...
【专利技术属性】
技术研发人员:黎云,袁冲,余军,沈章,吕静,
申请(专利权)人:武汉海云健康科技股份有限公司,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。