一种客户分群模型的构建方法和计算设备技术

技术编号:18400113 阅读:42 留言:0更新日期:2018-07-08 20:06
本发明专利技术公开了一种客户分群模型的构建方法,适于在计算设备中执行,该方法包括:获取多个用户的属性数据、各用户在目标网站上的预定期间内的历史行为数据、以及目标网站在该预定期间内向各用户发送的短信推荐记录;根据所获取的属性数据和历史行为数据计算各用户的多个特征值,并将各用户的多个特征值构造为一个特征向量;根据所获取到的短信推荐记录和历史行为数据对各用户的购买属性类别进行标记;将各用户的特征向量及其对应的购买属性类别作为一条样本,以构造训练集;以各用户的特征向量为输入、以其购买属性类别为输出,采用预定算法对该训练集进行训练,得到所述客户分群模型。本发明专利技术还公开了对应的计算设备。

Construction method and computing device of a customer clustering model

The present invention discloses a method for constructing a customer grouping model, which is suitable for execution in a computing device, which includes obtaining the attribute data of a plurality of users, the historical behavior data of each user within a predetermined period on the target site, and the recommendation records of short messages sent by the target website to the users within the predetermined period; According to the acquired attribute data and historical behavior data, the multiple eigenvalues of each user are calculated, and the multiple eigenvalues of each user are constructed as a feature vector. The purchase attribute category is used as a sample to construct the training set. The training set is trained by the predetermined algorithm and the model of the customer group is obtained by using the characteristic vector of each user as input and the purchase attribute category as output. The present invention also discloses the corresponding computing equipment.

【技术实现步骤摘要】
一种客户分群模型的构建方法和计算设备
本专利技术涉及互联网
,尤其涉及一种客户分群模型的构建方法和计算设备。
技术介绍
随着互联网技术的快速发展和电子商务的日渐普及,网络信息资源的数量急剧增长,信息提供商总是希望能够为潜在的目标用户推荐感兴趣或者需要的商品资源。而如何从海量用户中准确识别出潜在的目标用户,以更好地为该用户进行针对性地信息推荐,已经成为运营商在互联网业务拓展中的重中之重。现有技术中通常采用短信群发策略,即对所有注册用户都发送相应推荐短信,然而实际生活中很多用户无论是否收到该推荐短信都不会主动购买相应产品,或者即使没有收到该短信也会主动购买产品,无疑使得这种群发策略造成了大量信息资源的浪费。因此,需要提供一种更有效的潜在用户进行预测识别的方法。
技术实现思路
为此,本专利技术提供一种客户分群模型的构建方法和计算设备,以力图解决或至少缓解上面存在的问题。根据本专利技术的一个方面,提供了一种客户分群模型的构建方法,适于在在计算设备中执行,该方法包括:获取多个用户的属性数据、各用户在目标网站上的预定期间内的历史行为数据、以及目标网站在该预定期间内向各用户发送的短信推荐记录;根据所获取的属性数据和历史行为数据计算各用户的多个特征值,并将各用户的多个特征值构造为一个特征向量;根据所获取到的短信推荐记录和历史行为数据对各用户的购买属性类别进行标记,所述购买属性类别包括不发短信即会主动购买、发短信会触发购买、发短信和红包会触发购买、以及怎样都不会购买;将各用户的特征向量及其对应的购买属性类别作为一条样本,以构造训练集;以及以各用户的特征向量为输入、以其购买属性类别为输出,采用预定算法对该训练集进行训练,得到客户分群模型。可选地,在根据本专利技术的客户分群模型的构建方法中,特征值包括交易属性特征值,交易属性特征值包括以下特征值中的一个或多个:每次交易时间、每次下单时间、订单到期时间、每次提现时间、注册时间、历史提现次数、历史交易次数、累计交易金额范围、购买产品所属类别的数量、购买产品所属类别的金额。可选地,在根据本专利技术的客户分群模型的构建方法中,特征值包括用户属性特征值,用户属性特征值包括用户的性别、年龄、省份、城市和设备信息中的一个或多个。可选地,在根据本专利技术的客户分群模型的构建方法中,根据所获取到的短信推荐记录和历史行为数据对各用户的购买属性类别进行标记的步骤包括:在该预定期间内,若未向用户发送推荐短信,用户却产生了交易行为,则将该用户标记为不发短信即会主动购买用户;若未向用户发送推荐短信,用户也未产生交易行为,则将该用户标记为发短信和红包会触发购买用户;若向用户发送推荐短信后,用户产生了交易行为,则将该用户标记为发短信会触发购买用户;以及若向用户发送推荐短信后,用户未产生交易行为,则将该用户标记为怎样都不会购买用户。可选地,在根据本专利技术的客户分群模型的构建方法中,还包括对所获取到的属性数据、历史行为数据和短信推荐记录进行预处理的步骤:去除其中的脏数据、对数据进行归一化处理、对定性数据进行哑编码、填补各数据项中的缺失值、以及对数据进行欠采样和/或过采样的均衡处理。可选地,在根据本专利技术的客户分群模型的构建方法中,预定算法为GBDT回归算法。可选地,在根据本专利技术的客户分群模型的构建方法中,采用预定算法对训练集进行训练的步骤包括:采用不同的GBDT算法参数,分别对训练集进行训练,得到每种算法参数对应的客户分群模型;以及分别计算每种算法参数下的客户分群模型的损失函数,并选取损失函数最小时的算法参数作为最优参数,并将最优参数所对应的客户分群模型作为最优模型。可选地,在根据本专利技术的客户分群模型的构建方法中,还包括步骤:获取各用户在当前日期之前预定期间内的历史行为数据;根据各用户的属性数据和所获取到的历史行为数据计算各用户的多个特征值,并将该多个特征值构造为特征向量;以及分别将各用户的特征向量输入到所述客户分群模型中,预测得到各用户的购买属性类别。根据本专利技术的另一方面,提供了一种计算设备,包括:一个或多个处理器;存储器;和一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行如上所述的客户分群模型的构建方法的指令。根据本专利技术的再一方面,提供了一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当计算设备执行时,使得所述计算设备执行如上所述的客户分群模型的构建方法。根据本专利技术的技术方案,根据各用户的属性数据和在目标网站上的历史行为数据计算得到各用户的特征向量,并根据向各用户的历史行为数据以及目标网站向各用户所发送的短信推荐记录对各用户的购买属性类别进行标记。之后,特征向量及其对应的购买属性类别作为一条样本,构造训练集,并对该训练集进行训练,即可得到客户分群模型。这样,只要计算出待测用户的特征向量,输入到训练好的客户分群模型中,就可以确定该用户的购买属性类别。之后,就可根据该用户的购买属性类别来对该用户进行针对性的短信推送,提高产品营销效率。而且,本专利技术的操作特征设置为多种特征,其能有效提高模型的准确性,进而提高预测结果的准确性。附图说明为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。图1示出了根据本专利技术一个实施例的计算设备100的示意图;以及图2示出了根据本专利技术一个实施例的客户分群模型的构建方法200的流程图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。图1是示例计算设备100的框图。在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上利本文档来自技高网...

【技术保护点】
1.一种客户分群模型的构建方法,适于在在计算设备中执行,该方法包括:获取多个用户的属性数据、各用户在目标网站上的预定期间内的历史行为数据、以及目标网站在该预定期间内向各用户发送的短信推荐记录;根据所获取的属性数据和历史行为数据计算各用户的多个特征值,并将各用户的多个特征值构造为一个特征向量;根据所获取到的短信推荐记录和历史行为数据对各用户的购买属性类别进行标记,所述购买属性类别包括不发短信即会主动购买、发短信会触发购买、发短信和红包会触发购买、以及怎样都不会购买;将各用户的特征向量及其对应的购买属性类别作为一条样本,以构造训练集;以及以各用户的特征向量为输入、以其购买属性类别为输出,采用预定算法对该训练集进行训练,得到所述客户分群模型。

【技术特征摘要】
1.一种客户分群模型的构建方法,适于在在计算设备中执行,该方法包括:获取多个用户的属性数据、各用户在目标网站上的预定期间内的历史行为数据、以及目标网站在该预定期间内向各用户发送的短信推荐记录;根据所获取的属性数据和历史行为数据计算各用户的多个特征值,并将各用户的多个特征值构造为一个特征向量;根据所获取到的短信推荐记录和历史行为数据对各用户的购买属性类别进行标记,所述购买属性类别包括不发短信即会主动购买、发短信会触发购买、发短信和红包会触发购买、以及怎样都不会购买;将各用户的特征向量及其对应的购买属性类别作为一条样本,以构造训练集;以及以各用户的特征向量为输入、以其购买属性类别为输出,采用预定算法对该训练集进行训练,得到所述客户分群模型。2.如权利要求1所述的方法,其中,特征值包括交易属性特征值,所述交易属性特征值包括以下特征值中的一个或多个:每次交易时间、每次下单时间、订单到期时间、每次提现时间、注册时间、历史提现次数、历史交易次数、累计交易金额范围、购买产品所属类别的数量、购买产品所属类别的金额。3.如权利要求1或2所述的方法,其中,特征值包括用户属性特征值,所述用户属性特征值包括用户的性别、年龄、省份、城市和设备信息中的一个或多个。4.如权利要求1所述的方法,其中,根据所获取到的短信推荐记录和历史行为数据对各用户的购买属性类别进行标记的步骤包括:在该预定期间内,若未向用户发送推荐短信,用户却产生了交易行为,则将该用户标记为不发短信即会主动购买用户;若未向用户发送推荐短信,用户也未产生交易行为,则将该用户标记为发短信和红包会触发购买用户;若...

【专利技术属性】
技术研发人员:张一丹
申请(专利权)人:北京腾云天下科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1