用户生命周期的识别方法、装置、终端设备和存储介质制造方法及图纸

技术编号:33473700 阅读:11 留言:0更新日期:2022-05-19 00:50
本申请适用于人工智能技术领域,提供一种用户生命周期的识别方法、装置、终端设备和存储介质。该方法首先获取用户的交易特征数据以及时间边界参数,该交易特征数据包含训练集数据和测试集数据两部分;然后,基于该训练集数据构建SVM模型,且该SVM模型的决策边界根据该时间边界参数确定;接着,将测试集数据输入该SVM模型进行分类,并根据该分类的结果确定该目标用户的用户生命周期。上述过程将支持向量机SVM模型运用在用户生命周期的识别中,基于SVM模型的高精度分类结果,能够在一定程度上提高识别用户生命周期的准确率。提高识别用户生命周期的准确率。提高识别用户生命周期的准确率。

【技术实现步骤摘要】
用户生命周期的识别方法、装置、终端设备和存储介质


[0001]本申请涉及人工智能
,提供一种用户生命周期的识别方法、装置、终端设备和存储介质。

技术介绍

[0002]用户生命周期本质上是用户的一种分类方法论,是按照用户在产品中的阶段进行的类别划分,其反映了用户从接触产品到离开产品的整个过程。从技术层面上看,用户生命周期可以理解成一个用户标签,标签值包括引入期用户、成长期用户和流失期用户,等等。
[0003]目前,通常基于用户购买产品的数据(例如交易时间和交易频率等),按照设定的逻辑规则来识别用户生命周期。例如,若检测到用户最近1年内都没有购买产品的记录,则识别用户生命周期为流失期;若检测到用户最近3个月的交易频率增加,则识别用户生命周期为成长期,等等。然而,采用这种简单逻辑的方式识别得到的用户生命周期的准确率较低。

技术实现思路

[0004]有鉴于此,本申请提出一种用户生命周期的识别方法、装置、终端设备和存储介质,能够提高识别用户生命周期的准确率。
[0005]第一方面,本申请实施例提供了一种用户生命周期的识别方法,包括:
[0006]获取目标用户的第一交易特征数据以及时间边界参数,所述第一交易特征数据包括训练集数据和测试集数据,所述时间边界参数为一个以上的用于划分各个用户生命周期阶段的时间形式参数;
[0007]基于所述训练集数据构建SVM模型,所述SVM模型的决策边界根据所述时间边界参数确定;
[0008]将所述测试集数据输入所述SVM模型进行分类,并根据所述分类的结果确定所述目标用户的用户生命周期。
[0009]在本申请实施例提出的用户生命周期的识别方法中,首先获取用户的交易特征数据以及时间边界参数,该交易特征数据包含训练集数据和测试集数据两部分;然后,基于该训练集数据构建SVM模型,且该SVM模型的决策边界根据该时间边界参数确定;接着,将测试集数据输入该SVM模型进行分类,并根据该分类的结果确定该目标用户的用户生命周期。上述过程将支持向量机SVM模型运用在用户生命周期的识别中,基于SVM模型的高精度分类结果,能够在一定程度上提高识别用户生命周期的准确率。
[0010]在本申请实施例的一种实现方式中,所述时间边界参数可以通过以下方式获取:
[0011]获取所有用户的第二交易特征数据;
[0012]从所述第二交易特征数据中选取出N个样本数据,N为所述时间边界参数的数量;
[0013]根据所述N个样本数据包含的特征参数分别将所述N个样本数据转换为向量的形式,得到N个特征向量;
[0014]将所述N个特征向量的坐标确定为N个初始聚类中心;
[0015]分别计算所述第二交易特征数据中除所述N个样本数据之外的其它数据的特征向量与每个所述初始聚类中心之间的距离;
[0016]将每个所述其它数据分别划分到与各自的特征向量之间的距离最近的所述初始聚类中心对应的簇中;
[0017]针对每个所述初始聚类中心对应的簇,计算该簇中包含的所有特征向量的坐标的平均值,并将所述平均值确定为该簇更新后的聚类中心;
[0018]重复上述迭代更新聚类中心的操作,直至达到设定的迭代次数或者各个聚类中心迭代更新时的位置变化幅度小于设定阈值,此时获得N个最终聚类中心以及每个簇包含的特征向量;
[0019]根据所述N个最终聚类中心以及每个簇包含的特征向量,确定各个所述时间边界参数。
[0020]进一步的,所述根据所述N个最终聚类中心以及每个簇包含的特征向量,确定各个所述时间边界参数,可以包括:
[0021]根据所述N个最终聚类中心以及每个簇包含的特征向量所形成的区域,采用几何特征计算的方式绘制各个所述区域之间的边界线;
[0022]针对每个所述边界线,使用设定的加权系数对该边界线对应的特征向量的各个坐标分量执行加权求和操作,得到该边界线对应的时间边界参数。
[0023]在本申请实施例的一种实现方式中,所述基于所述训练集数据构建SVM模型,可以包括:
[0024]获取设定的用户生命周期类别的数量M;
[0025]基于所述训练集数据构建个子SVM模型,其中,每个所述子SVM模型用于完成所述M个用户生命周期类别中的两个类别的分类,每个所述子SVM模型的决策边界根据一个所述时间边界参数确定。
[0026]进一步的,所述将所述测试集数据输入所述SVM模型进行分类,并根据所述分类的结果确定所述目标用户的用户生命周期,可以包括:
[0027]将所述测试集数据分别输入所述个子SVM模型,得到每个所述子SVM模型的分类结果;
[0028]根据每个所述子SVM模型的分类结果,统计得到每个所述用户生命周期类别的得票数量,其中,任意的一个用户生命周期类别的得票数量和所述个子SVM模型中分类结果为该用户生命周期类别的子SVM模型的数量相同;
[0029]将所述M个用户生命周期类别中所述得票数量最高的用户生命周期类别,确定为所述目标用户当前所处的用户生命周期。
[0030]更进一步的,所述将所述M个用户生命周期类别中所述得票数量最高的用户生命周期类别,确定为所述目标用户当前所处的用户生命周期,可以包括:
[0031]若所述M个用户生命周期类别中所述得票数量最高的用户生命周期类别为1个,则将所述得票数量最高的用户生命周期类别确定为所述目标用户当前所处的用户生命周期;
[0032]若所述M个用户生命周期类别中所述得票数量最高的用户生命周期类别为2个,则
获取用于分类所述2个得票数量最高的用户生命周期类别的子SVM模型的目标分类结果,并将所述目标分类结果指向的用户生命周期类别确定为所述目标用户当前所处的用户生命周期。
[0033]在本申请实施例的一种实现方式中,所述获取目标用户的第一交易特征数据,可以包括:
[0034]从指定数据库中查找所述目标用户的所有历史交易数据;
[0035]对所述历史交易数据进行预处理操作;
[0036]按照设定的控制逻辑,从预处理操作后的所述历史交易数据中提取出所述第一交易特征数据。
[0037]第二方面,本申请实施例提供了一种用户生命周期的识别装置,包括:
[0038]数据获取模块,用于获取目标用户的第一交易特征数据以及时间边界参数,所述第一交易特征数据包括训练集数据和测试集数据,所述时间边界参数为一个以上的用于划分各个用户生命周期阶段的时间形式参数;
[0039]SVM模型构建模块,用于基于所述训练集数据构建SVM模型,其中,所述SVM模型的决策边界根据所述时间边界参数确定;
[0040]用户生命周期识别模块,用于将所述测试集数据输入所述SVM模型进行分类,并根据所述分类的结果确定所述目标用户的用户生命周期。
[0041]第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户生命周期的识别方法,其特征在于,包括:获取目标用户的第一交易特征数据以及时间边界参数,所述第一交易特征数据包括训练集数据和测试集数据,所述时间边界参数为一个以上的用于划分各个用户生命周期阶段的时间形式参数;基于所述训练集数据构建SVM模型,所述SVM模型的决策边界根据所述时间边界参数确定;将所述测试集数据输入所述SVM模型进行分类,并根据所述分类的结果确定所述目标用户的用户生命周期。2.如权利要求1所述的方法,其特征在于,所述时间边界参数通过以下方式获取:获取所有用户的第二交易特征数据;从所述第二交易特征数据中选取出N个样本数据,N为所述时间边界参数的数量;根据所述N个样本数据包含的特征参数分别将所述N个样本数据转换为向量的形式,得到N个特征向量;将所述N个特征向量的坐标确定为N个初始聚类中心;分别计算所述第二交易特征数据中除所述N个样本数据之外的其它数据的特征向量与每个所述初始聚类中心之间的距离;将每个所述其它数据分别划分到与各自的特征向量之间的距离最近的所述初始聚类中心对应的簇中;针对每个所述初始聚类中心对应的簇,计算该簇中包含的所有特征向量的坐标的平均值,并将所述平均值确定为该簇更新后的聚类中心;重复上述迭代更新聚类中心的操作,直至达到设定的迭代次数或者各个聚类中心迭代更新时的位置变化幅度小于设定阈值,此时获得N个最终聚类中心以及每个簇包含的特征向量;根据所述N个最终聚类中心以及每个簇包含的特征向量,确定各个所述时间边界参数。3.如权利要求2所述的方法,其特征在于,所述根据所述N个最终聚类中心以及每个簇包含的特征向量,确定各个所述时间边界参数,包括:根据所述N个最终聚类中心以及每个簇包含的特征向量所形成的区域,采用几何特征计算的方式绘制各个所述区域之间的边界线;针对每个所述边界线,使用设定的加权系数对该边界线对应的特征向量的各个坐标分量执行加权求和操作,得到该边界线对应的时间边界参数。4.如权利要求1所述的方法,其特征在于,所述基于所述训练集数据构建SVM模型,包括:获取设定的用户生命周期类别的数量M;基于所述训练集数据构建个子SVM模型,其中,每个所述子SVM模型用于完成所述M个用户生命周期类别中的两个类别的分类,每个所述子SVM模型的决策边界根据一个所述时间边界参数确定。5.如权利要求4所述的方法,其特征在于,所述将所述测试集数据输入所述SVM模型进行分类,并根据所述分类的结果确定所述目标用户的用户生...

【专利技术属性】
技术研发人员:彭发
申请(专利权)人:平安普惠企业管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1