System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于计算机的用户分类方法技术_技高网

基于计算机的用户分类方法技术

技术编号:40486582 阅读:6 留言:0更新日期:2024-02-26 19:18
本发明专利技术涉及数据分析领域,尤其涉及一种基于计算机的用户分类方法,该方法包括:获取若干待分类用户的年龄信息以及在预设时长内的用户事件发生行为数据;构建用户事件发生评价标准并确定第一评分集;基于目标年龄用户标准对每个待分类用户的年龄信息进行评分得到第二评分;将第一评分集和第二评分进行处理以能够体现对应的实际数值;将待分类用户根据第一评分集中的评分和第二评分分为若干用户簇并确定群中心;调整每个用户簇内的待分类用户以及群中心,直至每个用户簇内的待分类用户与群中心的距离相同;将待分类用户确定相应的目标用户簇,在目标用户簇中任意待分类用户与群中心的距离都相同。本发明专利技术提高了用户分类的准确性。

【技术实现步骤摘要】

本专利技术涉及数据分析领域,尤其涉及一种基于计算机的用户分类方法


技术介绍

1、客户分类通常也就是我们所说的客户画像分类,客户画像是b2b数字化营销中非常重要的概念,贯穿整个客户生命周期管理及运营。客户画像是基于客户数据和行为的综合描述,可以帮助营销人员更好地了解客户。包括客户的年龄、性别、教育程度、职业、兴趣爱好、行为轨迹等信息。通过这些数据,营销人员可以更好地理解客户的需求和采购行为,并提供更加精准的产品和服务。

2、中国专利公开号为cn114022712a的专利文献公开了一种用户分类方法,该方法包括:获取待分类用户的画像信息,所述画像信息包括用户属性信息以及用户交易信息;将所述待分类用户的画像信息输入至分类模型中,得到所述待分类用户的用户类别,所述分类模型是根据逻辑回归模型以及接受者操作特征roc曲线获得的,所述用户类别包括第一类用户和第二类用户,所述roc曲线用于表征所述分类模型的预测精度,所述第一类用户为催收难度大于预设阈值的用户,所述第二类用户为催收难度小于预设阈值的用户。

3、现有技术中对客户分群的方法主要依赖于标签,一个客群包含多种标签,组成客群所选用的标签不准确,造成客户分类不准确。


技术实现思路

1、为此,本专利技术提供一种基于计算机的用户分类方法,通过获取待分类用户的年龄信息和他们在预设时长内的用户事件发生行为数据并根据上述数据进行用户簇的分类可以解决客户分类不准确问题。

2、为实现上述目的,本专利技术提供一种基于计算机的用户分类方法,该方法包括:

3、获取若干待分类用户的年龄信息以及所述待分类用户在预设时长内的用户事件发生行为数据,所述用户事件发生行为数据包括待分类用户在所述预设时长内的目标事件发生频率、目标事件发生时间间隔以及目标事件发生金额;

4、构建所述待分类用户的用户事件发生评价标准,基于所述用户事件发生评价标准确定每个所述待分类用户的事件发生行为数据对应的第一评分集;

5、基于事件发生场景下的目标年龄用户标准对每个所述待分类用户的年龄信息进行评分,以得到第二评分;

6、将所述第一评分集和所述第二评分进行数据处理以使所述第一评分集中的评分和所述第二评分能够体现对应的实际数值;

7、将待分类用户根据所述第一评分集中的评分和第二评分分为若干用户簇,并分别确定每个所述用户簇的群中心;

8、调整所述每个用户簇内的待分类用户以及所述群中心,直至每个用户簇内的待分类用户与所述群中心的距离相同;

9、将所述待分类用户确定相应的目标用户簇,在所述目标用户簇中任意待分类用户与群中心的距离都相同。

10、进一步地,获取若干待分类用户的年龄信息以及所述待分类用户在预设时长内的用户事件发生行为数据包括:

11、统计用户在所述预设时长内若干事件的发生次数,获取用户的目标事件发生次数、最小发生次数和最大发生次数,根据所述目标事件发生次数、所述最小发生次数和所述最大发生次数计算所述目标事件发生频率;

12、统计用户在所述预设时长内相邻目标事件的若干时间间隔,计算若干所述时间间隔的均值,将均值计算结果作为所述目标事件发生时间间隔;

13、统计用户在所述预设时长内目标事件的若干事件发生金额,计算若干所述事件发生金额的均值,将均值计算结果作为所述目标事件发生金额。

14、进一步地,根据所述目标事件发生次数、所述最小发生次数和所述最大发生次数计算所述目标事件发生频率包括:

15、目标事件发生频率 = (目标事件发生次数 - 最小发生次数)/(最大发生次数 -最小发生次数)。

16、进一步地,基于所述用户事件发生评价标准确定每个所述待分类用户的事件发生行为数据对应的第一评分集包括:

17、将所述事件发生频率与所述事件标准发生频率进行计算,获取频率评价值;

18、将所述事件发生时间间隔与事件标准发生时间间隔进行计算,获取时间间隔评价值;

19、将所述事件发生金额与事件标准发生金额进行计算,获取金额评价值;

20、根据预设权重值对所述频率评价值、所述时间间隔评价值和所述金额评价值进行加权计算,获取第一评分值;

21、统计每个所述待分类用户的事件发生行为数据对应的第一评分值,基于若干所述第一评分值构建所述第一评分集。

22、进一步地,将所述事件发生频率与所述事件预设发生频率进行计算,获取频率评价值包括:

23、式中,s频率为频率评价值,p频率为事件发生频率,p预设频率为事件预设发生频率;

24、所述时间间隔评价值和所述金额评价值与所述频率评价值计算过程相同。

25、进一步地,根据所述预设权重值对所述频率评价值、所述时间间隔评价值和所述金额评价值进行加权计算,获取第一评分值包括:

26、s1=5×s频率+3×s时间+2×s金额,

27、式中,s1为第一评分值、s频率为频率评价值、s时间为时间间隔评价值、s金额为金额评价值。

28、进一步地,基于所述事件发生场景下的目标年龄用户标准对每个所述待分类用户的年龄信息进行评分,以得到第二评分包括:

29、通过公式:s2=10-0.8×|y实-y标|计算所述第二评分;

30、式中,s2为所述第二评分,y实为所述待分类用户的实际年龄信息,y标为所述事件发生场景下的目标年龄用户的标准年龄信息。

31、进一步地,将待分类用户根据所述第一评分集中的评分和第二评分分为若干用户簇,并分别确定每个所述用户簇的群中心包括:

32、将每个所述待分类用户的所述第一评分集的均值和所述第二评分作为初始簇中心,并获取若干簇;

33、通过欧几里得距离算法计算所述待分类用户的所述第一评分集中的评分和第二评分与若干所述初始簇中心之间的距离,获取若干距离值;

34、将若干所述距离值根据由小到大进行排序,选择排序第一的所述初始簇中心对应的簇为所述待分类用户的目标簇;

35、将所述目标簇的所述第一评分集的均值和所述第二评分的均值作为所述目标簇的群中心。

36、进一步地,调整所述每个用户簇内的待分类用户以及所述群中心包括:

37、计算所述目标簇内每个所述待分类用户与所述目标簇的群中心的距离;

38、将计算获取的若干距离中最大距离值对应的所述待分类用户进行标记作为标记用户;

39、重新计算所述标记用户与所述若干簇的群中心的若干距离,选择距离最小值对应的簇作为所述标记用户的更新簇。

40、对所述标记用户进行重新分配后,更新所述目标簇和所述更新簇的群中心。

41、进一步地,计算所述目标簇内每个所述待分类用户与所述目标簇的群中心的距离包括:

42、式中,s1为所述待分类用户的第一评分,s2为所述待分类用户的第二评分,c1为所述目标簇内所本文档来自技高网...

【技术保护点】

1.一种基于计算机的用户分类方法,其特征在于,包括:

2.根据权利要求1所述的基于计算机的用户分类方法,其特征在于,获取若干待分类用户的年龄信息以及所述待分类用户在预设时长内的用户事件发生行为数据包括:

3.根据权利要求2所述的基于计算机的用户分类方法,其特征在于,根据所述目标事件发生次数、所述最小发生次数和所述最大发生次数计算所述目标事件发生频率包括:

4.根据权利要求3所述的基于计算机的用户分类方法,其特征在于,基于所述用户事件发生评价标准确定每个所述待分类用户的事件发生行为数据对应的第一评分集包括:

5.根据权利要求4所述的基于计算机的用户分类方法,其特征在于,将所述事件发生频率与所述事件预设发生频率进行计算,获取频率评价值包括:

6.根据权利要求5所述的基于计算机的用户分类方法,其特征在于,根据所述预设权重值对所述频率评价值、所述时间间隔评价值和所述金额评价值进行加权计算,获取第一评分值包括:

7.根据权利要求6所述的基于计算机的用户分类方法,其特征在于,基于所述事件发生场景下的目标年龄用户标准对每个所述待分类用户的年龄信息进行评分,以得到第二评分包括:

8.根据权利要求7所述的基于计算机的用户分类方法,其特征在于,将待分类用户根据所述第一评分集中的评分和第二评分分为若干用户簇,并分别确定每个所述用户簇的群中心包括:

9.根据权利要求8所述的基于计算机的用户分类方法,其特征在于,调整所述每个用户簇内的待分类用户以及所述群中心包括:

10.根据权利要求9所述的基于计算机的用户分类方法,其特征在于,计算所述目标簇内每个所述待分类用户与所述目标簇的群中心的距离包括:

...

【技术特征摘要】

1.一种基于计算机的用户分类方法,其特征在于,包括:

2.根据权利要求1所述的基于计算机的用户分类方法,其特征在于,获取若干待分类用户的年龄信息以及所述待分类用户在预设时长内的用户事件发生行为数据包括:

3.根据权利要求2所述的基于计算机的用户分类方法,其特征在于,根据所述目标事件发生次数、所述最小发生次数和所述最大发生次数计算所述目标事件发生频率包括:

4.根据权利要求3所述的基于计算机的用户分类方法,其特征在于,基于所述用户事件发生评价标准确定每个所述待分类用户的事件发生行为数据对应的第一评分集包括:

5.根据权利要求4所述的基于计算机的用户分类方法,其特征在于,将所述事件发生频率与所述事件预设发生频率进行计算,获取频率评价值包括:

6.根据权利要求5所述的基于计算机的用户分类...

【专利技术属性】
技术研发人员:王子航张德文杨凯唐治彬刘辉
申请(专利权)人:湖南三湘银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1