一种基于大数据技术的高精度物流企业客户画像方法技术

技术编号:34465348 阅读:25 留言:0更新日期:2022-08-10 08:38
一种基于大数据技术的高精度物流企业客户画像方法,结合数据库的信息和多源异构爬虫的综合方式对用户数据进行收集,对原始数据进行预处理;根据收集到的用户数据发掘隐性特征,使用密度聚类算法对用户群分类,将分类的用户根据获取的隐性特征进行打分分类,再根据结果将用户分为三类用户;使用樽海鞘群算法优化的卷积神经网络对用户的包裹进行分类,同时采用激活函数以及根据网络过滤器的分值情况对网络进行修改,将包裹按三个维度进行分类,构建用户包裹的特征维度;根据用户的包裹和个人信息,完成用户数据标签化,生成高精度客户画像;从物流企业的角度出发,针对物流客户结合用户包裹进行画像,为物流企业提供更精准的客户画像。客户画像。客户画像。

【技术实现步骤摘要】
一种基于大数据技术的高精度物流企业客户画像方法


[0001]本专利技术属于客户画像
,具体涉及一种基于大数据技术的高精度物流企业客户画像方法。

技术介绍

[0002]随着经济全球化和物流信息化的发展,我国物流企业逐步扩大了服务范围,从早期的仓储和运输业务转向综合服务,同时在企业用户也对物流园区产生了更多的需求,这无疑给物流企业的管理和服务带来了新的挑战。物流企业在掌握了大量的用户业务行为信息的前提下,在更好地服务用户的基础上,想要制定相应的精准营销,业务推荐和个性化服务方案,则需要构建用户画像,分析用户的业务特征和业务偏好,以优化对用户的管理,制定精准的营销手段和策略,主动为用户提供个性化服务。
[0003]企业构建客户画像对企业而言具有重大的意义,在掌握了大量的用户业务行为信息的前提下,在更好地服务用户的基础上,想要制定相应的精准营销,业务推荐和个性化服务方案,则需要对物流企业构建用户画像,分析用户的业务特征和业务偏好。构建客户画像不仅可以优化企业用户体验,还可以实现精准营销。通过每个用户的仓储品类、仓储量、加工量等数据进行分析和挖掘构建用户画像,用数据还原用户的真实需求,从而设计出更加符合用户需要的服务和产品,为用户提供更好的体验,进而提升物流企业的效率,创造更多的经济价值。而企业在日常的经营活动积累了大量的业务数据,这些数据的来源相对可靠,数据获取简便,数据更新及时,为构建用户画像模型提供了数据支撑。通过这些精准信息建立数据挖掘分析模型,建立完整的用户画像模型体系,能够更加有效全面地了解用户,并实现精细化、集约化和标准化营销。密度聚类算法能够识别任意形状的聚类簇,且对处理异常数据有较好的效果,而卷积神经网络和条件对抗生成网络分别在文本分类上可以更好地对用户的信息进行区分以及对用户的缺失信息进行更精准的填补,本专利技术结合以上技术以及相关的改进技术,从物流企业的角度出发,针对物流客户结合用户包裹进行画像,为物流企业提供更精准的客户画像。

技术实现思路

[0004]本专利技术所要解决的技术问题是克服现有技术的不足,提供一种基于大数据技术的高精度物流企业客户画像方法,通过大数据技术进行处理,抽取用户标签完成高精度的用户画像,通过收集用户数据,再对收集来的原始数据进行预处理,挖掘用户的隐性特征,通过多维度结合对用户群进行划分,以实现用户分类,使用改进的密度聚类算法对每一类用户的特征进行分析,总结出用户类型标签,选择数据标签后,生成用户的高精度画像优化企业用户体验的同时实现企业的精准营销。
[0005]本专利技术提供一种基于大数据技术的高精度物流企业客户画像方法,包括如下步骤,
[0006]步骤S1.对用户数据进行收集并处理,结合数据库已有的信息和多源异构爬虫的
综合方式对用户数据进行收集,对原始数据进行预处理,通过自适应的条件生成对抗网络对将原始数据中的缺失的数据进行填补,对错误的数据以及重复的数据分别进行删除;
[0007]步骤S2.根据收集到的用户数据发掘隐性特征,使用密度聚类算法对用户群分类,将分类的用户根据获取的隐性特征进行打分分类,再根据得到的结果将用户分为高级用户、中级用户、一般用户;
[0008]步骤S3.使用樽海鞘群算法优化的卷积神经网络对用户的包裹进行分类,同时采用激活函数以及根据网络过滤器的分值情况对网络进行修改,将包裹按重量、易损程度、紧急程度三个维度进行分类,构建用户包裹的特征维度;
[0009]步骤S4.根据用户的包裹和用户个人信息,完成用户数据标签化,生成高精度客户画像。
[0010]作为本专利技术的进一步技术方案,密度聚类算法中引入了一个密度指标ω,指标为
[0011][0012]其中M为数据集中的点数,K为期望的聚类数,α取值范围为0

1之间,ω为计算每个点的局部密度所用的临近点个数,同时引用一个阈值n
c
,因此,局部密度p
i
为,其中d(x
i

x
jk
)是x
i
和x
jk
之间的欧氏距离,其中j
k
是离点i最近的第k个点;
[0013]设置决策函数γ完成聚类:
[0014][0015]其中,δ
i
为样本间的距离,当数据点x
i
具有最大局部密度时,δ
i
取最大值,保证x
i
被选为聚类中心其定义为
[0016][0017]进一步的,密度聚类算法的具体步骤为,
[0018]步骤S21.输入用户数据集S={x1,x2,

,xN},使用阈值nc,聚类数K,获取临近点ω;
[0019]步骤S22.将获取的临界点ω通过无核方式计算各样本点的局部密度p
i

[0020]步骤S23.通过决策函数γ计算各样本点的γ值;
[0021]步骤S24.计算选择各样本点的距离δ
i

[0022]步骤S25.利用各点降序排列的将各点γ值进行降序排列,选择前k个作为聚类中心;
[0023]步骤S26.计算非聚类中心点到各中心点的距离的取最小值,该值小于使用阈值则分配到同一簇中,否则就舍弃该点,对各点逐一进行处理,最后确定各点最终的归属,完成聚类。
[0024]进一步的,步骤S1中,自适应的条件生成对抗网络包括生成器、辅助分类器和鉴别器,生成器的损失函数为:
[0025][0026]鉴别器损失函数为:
[0027][0028]其中,m为数据缺失指标,当该数据缺失时m=0,否则m=1;α和β为0到1之间的系数,C(x)为辅助分类器的输出,(xR
k

x
k
)2为鉴别器的满意程度;添加辅助的分类器C对条件生成对抗模型进行改进,通过分类器来约束生成器,获取新的损失函数,再次对鉴别器和生成器进行训练。
[0029]进一步的,样本数据的缺失率采取了加权计算方法,增强前5个数据的权重,其计算方式为
[0030][0031]其中,m为丢失标志,当数据丢失时m=0,否则m=1。
[0032]进一步的,通过损失函数自适应地调整学习率,在每个训练时期以若干个学习率独立执行训练,并且将得到最小训练损失的学习率作为每个时期学习率,学习率之间的关系为
[0033]η
t+1
=η
t
r
n
ꢀꢀ
(5

1),
[0034]其中,r
n
表示比例因子,通过若干个状态转化,使用树结构进行搜索,确定不同状态的学习率η
s
,训练期间的状态转换可以由树结构表示:
[0035][0036]其中,η0是初始学习率;将节点上计算获取的值降序排序,标注的数字代表每次的训练损失排名,通过广度优先进行状态移动到标记为1的下一个节点作为该时刻的学习率本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据技术的高精度物流企业客户画像方法,其特征在于,包括如下步骤,步骤S1.对用户数据进行收集并处理,结合数据库已有的信息和多源异构爬虫的综合方式对用户数据进行收集,对原始数据进行预处理,通过自适应的条件生成对抗网络对将原始数据中的缺失的数据进行填补,对错误的数据以及重复的数据分别进行删除;步骤S2.根据收集到的用户数据发掘隐性特征,使用密度聚类算法对用户群分类,将分类的用户根据获取的隐性特征进行打分分类,再根据得到的结果将用户分为高级用户、中级用户、一般用户;步骤S3.使用樽海鞘群算法优化的卷积神经网络对用户的包裹进行分类,同时采用激活函数以及根据网络过滤器的分值情况对网络进行修改,将包裹按重量、易损程度、紧急程度三个维度进行分类,构建用户包裹的特征维度;步骤S4.根据用户的包裹和用户个人信息,完成用户数据标签化,生成高精度客户画像。2.根据权利要求1所述的一种基于大数据技术的高精度物流企业客户画像方法,其特征在于,密度聚类算法中引入了一个密度指标ω,指标为其中M为数据集中的点数,K为期望的聚类数,α取值范围为0

1之间,ω为计算每个点的局部密度所用的临近点个数,同时引用一个阈值n
c
,因此,局部密度p
i
为,其中是x
i
和之间的欧氏距离,其中j
k
是离点i最近的第k个点;设置决策函数γ完成聚类:是离点i最近的第k个点;设置决策函数γ完成聚类:其中,δ
i
为样本间的距离,当数据点x
i
具有最大局部密度时,δ
i
取最大值,保证x
i
被选为聚类中心其定义为3.根据权利要求2所述的一种基于大数据技术的高精度物流企业客户画像方法,其特征在于,所述密度聚类算法的具体步骤为,步骤S21.输入用户数据集S={x1,x2,

,xN},使用阈值nc,聚类数K,获取临近点ω:步骤S22.将获取的临界点ω通过无核方式计算各样本点的局部密度p
i
;步骤S23.通过决策函数γ计算各样本点的Y值;步骤S24.计算选择各样本点的距离δ
i
;步骤S25.利用各点降序排列的将各点γ值进行降序排列,选择前k个作为聚类中心;步骤S26.计算非聚类中心点到各中心点的距离的取最小值,该值小于使用阈值则分配到同一簇中,否则就含弃该点,对各点逐一进行处理,最后确定各点最终的归属,完成聚类。4.根据权利要求1所述的一种基于大数据技术的高精度物流企业客户画像方法,其特
征在于,所述步骤S1中,自适应的条件生成对抗网络包括生成器、辅助分类器和鉴别器,生成器的损失函数为:鉴别器损失函数为:其中,m为数据缺失指标,当该数据缺失时m=0,否则m=1;α和β为0到1之间的系数,C(x)为辅助分类器的输出,(x
Rk

x
k
)2为鉴别器的满意程度;添加辅助的分类器C对条件生成对抗模型进行改进,通过分类器来约束生成器,获取新的损失函数,再次对鉴别器和生成器进行训练。5.根据权利要求4所述的一种基于大数据技术的高精度物流企业客户画像方法,其特征在于,样本数据的缺失率采取了加权计算方法,增强前5个数据的权重,其计算方式为其中,m为丢失标志,当数据丢失时m=0,否则m=1。6.根据权利要求4所述的一种基于大数据技术的高精度物流企业客户画像方法,其特征在于,通过损失函数自适应地调整学习率,在每个训练时期以若干个学习率独立执行训练,并且将得到最小训练损失的学习率作为每个时期学习率,学习率之...

【专利技术属性】
技术研发人员:赵学健朱远娜孙知信孙哲汪胡青宫婧胡冰
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1