【技术实现步骤摘要】
一种数据挖掘与可视化的方法
[0001]本专利技术涉及数据挖掘领域,尤其是一种数据挖掘与可视化的方法。
技术介绍
[0002]智能物流作为物流行业的新兴领域,致力于利用先进技术提高物流效率、降低成本并提供更好的服务。然而,智能物流面临着复杂的挑战,如供应链管理、货物追踪、路线规划等。为了解决这些挑战,数据挖掘和可视化技术被引入并广泛应用,数据挖掘是从大规模数据集中发现隐藏模式、关系和趋势的过程。在智能物流中,故本专利技术提出了一种数据挖掘与可视化方法,可视化技术是将数据转化为可视化图形或图表,以便用户更直观地理解和分析数据,通过可视化供应链中各个环节的数据,物流企业可以实时监控供应链的运作。现有技术中的数据挖掘技术一般都是利用一定的数据规则对数据表或者数据库中的数据进行识别、引用和聚合计算,不仅处理量大,处理负荷高,并且缺乏对挖掘出数据的关联性排布,不利于后续的数据归类。
技术实现思路
[0003]本专利技术的目的是通过提出一种数据挖掘与可视化的方法,以解决上述
技术介绍
中提出的缺陷。
[0004]本专 ...
【技术保护点】
【技术特征摘要】
1.一种数据挖掘与可视化的方法,其特征在于:包括如下步骤:S1:根据供应链环节获取初始物流数据集;S2:根据初始物流数据集建立数据可视化模型;S3:对初始物流数据集进行数据预处理获得预处理数据集;S4:将预处理数据集作为输入进行模型训练获得数据挖掘模型。2.根据权利要求1所述的数据挖掘与可视化的方法,其特征在于:所述S1中的获取初始物流数据集方法包括:根据物流供应链参数将数据库划分为多个数据库维度,根据模型训练速度确定抽调时间间隔,根据抽调时间间隔从各个数据库维度中依次抽调初始物流数据集。3.根据权利要求1所述的数据挖掘与可视化的方法,其特征在于:所述S2中对初始数据集建立数据可视化模型是使用Python自带的库函数包括matplotlib、seaborn、ggplot、bokeh、pygal、pyecharts进行数据可视化。4.根据权利要求1所述的数据挖掘与可视化的方法,其特征在于:所述数据预处理包括数据清洗、数据集成、数据变化、数据规约。5.根据权利要求4所述的数据挖掘与可视化的方法,其特征在于:所述数据清洗包括缺失值处理和异常值处理,其中缺失值处理通过构建插补函数对缺失值进行数据插补,插补函数方程如下:y=a1x
n
‑1+a2x
n
‑2+
…
+a
n
‑1x1+a
n
其中y为预测值,x为正常数据的值,a1,a2...a
n
‑1,a
n
为是插补函数的参数,n表示多项式的次数减一,可得:其中L(x)为缺失值对应的预测值,(x
i
,y
i
)为正常数值,x为插补的值,x
j
为自变量取值,异常处理方法为平均值修订,方法如下:其中y
i
为通过平均值修订的修订值,y
i
‑2,y
i
‑1,y
i+1
,y
i+2
为修订值前后各两个数据。6.根据权利要求4所述的数据挖掘与可视化的方法,其特征在于:所述数据集成的步骤如下:特征提取:从x
i
和x
j...
【专利技术属性】
技术研发人员:杨钢,
申请(专利权)人:广州盛成妈妈网络科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。