数据分类方法技术

技术编号:39738142 阅读:5 留言:0更新日期:2023-12-17 23:40
本公开提出一种数据分类方法

【技术实现步骤摘要】
数据分类方法、装置、设备及存储介质


[0001]本公开涉及数据处理
,尤其涉及一种数据分类方法

装置

设备及存储介质


技术介绍

[0002]目前,市场中针对智慧园区的解决方案主要以数据层
+
业务层
+
应用层的形式,提供事先开发封装好的各场景产品内容,通过可视化大屏
、PC
端和
H5
面向用户提供服务,用户在己有的场景产品中选择

其中,该过程中的数据层主要用于数据分类

然而,相关技术中数据分类精细程度有待提升,因此影响后续运营分析的效果


技术实现思路

[0003]本公开旨在至少在一定程度上解决相关技术中的技术问题之一

[0004]本公开第一方面实施例提出了一种数据分类方法,包括:从至少一个数据源获取待分类数据;利用预设的决策树模型对待分类数据进行分类,以确定第一类别数据;分别对第一类别数据进行聚类分析,以确定目标类别数据;以及将目标类别数据分别存储至对应的数据存储单元

[0005]本公开第二方面实施例提出了一种数据分类装置,包括:获取模块,用于从至少一个数据源获取待分类数据;分类模块,用于利用预设的决策树模型对待分类数据进行分类,以确定第一类别数据;聚类模块,用于分别对第一类别数据进行聚类分析,以确定目标类别数据;以及存储模块,用于将目标类别数据分别存储至对应的数据存储单元
。<br/>[0006]本公开第三方面实施例提出了一种电子设备,包括:存储器

处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本公开第一方面实施例提出的数据分类方法

[0007]本公开第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开第一方面实施例提出的数据分类方法

[0008]本公开第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行如本公开第一方面实施例提出的数据分类方法

[0009]本实施例中,通过从至少一个数据源获取待分类数据,并利用预设的决策树模型对待分类数据进行分类,以确定第一类别数据,并分别对第一类别数据进行聚类分析,以确定目标类别数据,以及将目标类别数据分别存储至对应的数据存储单元,能够先利用决策树模型进行数据分类以分出大类的第一类别数据,然后对第一类别数据进行聚类分析得到精细颗粒度的数据类别,因此经过递进分类可以避免数据疏漏,保证数据分析过程有序化

分析结果精确化,有助提升后续运营分析效果

[0010]本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到

附图说明
[0011]本公开上述的和
/
或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0012]图1是本公开一实施例提出的数据分类方法的流程示意图;
[0013]图2是本公开实施例提出的分层递进分析引擎模型结构示意图;
[0014]图3是本公开实施例提出的业务端调用数据的流程示意图;
[0015]图4是本公开另一实施例提出的数据分类方法的流程示意图;
[0016]图5是本公开另一实施例提出的数据分类装置的结构示意图;
[0017]图6示出了适于用来实现本公开实施方式的示例性计算机设备的框图

具体实施方式
[0018]下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件

下面通过参考附图描述的实施例是示例性的,仅用于解释本公开,而不能理解为对本公开的限制

相反,本公开的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化

修改和等同物

[0019]需要说明的是,本实施例的数据分类方法的执行主体可以为数据分类装置,该装置可以由软件和
/
或硬件的方式实现,该装置可以配置在电子设备中,电子设备可以包括但不限于终端

服务器端等

[0020]图1是本公开一实施例提出的数据分类方法的流程示意图,如图1所示,该数据分类方法,包括:
[0021]S101
:从至少一个数据源获取待分类数据

[0022]本公开实施例,数据分类装置首先从至少一个数据源获取待分类数据

[0023]其中,需要进行分类的数据被称为待分类数据,该待分类数据可以是任意场景下产生的数据,对此不作限制

[0024]而数据源,指的是产生待分类数据的平台或系统,其与数据分类装置通信以将待分类数据发送至该数据分类装置进行分类

其中,该数据源可以是一个或者多个数据源,也即是说,待分类数据可以是多源数据,对此不作限制

[0025]在一个具体实例中,待分类数据例如可以是智慧园区数据,包括地图数据

设备设施数据

热力数据

行为数据以及其它任意可能的数据,而对应的数据源例如包括公司
(
集团
)、
地市

第三方等数据源,也即是说,本实施例的数据分类装置可以接入公司

地市

第三方等多源的待分类数据,对此不作限制

[0026]在实际应用中,对于非标协议的数据源,需要另行开发对接方式,因此会浪费大量的成本

鉴于此,本公开实施例可以针对不同数据源提供接入的标准规则,实现待分类数据统一接入

具体地,本实施例的标准规则例如包括接口规则
(
例如,
http+json
接口协议
)、
提交方式规则
(
例如,
POST
数据提交方式
)、
编码规则
(
例如,
UTF
‑8字符集
)
,并且还要求通过信令网关和媒体网关,将非标平台

编码设备
(
即,数据源
)
转换为符合
GB/T28181

2016
的标准协议,实现数据接入

联网,也即是说,本实施例的数据源采用“http+json
接口协议
、POST
数据提交方式
、UTF
‑8字符集”+“信令网关和媒体网关”的方式将待分类数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种数据分类方法,其特征在于,包括:从至少一个数据源获取待分类数据;利用预设的决策树模型对所述待分类数据进行分类,以确定第一类别数据;分别对所述第一类别数据进行聚类分析,以确定目标类别数据;以及将所述目标类别数据分别存储至对应的数据存储单元
。2.
根据权利要求1所述的方法,其特征在于,所述分别对所述第一类别数据进行聚类分析,以确定目标类别数据,包括:分别对所述第一类别数据进行二阶聚类分析,以确定第二类别数据;以及基于预设规则分别对所述第二类别数据进行分类,以确定所述目标类别数据
。3.
根据权利要求2所述的方法,其特征在于,所述分别对所述第一类别数据进行二阶聚类分析,以确定第二类别数据,包括:分别计算所述第一类别数据中数据之间的距离,并根据所述距离构建聚类特征树,其中,所述聚类特征树中每个叶子结点分别表示聚类类别;以及采用凝聚法对所述聚类类别再次进行聚类,并基于目标统计量确定所述第二类别数据
。4.
根据权利要求2所述的方法,其特征在于,所述基于预设规则分别对所述第二类别数据进行分类,以确定所述目标类别数据,包括:分别确定所述第二类别数据中每条数据的数据标签,并根据所述数据标签对所述第二类别数据进行分类以得到第三类别数据;确定所述第三类别数据的数据类型,其中,所述数据类型分为时间类型和非时间类型;将时间类型的第三类别数据分类为不同时间的目标类别数据,和
/
或将非时间类型的第三类别数据分类为不同维度的目标类别数据
。5.
根据权利要求1所述的方法,其特征在于,所述将所述目标类别数据分别存储至对应的数据存储单元,包括:对所述目标类别数据进行聚合统计分析,以确定聚合数据;以及将所述聚合数据...

【专利技术属性】
技术研发人员:程琦李莉香
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1