【技术实现步骤摘要】
数据分类方法、装置、设备及存储介质
[0001]本公开涉及数据处理
,尤其涉及一种数据分类方法
、
装置
、
设备及存储介质
。
技术介绍
[0002]目前,市场中针对智慧园区的解决方案主要以数据层
+
业务层
+
应用层的形式,提供事先开发封装好的各场景产品内容,通过可视化大屏
、PC
端和
H5
面向用户提供服务,用户在己有的场景产品中选择
。
其中,该过程中的数据层主要用于数据分类
。
然而,相关技术中数据分类精细程度有待提升,因此影响后续运营分析的效果
。
技术实现思路
[0003]本公开旨在至少在一定程度上解决相关技术中的技术问题之一
。
[0004]本公开第一方面实施例提出了一种数据分类方法,包括:从至少一个数据源获取待分类数据;利用预设的决策树模型对待分类数据进行分类,以确定第一类别数据;分别对第一类别数据进行聚类分析,以确定目标类别数据;以及将目标类别数据分别存储至对应的数据存储单元
。
[0005]本公开第二方面实施例提出了一种数据分类装置,包括:获取模块,用于从至少一个数据源获取待分类数据;分类模块,用于利用预设的决策树模型对待分类数据进行分类,以确定第一类别数据;聚类模块,用于分别对第一类别数据进行聚类分析,以确定目标类别数据;以及存储模块,用于将目标类别数据分别存储至对应的数据存储单元
。< ...
【技术保护点】
【技术特征摘要】
1.
一种数据分类方法,其特征在于,包括:从至少一个数据源获取待分类数据;利用预设的决策树模型对所述待分类数据进行分类,以确定第一类别数据;分别对所述第一类别数据进行聚类分析,以确定目标类别数据;以及将所述目标类别数据分别存储至对应的数据存储单元
。2.
根据权利要求1所述的方法,其特征在于,所述分别对所述第一类别数据进行聚类分析,以确定目标类别数据,包括:分别对所述第一类别数据进行二阶聚类分析,以确定第二类别数据;以及基于预设规则分别对所述第二类别数据进行分类,以确定所述目标类别数据
。3.
根据权利要求2所述的方法,其特征在于,所述分别对所述第一类别数据进行二阶聚类分析,以确定第二类别数据,包括:分别计算所述第一类别数据中数据之间的距离,并根据所述距离构建聚类特征树,其中,所述聚类特征树中每个叶子结点分别表示聚类类别;以及采用凝聚法对所述聚类类别再次进行聚类,并基于目标统计量确定所述第二类别数据
。4.
根据权利要求2所述的方法,其特征在于,所述基于预设规则分别对所述第二类别数据进行分类,以确定所述目标类别数据,包括:分别确定所述第二类别数据中每条数据的数据标签,并根据所述数据标签对所述第二类别数据进行分类以得到第三类别数据;确定所述第三类别数据的数据类型,其中,所述数据类型分为时间类型和非时间类型;将时间类型的第三类别数据分类为不同时间的目标类别数据,和
/
或将非时间类型的第三类别数据分类为不同维度的目标类别数据
。5.
根据权利要求1所述的方法,其特征在于,所述将所述目标类别数据分别存储至对应的数据存储单元,包括:对所述目标类别数据进行聚合统计分析,以确定聚合数据;以及将所述聚合数据...
【专利技术属性】
技术研发人员:程琦,李莉香,
申请(专利权)人:中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。