一种数据目录的分类方法、装置、系统、设备和存储介质制造方法及图纸

技术编号:36538897 阅读:12 留言:0更新日期:2023-02-01 16:31
本发明专利技术提供了一种数据目录的分类方法、装置、系统、设备和存储介质,可以获取待分类的空间数据文件,然后将待分类的空间数据文件转换为预设格式的数据文件。将包含属性数据的预设格式的文档输入至预先构建的目录分类模型中进行目录类别识别,以得到和属性数据相匹配的目录类别。将目录分类模型输出的目录类别和待分类的空间数据文件相关联后存储。该数据目录的分类方法可将预处理后得到的属性数据直接通过目录分类模型进行目录分类的识别,实现了空间数据的自动分类,不再依靠人工进行目录的识别,在节省人工成本的同时,提高了分类效率。提高了分类效率。提高了分类效率。

【技术实现步骤摘要】
一种数据目录的分类方法、装置、系统、设备和存储介质


[0001]本专利技术涉及数据处理
,具体涉及一种数据目录的分类方法、装置、系统、设备和存储介质。

技术介绍

[0002]在进行自然资源信息规划时,数据目录是探索和使用数据的主要方式,数据目录包含数据的分类,主要包括大类和小类的划分,比如大类包括管理数据、规划数据、现状数据等。往下还会有细分的小类,比如现状数据下有水资源、海洋、气候、灾害等。规划数据下有土地利用规划、城乡规划、林地规划等,管理数据下有不动产登记、自然资源确权登记等,目录下的分类是非常多的。在分类存储时需要通过人工识别出数据所属的类别后,再放入对应的分类目录下。而自然资源体系下的数据来源以及数据目录的分类体系呈现越来越复杂的趋势,通过人工识别来生产数据目录的方式不仅成本高而且效率低。

技术实现思路

[0003]为了解决现有技术存在的成本高、效率低的问题,本专利技术提供了一种数据目录的分类方法、装置、系统、设备和存储介质,其具有自动分类、效率更高等特点。
[0004]根据本专利技术具体实施方式提供的一种数据目录的分类方法,包括:
[0005]获取待分类的空间数据文件;
[0006]将所述待分类的空间数据文件转换为预设格式的数据文件,所述预设格式的数据文件中具有表征空间数据特征的属性数据;
[0007]将所述预设格式的数据文件输入至预先构建的目录分类模型中进行目录类别识别,以得到和所述属性数据相匹配的目录类别;
[0008]将所述目录分类模型输出的所述目录类别和所述待分类的空间数据文件相关联后存储。
[0009]进一步地,所述将所述预设格式的数据文件输入至预先构建的目录分类模型中进行目录类别识别,以得到和所述属性数据相匹配的目录类别,包括:
[0010]基于机器学习算法构建至少两个初始分类模型;
[0011]基于分类训练数据集合对每个所述初始分类模型分别进行训练和测试;
[0012]将所述预设格式的数据文件输入至正确率最高的初始分类模型中进行目录类别识别,以得到和所述属性数据相匹配的目录类别。
[0013]进一步地,所述基于分类训练数据集合对每个所述初始分类模型分别进行训练和测试,包括:
[0014]将所述分类训练数据集中的一部分数据进行每个所述初始分类模型的训练,另一部分数据进行每个所述初始分类模型的测试,所述分类训练数据集中每个包含属性数据的文档具有唯一的目标标签。
[0015]进一步地,所述基于分类训练数据集合对每个所述初始分类模型分别进行训练和
测试,还包括:
[0016]若得到的每个所述初始分类模型的正确率均小于预设阈值,则重新调整所述分类训练数据集合中的数据构成后,基于调整后的分类训练数据集合对每个所述初始分类模型进行训练和测试。
[0017]进一步地,所述将所述目录分类模型输出的所述目标类别和所述待分类的空间数据文件相关联后存储,包括:
[0018]将所述目录类别作为键,所述待分类的空间数据文件的标识作为与所述键相对应的值存储至数据库中。
[0019]根据本专利技术具体实施方式提供的一种数据目录的分类装置,包括:
[0020]文件获取模块,用于获取待分类的空间数据文件;
[0021]格式转换模块,用于将所述待分类的空间数据文件转换为预设格式的数据文件,所述预设格式的数据文件中具有表征空间数据特征的属性数据;
[0022]目录分类模块,用于将所述预设格式的数据文件输入至预先构建的目录分类模型中进行目录类别识别,以得到和所述属性数据相匹配的目录类别;以及
[0023]数据存储模块,用于将所述目录分类模型输出的所述目标类别和所述待分类的空间数据文件相关联后存储。
[0024]根据本专利技术具体实施方式提供的一种数据目录的分类系统,包括:用户终端和服务器,所述服务器中设有如上所述的数据目录的分类装置,所述用户终端用于将用户输入的待分类的空间数据文件发送至所述服务器,并接收所述服务器发送的目录类别。
[0025]根据本专利技术具体实施方式提供的一种设备,包括:存储器和处理器;
[0026]所述存储器,用于存储程序;
[0027]所述处理器,用于执行所述程序,实现如上所述的数据目录的分类方法的各个步骤。
[0028]根据本专利技术具体实施方式提供的一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如山所述的数据目录的分类方法的各个步骤。
[0029]本专利技术所提供的数据目录的分类方法,可以获取待分类的空间数据文件,然后将待分类的空间数据文件转换为预设格式的数据文件。将包含属性数据的预设格式的文档输入至预先构建的目录分类模型中进行目录类别识别,以得到和属性数据相匹配的目录类别。将目录分类模型输出的目录类别和待分类的空间数据文件相关联后存储。该数据目录的分类方法可将预处理后得到的属性数据直接通过目录分类模型进行目录分类的识别,实现了空间数据的自动分类,不再依靠人工进行目录的识别,在节省人工成本的同时,提高了分类效率。
附图说明
[0030]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0031]图1是根据一示例性实施例提供的数据目录的分类方法的流程图;
[0032]图2是根据一示例性实施例提供的目录分类模型的构建流程图;
[0033]图3是根据一示例性实施例提供的数据目录的分类装置的结构图;
[0034]图4是根据一示例性实施例提供的数据目录的分类系统的结构图;
[0035]图5是根据一示例性实施例提供的设备的结构图。
具体实施方式
[0036]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0037]参照图1所示,本专利技术的实施例提供了一种数据目录的分类方法,该方法可以包括以下步骤:
[0038]101、获取待分类的空间数据文件。
[0039]在自然资源领域的规划中最常使用的就是某块区域的空间数据,按照数据业务类型来说,空间数据可包含土地资源、矿产资源、地质环境、不动产、海洋等空间数据。按照数据类型来说可包含文本坐标空间数据、栅格图形数据、矢量图形数据、图纸扫描件档案等。在空间数据中包含了该区域的特征数据,可以表明该区域的特征。
[0040]102、将待分类的空间数据文件转换为预设格式的数据文件。
[0041]因为空间数据文件常用的为.shp后缀的文件,需要将该类型的文件转换为geoj本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据目录的分类方法,其特征在于,包括:获取待分类的空间数据文件;将所述待分类的空间数据文件转换为预设格式的数据文件,所述预设格式的数据文件中具有表征空间数据特征的属性数据;将所述预设格式的数据文件输入至预先构建的目录分类模型中进行目录类别识别,以得到和所述属性数据相匹配的目录类别;将所述目录分类模型输出的所述目录类别和所述待分类的空间数据文件相关联后存储。2.根据权利要求1所述的方法,其特征在于,所述将所述预设格式的数据文件输入至预先构建的目录分类模型中进行目录类别识别,以得到和所述属性数据相匹配的目录类别,包括:基于机器学习算法构建至少两个初始分类模型;基于分类训练数据集合对每个所述初始分类模型分别进行训练和测试;将所述预设格式的数据文件输入至正确率最高的初始分类模型中进行目录类别识别,以得到和所述属性数据相匹配的目录类别。3.根据权利要求2所述的方法,其特征在于,所述基于分类训练数据集合对每个所述初始分类模型分别进行训练和测试,包括:将所述分类训练数据集中的一部分数据进行每个所述初始分类模型的训练,另一部分数据进行每个所述初始分类模型的测试,所述分类训练数据集中每个包含属性数据的文档具有唯一的目标标签。4.根据权利要求2所述的方法,其特征在于,所述基于分类训练数据集合对每个所述初始分类模型分别进行训练和测试,还包括:若得到的每个所述初始分类模型的正确率均小于预设阈值,则重新调整所述分类训练数据集合中的数据构成后,基于调整后的分类训练...

【专利技术属性】
技术研发人员:肖静罗亚杨龙白富权于海昕韩晓峰张永朋
申请(专利权)人:上海数慧系统技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1