一种开源数据归类方法技术

技术编号:41252125 阅读:21 留言:0更新日期:2024-05-10 00:00
本申请涉及一种开源数据归类方法,涉及数据存储技术的领域,该方法包括获取数据目标地址以及目标地址数量;若目标地址数量不为一,则根据数据目标地址于树状分类图中不断向上级回溯确定数据回溯地址,且当不同数据目标地址相对应的数据回溯地址重合时停止回溯并将相对应的数据回溯地址定义为数据分叉地址;根据数据目标地址回溯情况确定分叉数量,并根据分叉数量以及目标地址数量确定分叉占比;根据排序规则确定数值最大的分叉占比,并将该分叉占比相对应的数据目标地址定义为比较目标地址;于比较目标地址中根据选择规则以确定唯一的实际目标地址,并根据该实际目标地址将当前数据进行划分。本申请具有减少数据出现划分不准确的情况的效果。

【技术实现步骤摘要】

本申请涉及数据存储技术的领域,尤其是涉及一种开源数据归类方法


技术介绍

1、开源数据是指提供给公众免费使用的数据集,它们通常是由个人、团队或组织公开发布,并允许任何人免费下载、使用、修改和分发。这些数据集可能包括各种类型的数据,如文本、图像、音频、视频等,为了便于对开源数据进行管理,需要对数据集进行分类处理,常见的分类方法有根据数据类型进行分类、根据数据来源进行分类以及根据数据用途进行分类等。

2、相关技术中,在利用数据类型对开源数据进行分类处理时,会设定多个大类,例如建筑材料、音乐器具等等,再在每个大类中设置若干小类,通过小类中不断添加小类的方式实现树状分类图,以有效的对开源数据进行划分。

3、针对上述中的相关技术,专利技术人认为在数据划分过程中,可能会出现部分数据中存在多种类数据的情况,此时该数据会随机的划分于其中的一个数据集中,会导致部分数据划分不准确。


技术实现思路

1、为了减少数据出现划分不准确的情况,本申请提供一种开源数据归类方法。

2、第一方面,本申请提供一本文档来自技高网...

【技术保护点】

1.一种开源数据归类方法,其特征在于,包括:

2.根据权利要求1所述的开源数据归类方法,其特征在于,于分叉占比确定后,开源数据归类方法还包括:

3.根据权利要求2所述的开源数据归类方法,其特征在于,于选择参数确定后,开源数据归类方法还包括:

4.根据权利要求2所述的开源数据归类方法,其特征在于,于自身比较信号输出后,开源数据归类方法还包括:

5.根据权利要求1所述的开源数据归类方法,其特征在于,于比较目标地址中根据预设的选择规则以确定唯一的实际目标地址的步骤包括:

6.根据权利要求5所述的开源数据归类方法,其特征在于,于类似数量...

【技术特征摘要】

1.一种开源数据归类方法,其特征在于,包括:

2.根据权利要求1所述的开源数据归类方法,其特征在于,于分叉占比确定后,开源数据归类方法还包括:

3.根据权利要求2所述的开源数据归类方法,其特征在于,于选择参数确定后,开源数据归类方法还包括:

4.根据权利要求2所述的开源数据归类方法,其特征在于,于自身比较...

【专利技术属性】
技术研发人员:王运成刘长波于士国
申请(专利权)人:山东三木众合信息科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1