一种基于知识图谱技术的数据智能分类技术制造技术

技术编号:35539115 阅读:24 留言:0更新日期:2022-11-09 15:06
本发明专利技术公开了一种基于知识图谱技术的数据智能分类技术,通过血缘关系构建知识图谱,并根据社群发现算法,将待分类的数据划分为若干群组;提取若干群组中每个群组的第一特征;对现有族群进行特征提取,获得每个群组的第二特征;根据聚类算法构建特征匹配模型,并将第一特征与第二特征进行匹配,根据匹配结果对待分类数据进行自动分类;通过用户进行人工纠偏,分析数据分类的准确性以及关键控制点;基于以上对数据信息的分类及分析,持续完善对机器的学习,不断提高数据分类的准确度,并降低由人工分类耗费的成本与精力。由人工分类耗费的成本与精力。由人工分类耗费的成本与精力。

【技术实现步骤摘要】
一种基于知识图谱技术的数据智能分类技术


[0001]本专利技术涉及增强数据管理领域,特别是涉及一种基于知识图谱技术的数据智能分类技术。

技术介绍

[0002]数据分类分级管理,是目前被公认为行之有效的数据管理手段,但是数据的分类,目前仍然是通过人工方式进行数据划分,而人工划分数据的方式常常会使数据出现很多纰漏,并且也会耗费大量的时间与精力成本,使数据管理产生较大的不便,同时也在降低数据治理的智能化进程。
[0003]随着大数据在各行各业的广泛渗透,其种类和形式也越来越多样化,因此,对于数据的分类分级管理成为现阶段的研究热点,通常情况下,数据具有内容要素种类差距大,数据来源广泛的特点,因此,对其进行分类时,主要是要对数据之间的内在关系进行准确识别,以此作为数据分类的基础,但是由于多源数据包含的数据内容以及结构更加多样化,其特征差异也较大,因此,在对其进行分类时,难度也比较大。

技术实现思路

[0004]本专利技术提供一种基于知识图谱技术的数据智能分类技术,以解决现有技术中存在的上述问题。
[0005]与现有技术相比本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱技术的数据智能分类技术,其特征在于,包括以下骤;步骤S100,基于数据血缘关系构建知识图谱,并通过知识图谱的社群发现算法,将待分类数据划分为若干个群组;提取若干个群组中每个群组的第一特征;步骤S200,对现有族群进行特征提取,获得每个族群的第二特征;步骤S300,基于机器学习聚类算法构建特征匹配模型,基于所述特征匹配模型对第一特征和第二特征进行匹配,根据匹配结果对待分类数据进行自动分类。2.根据权利要求1所述的一种基于知识图谱技术的数据智能分类技术,其特征在于,所述步骤S300包括:基于机器学习聚类算法将第二特征与第一特征进行匹配,若匹配成功,将该匹配成功的群组中所有待分类数据划分为相应的现有族群中;若匹配不成功,对待分类数据进行进一步细化划分,形成若干个细化群组,提取每个细化群组的第三特征,将第三特征与第一特征进行匹配,若匹配成功,将该细化群组中所有待分类数据划分为对应的族群中,若匹配不成功,则重复对待分类数据的进一步细化划分的步骤,直至将待分类数据全部自动分类至现有的族群中。3.根据权利要求1所述的一种基于知识图谱技术的数据智能分类技术,其特征在于,所述步骤S300之后还包括:步骤S400,通过用户进行人工纠偏,分析数据信息分类的准确性以及关键控制点;步骤S500,基于以上对数据信息的分类及分析,将分类及分析结果作为机器学习分类算法的优化因素输入至所述特征匹配模型。4.根据权利要求1所述的一种基于知识图谱技术的数据智能分类技术,其特征在于,所述步骤S100中,通过知识图谱的社群发现算法,将待分类数据划分为若干个群组,包括:知识图谱架构:知识图谱的架构分为逻辑结构与体系结构,其中,逻辑结构主要包括数据层和模式层;知识图谱构建方式:运用自底向上的构建方式,首先从公开的连接中提取实体,然后将置信度较高的实体添加到知识库中,再构建顶层本体;数据信息采集:通过获取数据,结合社群发现算法,以手工和半自动化的方式,进行数据采集,经过知识抽取、知识融合形成统一的知识数据信息,并划分为若干个群组。5.根据权利要求1所述的一种基于知识图谱技术的数据智能分类技术,其特征在于,包括;步骤S100包括:计算待分类数据的唯一值、最大值、最小值、类型、关联的标准,根据已构建的数据血缘关系,使用社群发现算法,对待分类数据进行聚类,根据聚类算法形成新的族群;步骤S200包括:,对现有族群分类的数据,系统将提取出现有族群分类下的数据的总体特征,设定为第二特征。6.根据权利要求1所述的一种基于知识图谱技术的数据智能分类技术,其特征在于,所述步骤S300中,基于机器学习分类算法构建特征匹配模型,包括:对大量未知标注的...

【专利技术属性】
技术研发人员:金震张京日穆宇浩
申请(专利权)人:北京三维天地科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1