一种运用知识图谱技术实现目录资源推荐机制的方法技术

技术编号:39576551 阅读:8 留言:0更新日期:2023-12-03 19:27
本发明专利技术公开了一种运用知识图谱技术实现目录资源推荐机制的方法,步骤包括:在数据管理层面,一部分是基本单元模块:在数据编目的过程中填写基本的数据信息,以及总体概述性的描述;另外一部分是数据单元模块:包括数据的信息,是对单个数据的映射描述,单个数据的映射构成了整体的数据的数据整体的构成结构;定义基本单元模块和数据单元模块的各个维度,当比对两个数据目录时,比对两个数据的周边的图谱关系;用知识图谱来分析基本单元模块和数据单元模块来计算两个数据的相似度;把数据的基本信息和数据单元信息合并起来统计两个数据目录的数据的相似度,通过相似度的值来推荐搜索的数据

【技术实现步骤摘要】
一种运用知识图谱技术实现目录资源推荐机制的方法


[0001]本专利技术涉及智能编目技术,特别是一种运用知识图谱技术实现目录资源推荐机制的方法


技术介绍

[0002]在信息化,数字化极度发达的今天,我们每天每时每刻在网络上进行操作,都会留下数据的痕迹,会产生不同的使用的数据,也会在一些网站或者政府工作的平台录入一些数据,这些数据组成了丰富复杂的数据,并且这些数据在不断的更新和变化之中

在数据维护的工程中,数据目录是一种常见的使用手段,通过数据的编目可以数据进行管理和维护,方便用户能够查找数据,方便数据的维护以及数据串联数据之间的相关性

[0003]数据资源目录,最早是政务领域提出的概念,是为了“数据需求方使用数据而提供的检索支持”。
数据资源目录的原始驱动力是“政务数据资源共享”,是面向数据使用者的

工程实践落地,是从
2005
年国家政务数据交换

目录体系

四大库试点开始的,并在
2007
年正式发布国标:
《GB/T 21063

2007 政务信息资源目录体系
》。
[0004]政务数据资源目录是通过对政务信息资源依据规范的元数据描述,按照一定的分类方法进行排序和编码的一组信息,用以描述各个政务信息资源的特征,以便于对政务信息资源的检索

定位与获取

[0005]2007
年的国标给出的标准定义,站在现在政务数据治理的高度来看,原来的“目录体系”建设,仅仅是个工具而已,已经很单薄了,当前的“数据资源目录”,实际上可以和“数据资产管理”和“数据服务”结合在一起,才能有更好的发展前景

[0006]同时,在数据的管理和维护的过程中,也需要分析和使用一些数据以便更够更好的服务业务或者创造更多新的业务和服务,那么在寻找数据的过程中,快速的找到需要的数据就变得十分的重要

但是如何找到或者找全我们需要的数据,这也是一个十分困难的过程,因此寻找一种方法,能够快速的所需数据

[0007]目前使用的技术是通过目录去维护数据的管理,通过关键字的搜索可以快速的查询到自己所需要的数据

但是很难了解数据的相关信息,也不能快速并且准确的查找到自己所需要的数据,需要通过一步步检索

查看,才能找到自己所需数据

这种方法非常的繁琐,效率非常低,同时也有可能找不到所需数据


技术实现思路

[0008]针对现有技术中存在的问题,本专利技术提供了一种利用图谱关联性的功能,推荐符合条件的更合适的数据,解决在搜索数据的时候,找寻相似数据,能够更加准确的推荐符合预期的相似数据,同时还可以检查是否重复编目的运用知识图谱技术实现目录资源推荐机制的方法

[0009]本专利技术的目的通过以下技术方案实现

[0010]一种运用知识图谱技术实现目录资源推荐机制的方法,步骤包括:
步骤1:在数据管理层面,一部分是基本单元模块:在数据编目的过程中填写基本的数据信息,以及总体概述性的描述,这些数据统称为数据的总体信息;另外一部分是数据单元模块:包括数据的信息,是对单个数据的映射描述,单个数据的映射构成了整体的数据的数据整体的构成结构;步骤2:定义基本单元模块和数据单元模块的各个维度,当比对两个数据目录时,比对两个数据的周边的图谱关系;步骤3:用知识图谱来分析基本单元模块和数据单元模块来计算两个数据的相似度;步骤4:把数据的基本信息和数据单元信息合并起来统计两个数据目录的数据的相似度,通过相似度的值来推荐搜索的数据

[0011]所述步骤2具体为:定义基本单元模块和数据单元模块的各个维度:一个部分是数据的基本信息,颗粒度包括术语

标签

数据量大小

部门;整体的各个维度信息定义为
n1,
n2,
n3,
n4,


n
m
各个维度,定义这些信息维度占比为整体的
1/2
,当比对两个数据目录时,比对这些数据的周边的图谱关系,定义数据的数据
a

b
的周边关系分别:
a
周边的周边关系为
a1,
a2,
a3,


a
n

b
周边的周边关系为
b1,
b2,
b3,


b
m
,如果两个节点相同,那么这两个节点在图谱上是关联上相同的节点,那么计算这两个数据目录之间的百分比为:当先通电为
z
,那么概率为:
z/m
或者
n
;当
m>n
,那么概率为
z/m
,当
m<n, 那么概率为
z/n
,那么基本信息的相似度为
1/2*

z/n
)或者
1/2*

z/m


[0012]所述步骤3具体为:计算细节数据之间的相似度,单个单元数据也会关联一些基础信息,包括标准的数据元信息,模型信息,术语信息,当两个数据能够在图谱上关联的方面有
q
个节点,那么分别计算
a

b
两个目录数据的相似度,
a
的数据单元分别为
a1,
a2,
a
3.



a
n ,
b
的数据单元为
b1,
b2,
b
3.



b
m
,那么
ab
组在每个单元的相似度计算分别为:当
n>m

ab1:
q
个节点,
x
ab1
个相同,那么 ab1= x
ab1
/q

ab2= x
ab2
/q

ab3= x
ab3
/q,
……
,ab
m
= x
abm /q
,整个数据单元部分的相似度为(
ab1+ ab2+ ab3+
……
+ab
m

/n
,数据单元部分为
1/2*

ab1+ ab2+ ab3+
……
+ab
m

/n<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种运用知识图谱技术实现目录资源推荐机制的方法,其特征在于步骤包括:步骤1:在数据管理层面,一部分是基本单元模块:在数据编目的过程中填写基本的数据信息,以及总体概述性的描述,这些数据统称为数据的总体信息;另外一部分是数据单元模块:包括数据的信息,是对单个数据的映射描述,单个数据的映射构成了整体的数据的数据整体的构成结构;步骤2:定义基本单元模块和数据单元模块的各个维度,当比对两个数据目录时,比对两个数据的周边的图谱关系;步骤3:用知识图谱来分析基本单元模块和数据单元模块来计算两个数据的相似度;步骤4:把数据的基本信息和数据单元信息合并起来统计两个数据目录的数据的相似度,通过相似度的值来推荐搜索的数据
。2.
根据权利要求1所述的一种运用知识图谱技术实现目录资源推荐机制的方法,其特征在于所述步骤2具体为:定义基本单元模块和数据单元模块的各个维度:一个部分是数据的基本信息,颗粒度包括术语

标签

数据量大小

部门;整体的各个维度信息定义为
n1,
n2,
n3,
n4,


n
m
各个维度,定义这些信息维度占比为整体的
1/2
,当比对两个数据目录时,比对这些数据的周边的图谱关系,定义数据的数据
a

b
的周边关系分别:
a
周边的周边关系为
a1,
a2,
a3,


a
n

b
周边的周边关系为
b1,
b2,
b3,


b
m
,如果两个节点相同,那么这两个节点在图谱上是关联上相同的节点,那么计算这两个数据目录之间的百分比为:当先通电为
z
,那么概率为:
z/m
或者
n
;当
m&gt;n
,那么概率为
z/m
,当
m&lt;n,
那么概率为
z/n
,那么基本信息的相似度为
1/2*

z/n
)或者
1/2*

z/m

。3. 根据权利要求1所述的一种运用知识图谱技术实现目录资源推荐机制的方法,其特征在于所述步骤3具体为:计算细节数据之间的相似度,单个单元数据也会关联一些基础信息,包括标准的数据元信息,模型信息,术语信息,当两个数据能够在图谱上关联的方面有
q
个节点,那么分别计算
a

b
两个目录数据的相似度,
a
的数据单元分别为
a1,
a2,
a
3.



a
n

b
的数据单元为
b1,
b2,
...

【专利技术属性】
技术研发人员:杜雅文
申请(专利权)人:江苏数兑科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1