【技术实现步骤摘要】
一种运用知识图谱技术实现目录资源推荐机制的方法
[0001]本专利技术涉及智能编目技术,特别是一种运用知识图谱技术实现目录资源推荐机制的方法
。
技术介绍
[0002]在信息化,数字化极度发达的今天,我们每天每时每刻在网络上进行操作,都会留下数据的痕迹,会产生不同的使用的数据,也会在一些网站或者政府工作的平台录入一些数据,这些数据组成了丰富复杂的数据,并且这些数据在不断的更新和变化之中
。
在数据维护的工程中,数据目录是一种常见的使用手段,通过数据的编目可以数据进行管理和维护,方便用户能够查找数据,方便数据的维护以及数据串联数据之间的相关性
。
[0003]数据资源目录,最早是政务领域提出的概念,是为了“数据需求方使用数据而提供的检索支持”。
数据资源目录的原始驱动力是“政务数据资源共享”,是面向数据使用者的
。
工程实践落地,是从
2005
年国家政务数据交换
、
目录体系
、
四大库试点开始的,并在
2007
年正式发布国标:
《GB/T 21063
‑
2007 政务信息资源目录体系
》。
[0004]政务数据资源目录是通过对政务信息资源依据规范的元数据描述,按照一定的分类方法进行排序和编码的一组信息,用以描述各个政务信息资源的特征,以便于对政务信息资源的检索
、
定位与获取
。
[0005]2007
年的 ...
【技术保护点】
【技术特征摘要】
1.
一种运用知识图谱技术实现目录资源推荐机制的方法,其特征在于步骤包括:步骤1:在数据管理层面,一部分是基本单元模块:在数据编目的过程中填写基本的数据信息,以及总体概述性的描述,这些数据统称为数据的总体信息;另外一部分是数据单元模块:包括数据的信息,是对单个数据的映射描述,单个数据的映射构成了整体的数据的数据整体的构成结构;步骤2:定义基本单元模块和数据单元模块的各个维度,当比对两个数据目录时,比对两个数据的周边的图谱关系;步骤3:用知识图谱来分析基本单元模块和数据单元模块来计算两个数据的相似度;步骤4:把数据的基本信息和数据单元信息合并起来统计两个数据目录的数据的相似度,通过相似度的值来推荐搜索的数据
。2.
根据权利要求1所述的一种运用知识图谱技术实现目录资源推荐机制的方法,其特征在于所述步骤2具体为:定义基本单元模块和数据单元模块的各个维度:一个部分是数据的基本信息,颗粒度包括术语
、
标签
、
数据量大小
、
部门;整体的各个维度信息定义为
n1,
n2,
n3,
n4,
…
,
n
m
各个维度,定义这些信息维度占比为整体的
1/2
,当比对两个数据目录时,比对这些数据的周边的图谱关系,定义数据的数据
a
和
b
的周边关系分别:
a
周边的周边关系为
a1,
a2,
a3,
…
,
a
n
;
b
周边的周边关系为
b1,
b2,
b3,
…
,
b
m
,如果两个节点相同,那么这两个节点在图谱上是关联上相同的节点,那么计算这两个数据目录之间的百分比为:当先通电为
z
,那么概率为:
z/m
或者
n
;当
m>n
,那么概率为
z/m
,当
m<n,
那么概率为
z/n
,那么基本信息的相似度为
1/2*
(
z/n
)或者
1/2*
(
z/m
)
。3. 根据权利要求1所述的一种运用知识图谱技术实现目录资源推荐机制的方法,其特征在于所述步骤3具体为:计算细节数据之间的相似度,单个单元数据也会关联一些基础信息,包括标准的数据元信息,模型信息,术语信息,当两个数据能够在图谱上关联的方面有
q
个节点,那么分别计算
a
,
b
两个目录数据的相似度,
a
的数据单元分别为
a1,
a2,
a
3.
,
…
,
a
n
,
b
的数据单元为
b1,
b2,
...
【专利技术属性】
技术研发人员:杜雅文,
申请(专利权)人:江苏数兑科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。