【技术实现步骤摘要】
本专利技术涉及万维网(World Wide Web)领域,尤其涉及一种。
技术介绍
语义网(Semantic Web)是万维网的一个重要发展方向,为万维网上的知识表示、推理、交换和复用提供了基础。随着语义网的快速发展,语义网的数据量已经达到了数以十亿计的规模。由于任何机构和个人都允许自由发布语义网数据,导致语义网数据具有多样性和异构性,常常造成多个不同的标识符指称真实世界中的相同对象。语义网中普遍存在的对象共指现象阻碍了语义网数据的共享和集成,不利于网络效应的发挥,造成了知识复用的困局。语义网中,对象共指的消解是指识别语义网中指称真实世界相同对象的不同标识符,并消除描述这些标识符的语义网数据之间不一致性的过程。例如,关于万维网专利技术人和语义网的倡导者TimBerners-Lee先生,迄今已发现数百个不同的URI (UniformResourceIdentifier)指称他。对于使用语义网数据的应用而言,对象共指的消解是消除数据之间语义异构性的一种有效途径,可以为应用之间的交互建立一种互操作性(interoperability)。传统的依赖人工判别的语义网对象共 ...
【技术保护点】
一种基于全局关键属性的语义网对象共指自动消解方法,其特征在于,包括下列步骤:1)语义网对象样本分类,将具有相同类型和付费域名的对象样本归类在一起;2)全局关键属性识别,针对具有相同类型和付费域名的一组语义网对象样本,识别出其中共指的对象样本集合和不共指的对象样本集合,计算上述两个集合中对象样本所含数据样本中属性间的相似度,统计识别全局关键属性;3)语义网对象共指消解,给定任意一个语义网对象,基于它的类型和付费域名,重用已识别出的全局关键属性,寻找具有相似关键属性值的其它对象,实现对象共指消解。
【技术特征摘要】
1.一种基于全局关键属性的语义网对象共指自动消解方法,其特征在于,包括下列步骤: 1)语义网对象样本分类,将具有相同类型和付费域名的对象样本归类在一起; 2)全局关键属性识别,针对具有相同类型和付费域名的一组语义网对象样本,识别出其中共指的对象样本集合和不共指的对象样本集合,计算上述两个集合中对象样本所含数据样本中属性间的相似度,统计识别全局关键属性; 3)语义网对象共指消解,给定任意一个语义网对象,基于它的类型和付费域名,重用已识别出的全局关键属性,寻找具有相似关键属性值的其它对象,实现对象共指消解。2.根据权利要求1所述的基于全局关键属性的语义网对象共指自动消解方法,其特征在于,其中步骤I)中对大量语义网对象样本进行分类的具体工作流程如下: 对于任意一个语义网对象样本,从其数据样本中识别或推理出它的类型;根据对象样本的标识符,判断其命名空间,进而获得付费域名; 将具有相同类型和付费域名的对象样本归为一类,实现对语义网对象样本的分类。3.根据权利要求1所述的基于全局关键属性的语义网对象共指自动消解方法,其特征在于,其中步骤2)中全局关键属性识别的具...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。