一种基于XML文档的元数据模式匹配方法组成比例

技术编号:8453109 阅读:229 留言:0更新日期:2013-03-21 17:39
本发明专利技术公开了一种基于XML文档的元数据模式匹配方法,通过计算两个元数据的语义相似度、属性相似度、实例相似度、结构相似度和关系相似度,根据具体的XML文档来设置权重,最后计算综合相似度,因此在元数据之间的模式匹配时,可使计算结果更精确。

【技术实现步骤摘要】
—种基于XML文档的元数据模式匹配方法
本专利技术关于元数据模式匹配方面,特别涉及XML文档的元数据的语义、属性、实例、结构和关系相似度计算方法,属于数据库

技术介绍
扩展标记语言(extensible Markup Language,XML)是一套定义语义标记的规则, 用户通过它可以创建文档类型定义(Document Type Def inition,简称DTD)的规则集,XML 作为统一的转换语法和交换格式,为开发者和用户提供一种交换元数据信息的标准途径, 从而能够方便、简洁地在基于OMG UML的建模工具和基于OMG MOF的元数据仓储(Metadata Repository)之间交换元数据。而元数据则是关于数据的数据,用于描述要素、数据集或数据集系列的内容、覆盖范围、质量、管理方式、数据的所有者、数据的提供方式等有关的信息。近年来越来越多的科研院所都开始致力于元数据相关问题的研究,特别是随着语义Web 的发展,元数据理论及其相关技术已逐渐成为计算机领域中重要的研究热点,为了解决网络信息爆炸时代出现的诸多问题,元数据作为一种重要的应对方法和措施,已广泛应用于信息检索、本文档来自技高网...

【技术保护点】
一种基于XML文档的元数据模式匹配方法,其特征在于,包括以下步骤:1)计算两个元数据的语义相似度:元数据a和元数据b之间的相似度通过字符串的同义词匹配来完成,计算模型如下所示:lex_sim(m1,m2)=Σi=1sΣj=1tsim(m1i,m2j)m*n式(1)其中其中m1i是元数据m1的第i个关键词,m2j是元数据m2的第j个关键词,s表示元数据m1的关键词个数,t表示元数据m2的关键词个数,sim(m1i,m2j)表示关键词m1i和m2j的相似度,如果m1i和m2j相同或为同义词,则sim(m1i,m2j)=1,否则为0;lex_sim(m1,m2)的取值范围为[...

【技术特征摘要】

【专利技术属性】
技术研发人员:朱晓燕何金陵潘留兴赵鑫
申请(专利权)人:江苏省电力公司信息通信分公司江苏电力信息技术有限公司江苏省电力公司国家电网公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1