一种基于XML文档的元数据模式匹配方法组成比例

技术编号：8453109 阅读：229 留言：0更新日期：2013-03-21 17:39

本发明专利技术公开了一种基于XML文档的元数据模式匹配方法，通过计算两个元数据的语义相似度、属性相似度、实例相似度、结构相似度和关系相似度，根据具体的XML文档来设置权重，最后计算综合相似度，因此在元数据之间的模式匹配时，可使计算结果更精确。

全部详细技术资料下载

【技术实现步骤摘要】
—种基于XML文档的元数据模式匹配方法
本专利技术关于元数据模式匹配方面，特别涉及XML文档的元数据的语义、属性、实例、结构和关系相似度计算方法，属于数据库

技术介绍
扩展标记语言(extensible Markup Language,XML)是一套定义语义标记的规则，用户通过它可以创建文档类型定义(Document Type Def inition,简称DTD)的规则集,XML 作为统一的转换语法和交换格式，为开发者和用户提供一种交换元数据信息的标准途径，从而能够方便、简洁地在基于OMG UML的建模工具和基于OMG MOF的元数据仓储(Metadata Repository)之间交换元数据。而元数据则是关于数据的数据，用于描述要素、数据集或数据集系列的内容、覆盖范围、质量、管理方式、数据的所有者、数据的提供方式等有关的信息。近年来越来越多的科研院所都开始致力于元数据相关问题的研究，特别是随着语义Web 的发展，元数据理论及其相关技术已逐渐成为计算机领域中重要的研究热点，为了解决网络信息爆炸时代出现的诸多问题，元数据作为一种重要的应对方法和措施，已...

【技术保护点】
一种基于XML文档的元数据模式匹配方法，其特征在于，包括以下步骤：1）计算两个元数据的语义相似度：元数据a和元数据b之间的相似度通过字符串的同义词匹配来完成，计算模型如下所示：lex_sim(m1,m2)=Σi=1sΣj=1tsim(m1i,m2j)m*n式(1)其中其中m1i是元数据m1的第i个关键词，m2j是元数据m2的第j个关键词，s表示元数据m1的关键词个数，t表示元数据m2的关键词个数，sim(m1i,m2j)表示关键词m1i和m2j的相似度，如果m1i和m2j相同或为同义词，则sim(m1i,m2j)=1，否则为0；lex_sim(m1,m2)的取值范围为[...

【技术特征摘要】

【专利技术属性】
技术研发人员：朱晓燕，何金陵，潘留兴，赵鑫，
申请(专利权)人：江苏省电力公司信息通信分公司，江苏电力信息技术有限公司，江苏省电力公司，国家电网公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人