一种地理本体要素实例属性相似度的计算方法技术

技术编号:16528920 阅读:36 留言:0更新日期:2017-11-09 20:39
本发明专利技术公开了一种地理本体要素实例属性相似度的计算方法,包括以下步骤:将基础地理信息数据库转换为大规模地理本体库,构造地理本体;遍历地理本体构建关键属性对集合和辅助属性对集合;分别计算两个实例中关键属性对相似度和辅助属性相似度计算两个实例的综合相似度。该方法在计算要素实例相似度方面有更高的准确性。

【技术实现步骤摘要】
一种地理本体要素实例属性相似度的计算方法
本专利技术涉及语义相似度计算领域,具体实现地理本体要素实例属性相似度的计算方法。
技术介绍
目前在计算语言学与人工智能等领域中,相似性度量是实现知识共享、数据集成、信息检索等重要方法之一[1]。随着语义网的发展,越来越多的研究机构和企业开始用本体描述其所在领域的数据及语义。然而,本体之间由于构造目的、认识视角、构造方法等的不同,容易出现本体间共享瓶颈的问题[2]。本体由实例数据和概念数据组成,因此本体相似性计算包括本体模式(包括概念和属性)相似性计算和本体实例相似性计算。本体概念之间匹配的方法与模型大致可分为基于字符串[3-5]、基于语义距离[6-8]、基于外部特征[9]、基于信息内容[10-12]与基于本体属性[13]等5类相似性算法。基于字符串的模型通常用于辅助计算其他模型计算相似度。基于外部特征模型未比较概念的本质属性相似性,容易在某些情况下容易被外在特征相同但本质并不完全相同的概念影响相似度结果。基于信息内容模型需要借助语料库。基于语义距离模型受本体结构影响大。针对概念的相似度算法的实质是对本体中的描述性信息进行二次加工,脱离了数据的事实基础。而基于实例的方法,不需要考虑本体结构的影响,不需要借助语料库,充分利用实例属性数据集,对实例数据规模大的本体进行相似性计算。文献[14]在实例匹配前需要完成模式匹配,将相关本体转换为相同的本体模式。文献[15]仅仅针对字符串类型属性的相似性计算,覆盖面小。本文不需要进行模式匹配且对多种数据类型的属性进行相似性计算。本文提出一种地理本体要素实例属性相似度的计算方法。通过对地理本体要素实例属性构建映射表,将属性集合分为关键属性对集合和辅助属性对集合。从关键属性对集合中提取出实例类别信息、实例尺度信息和辅助信息;从辅助属性对集合中提取出辅助信息,针对不同的信息类型采用不同的计算方法,最后综合要素实例属性的相似度计算要素实例的语义相似度。参考文献[1]马雷雷,梁汝鹏,李宏伟等.一种基于描述逻辑的空间语义相似性计算方法[J].测绘科学技术学报,2015,32(2):197-201.(MALeilei,LIANGRupeng,LIHongwei,etc.AMethodofGeospatialSemanticSimilarityMeasurementBasedonDescriptionLogic[J].JournalofGeomaticsScienceandTechnology,2015,32(2):197-201.)[2]索俊锋,刘勇,邹松兵.基于地理本体的综合语义相似度算法[J].兰州大学学报:自然科学版,2017,53(1):19-27.(SuoJun-feng,LiuYong,ZouSong-bing.Weightedsemanticsimilarityaigorithmbasedongeographicontology[J].JournalofLanzhouUniversity:NaturalSciences,2017,53(1):19-27.)[3]DHYANID,NGWK,BHOWMICKSS.ASurveyofWebMetrics[J].ACMComputerSurveying,2002,34(4):469_503.[4]WANGYuan,WUXiaobin.ComputerProcessingofPost-ControlIndexing[J].NewTechnologyofLibraryandInformationScience,1993(2):4-7.(王源,吴晓滨.后控规范的计算机处理[J].现代图书情报技术,1993(2):4-7.)[5]WUZhiqiang.TheDevelopmentofPost-ControlWordsduringEconomicalInformationRetrieval[D].Nanjing:NanjingAgricultruralUniversity,1999.(吴志强.经济信息检索后控制词表的研制[D].南京:南京农业大学,1999.)[6]D’ULIZIAA.ApproximatingGeographicalQueries[J].JournalofComputerScienceandTechnology,2009,24(6):1109-1124.[7]DAOUDM,TAMINEL,BOUGHANEMM.APersonalizedSearchUsingaSemanticDistanceMeasureinaGraph-basedRankingModel[J].JournalofInformationScience,2011,37(6):614-636.[8]LIUH,BAOH,XUD.ConceptVectorforSemanticSimilarityandRelatednessBasedonWordnetStructure[J].JournalofSystemsandSoftware,2012,85(2):370-381.[9]TVERSKYA.FeaturesofSimilarity[J].PsychologicalReview,1977,84(4):327.[10]RESNIKP.UsingInformationContentofEvaluateSemanticSimilarityinaTaxonomy[C]//Proceedingsofthe14thInternationalJointConferenceonArtificialIntelligence(IJCAI-95).SanFrancisco:MorganKaufmann,1995:448-453.[11]LIND.AnInformation-TheoreticDefinitionofSimilarty[C].SanFrancisco:MorganKaufmann,1998:296-304.[12]LORDPW.InvestigatingSemanticSimilarityMeasuresacrosstheGeneOntology:TheRelationshipbetweenSequenceandAnnotation[J].Bioinformatics,2003,19(10):1275-1283.[13]宋亚楠,仲茜,钟远.基于多属性的本体实例匹配算法[J].计算机工程,2011,37(13):63-65.(SONGYa-nan,ZHONGQian,ZHONGYuan.OntologyInstanceMatchingAlgrithmBasedonMulti-property[J].ComputerEngineering,2011,37(13):63-65.)[14]游妍,徐博艺,谢诚.基于实例相似度的概念语义挖掘方法[J].计算机工程,2014,40(10):219-223.(YOUYan,XUBo-yi,XIECheng.ConceptSematicMiningMethodBasedonInstanceSimilarty[J].ComputerEngineering,2014,40(10):21本文档来自技高网...

【技术保护点】
一种地理本体要素实例属性相似度的计算方法,其特征在于:包括以下步骤:S1,将基础地理信息数据库转换为大规模地理本体库,构造地理本体Os;S2,遍历地理本体Os,得到本体中所有实例的属性集合,针对任意两个实例I1、I2中的属性集合P、Q,建立映射关系,通过映射表构建关键属性对集合W1和辅助属性对集合W2;所述关键属性对集合W1中存储两个实例中具有相同名称和数值类型的属性对,所述辅助属性对集合W2中存储实例中不同名称但数值类型相同的属性对;S3,根据实例属性特征将关键属性对集合中的属性对分为实例类别属性对子集C、实例尺度属性对子集G以及辅助属性对子集A,即W1={C,G,A},则两个实例的关键属性集合分别为P

【技术特征摘要】
1.一种地理本体要素实例属性相似度的计算方法,其特征在于:包括以下步骤:S1,将基础地理信息数据库转换为大规模地理本体库,构造地理本体Os;S2,遍历地理本体Os,得到本体中所有实例的属性集合,针对任意两个实例I1、I2中的属性集合P、Q,建立映射关系,通过映射表构建关键属性对集合W1和辅助属性对集合W2;所述关键属性对集合W1中存储两个实例中具有相同名称和数值类型的属性对,所述辅助属性对集合W2中存储实例中不同名称但数值类型相同的属性对;S3,根据实例属性特征将关键属性对集合中的属性对分为实例类别属性对子集C、实例尺度属性对子集G以及辅助属性对子集A,即W1={C,G,A},则两个实例的关键属性集合分别为PK={PC,PG,PA}和QK={QC,QG,QA};并分别计算两个实例中具有相同名称和数值类型的类别属性对子集、尺度属性对子集以及辅助属性对子集的相似度:SC(PC,QC),SG(PG,QG),SA(PA,QA);S4,分别计算两个实例中具有相同名称和数值类型的属性的相似度SK(P,Q)以及两个实例中不同名称但数值类型相同的属性的相似度SR(P,Q),进而计算两个实例的综合相似度S(I1,I2)并输出。2.根据权利要求1所述的一种地理本体要素实例属性相似度的计算方法,其特征在于:所述地理本体Os的构造包括以下子步骤:将基础地理信息数据库Geodatabase转换为大规模地理本体库,数据库中一条要素对应着地理本体中的一个实例,描述要素特征的属性对应着实例的属性,数据库中要素的最小外包矩形以(X,Y)坐标点的形式存储在地理本体库中;根据Geodatabase数据库中要素的最小外包矩形,获取Geodatabase数据库中某个范围内所有的不同类型的要素;根据获取到的要素,从大规模地理本体库中获取相关要素的实例、概念信息,重新构造得到地理本体Os。3.根据权利要求2所述的一种地理本体要素实例属性相似度的计算方法,其特征在于:所述两个实例中具有相同名称和数值类型的类别属性对子集相似度SC(PC,QC)的计算方法为:根据概念语义的内涵...

【专利技术属性】
技术研发人员:李晓林严柯徐雅琴谢婷婷
申请(专利权)人:武汉工程大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1