一种BIM和GIS的语义匹配方法及装置制造方法及图纸

技术编号:24207968 阅读:32 留言:0更新日期:2020-05-20 15:30
本发明专利技术涉及一种BIM和GIS的语义匹配方法及装置,通过设置开始符和结束符将所述第一文本数据和第二文本数据中每一个字符串隔开,将所述字符串进行分割得到若干字符,对字符串的若干字符利用哈希算法构建所述第一文本数据和所述第二文本数据中各字符串对应的第一词向量和第二词向量,通过对第一词向量和第二词向量进行相似度计算,根据相似度最高的两个词向量对应的文本数据,得到准确的语义匹配结果。相对于现有技术,本发明专利技术实现IFC与CityGML定义的实体智能匹配,具有更高的匹配精度和效率。

A semantic matching method and device of Bim and GIS

【技术实现步骤摘要】
一种BIM和GIS的语义匹配方法及装置
本专利技术涉及建筑信息处理领域,尤其是涉及一种BIM和GIS的语义匹配方法及装置。
技术介绍
由于建筑信息模型(BuildingInformationModel,BIM)能以一种互操作方式和数据重用方式来产生、存储、管理、共享和交换建筑信息数据,所以被广泛地应用在建筑物、工程建设领域。BIM构建的小尺度或室内空间三维模型主要应用于建筑物等工程的全生命周期管理,因而具备了丰富的几何、属性及语义信息。而三维地理信息系统(3DGeographyInformationSystem,3DGIS)提供了数据制作、管理、分析等功能,主要针对的是大尺度的三维场景建模,其主要面向的是室外大规模三维场景的渲染、空间分析等用途。BIM与GIS的融合一方面可以构建室内外一体化的三维场景,另一方面可以大大减少GIS建模过程中的数据采集、模型制作及语义标注等工作,可以极大地丰富3DGIS的数据来源。因此,BIM与GIS的数据融合受到了越来越多的关注。工业基础类(IndustryFoundationClasses,IFC)是B本文档来自技高网...

【技术保护点】
1.一种BIM和GIS的语义匹配方法,其特征在于,包括以下步骤:/n获取IFC和CityGML文件,提取所述IFC和CityGML文件中的实体名称和实体定义作为第一文本数据和第二文本数据;/n将所述第一文本数据和第二文本数据中每一个字符串进行分割,获得若干字符;其中,每个字符串分别对应一个实体;/n基于所述字符,利用哈希算法构建所述第一文本数据和所述第二文本数据中各字符串对应的词向量,得到第一词向量和第二词向量;/n根据所述第一词向量与第二词向量,获取所述第一文本数据和第二文本数据中每两个实体之间的相似度;/n根据相似度最高的两个词向量对应的文本数据,得到语义匹配结果。/n

【技术特征摘要】
1.一种BIM和GIS的语义匹配方法,其特征在于,包括以下步骤:
获取IFC和CityGML文件,提取所述IFC和CityGML文件中的实体名称和实体定义作为第一文本数据和第二文本数据;
将所述第一文本数据和第二文本数据中每一个字符串进行分割,获得若干字符;其中,每个字符串分别对应一个实体;
基于所述字符,利用哈希算法构建所述第一文本数据和所述第二文本数据中各字符串对应的词向量,得到第一词向量和第二词向量;
根据所述第一词向量与第二词向量,获取所述第一文本数据和第二文本数据中每两个实体之间的相似度;
根据相似度最高的两个词向量对应的文本数据,得到语义匹配结果。


2.根据权利要求1所述的BIM和GIS的语义匹配方法,其特征在于,所述提取对应的实体名称和实体定义作为第一文本数据和第二文本数据的步骤还包括:
在所述第一文本数据和第二文本数据中每一个字符串的前后设置开始符和结束符,将每一个字符串分隔开。


3.根据权利要求1所述的BIM和GIS的语义匹配方法,其特征在于,所述获取所述第一文本数据和第二文本数据中每两个实体之间的相似度步骤具体包括:
按照以下公式,计算第一文本数据和第二文本数据中每两个实体之间的相似度:



其中,Sim(i,j)表示实体i和j之间的语义相似度,vi和vj分别表示实体i和j的词向量,|vi|和|vj|分别为词向量vi和vj的模。


4.一种BIM和GIS的语义匹配装置,其特征在于,包括:
文本提取模块,用于获取IFC和CityGML文件,提取所述IFC和CityGML文件中的实体名称和实体定义作为第一文本数据和...

【专利技术属性】
技术研发人员:丁小辉李勇杨骥黄吴蒙李华朋
申请(专利权)人:广州地理研究所南方海洋科学与工程广东省实验室广州
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1