【技术实现步骤摘要】
一种BIM语义消歧方法及系统
[0001]本专利技术涉及BIM(Building Information Modeling,建筑信息模型)数据处理
,尤其涉及一种BIM语义消歧方法及系统。
技术介绍
[0002]在BIM领域模型信息中,通常会出现同义不同词的问题,人可以很方便的理解两者的区别,知道其表达的含义是相同的,但机器难以做到将相同构件的语义进行对齐。
[0003]例如,“结构材料”可以拆分成“结构”和“材料”两个词汇,在BIM语义环境中,需要进行短语相似度的对比;此外,还会出现因为用户输入错误导致的形近词错别词问题,如“结构”和“结钩”,也需要通过识别形近词之间的相似度,从而进行有效区分。
[0004]因此,需要提出一种针对BIM语义进行语义消歧区分的方法。
技术实现思路
[0005]本专利技术提供一种BIM语义消歧方法及系统,用以解决现有技术中针对BIM模型信息中的词汇检索相近词汇时缺乏高效有效方法的缺陷。
[0006]第一方面,本专利技术提供一种BIM语义消歧方法,包 ...
【技术保护点】
【技术特征摘要】
1.一种BIM语义消歧方法,其特征在于,包括:获取BIM词汇集合,建立所述BIM词汇集合的向量空间;获取待查询词汇,确定所述待查询词汇的词汇向量;计算所述词汇向量相对于所述向量空间的编辑距离,根据所述编辑距离确定所述待查询词汇的最相似词汇。2.根据权利要求1所述的BIM语义消歧方法,其特征在于,所述获取BIM词汇集合,建立所述BIM词汇集合的向量空间,包括:提取所述BIM词汇集合中的任一个词句,基于预设分词模型对所述任一个词句进行分词,获得第一分词结果集合;基于预训练词向量模型,获取所述第一分词结果集合中每个分词的词向量,得到第一词向量集合;基于所述预训练词向量模型对所述词向量集合中的每个词向量进行替换,获得第二词向量集合;将所述第二词向量集合中的所有词向量组合得到第一综合词向量,遍历所述BIM词汇集合,直至得到所述BIM词汇集合的所有第一综合词向量,得到所述BIM词汇集合的向量空间。3.根据权利要求2所述的BIM语义消歧方法,其特征在于,所述基于所述预训练词向量模型对所述词向量集合中的每个词向量进行替换,获得第二词向量集合,包括:在所述预训练词向量模型中提取每个词向量最邻近的若干个词汇;对所述若干个词汇取平均值,采用所述平均值替换每个词向量,得到所述第二词向量集合。4.根据权利要求1所述的BIM语义消歧方法,其特征在于,所述获取待查询词汇,确定所述待查询词汇的词汇向量,包括:基于预设分词模型对所述待查询词汇进行分词,获得第二分词结果集合;基于预训练词向量模型,获取所述第二分词结果集合中每个分词的词向量,得到所述待查询词汇的词汇向量。5.根据权利要求1所述的BIM语义消歧方法,其特征在于,所述计算所述词汇向量相对于所述向量空间的编辑距离,根据所述编辑距离确定所述待查询词汇的最相似词汇,包括:将所述词...
【专利技术属性】
技术研发人员:周小平,王佳,王家麟,陈丹燕,
申请(专利权)人:盈嘉互联上海建筑科技有限公司深圳市盈嘉互联科技有限公司佛山市盈嘉智慧空间科技有限公司盈嘉互联北京智慧科技有限公司深圳前海盈嘉数据服务有限公司嘉兴乌镇盈嘉千镇科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。