The invention discloses a method for semantic retrieval of BIM product database based on natural language processing, which includes: firstly, the target keywords and constraint keywords are obtained by semantic structure analysis and dependency analysis of professional search in natural language form, and the constraint keyword sequence is obtained according to the constraint sorting rule set; secondly, the constraint keyword sequence is obtained by using BIM; Product domain ontology standardizes the concept of the keyword sequence, and uses the improved semantic similarity algorithm to extend the keyword similarity to obtain the final query words. Finally, using the index relationship between BIM product domain ontology and BIM product database to achieve the matching of the query words to specific products, using similarity algorithm to match. The results are sorted and presented. The invention can make professional semantic understanding of natural sentences, improve the intelligence of BIM product query, and effectively avoid the inefficiency and redundancy of traditional retrieval technology.
【技术实现步骤摘要】
一种基于自然语言处理的BIM产品数据库语义检索方法
本专利技术涉及自然语言处理领域与建设工程交叉领域,具体涉及一种基于自然语言处理的BIM产品数据库语义检索方法。
技术介绍
BIM产品数据库是由各类建材部品的三维模型及相关参数信息组成的一个模型库,是BIM技术助力建筑工业化,标准化生产的重要成果之一。而目前世界上已有多个这样的数据库,如AutodeskSeek、BIMobject、住房与城乡建设产品BIM大型数据库等,但这些数据库检索技术及组织结构存在共有的缺陷:(1)检索技术选用关键词为基础的搜索技术,这使得只有搜索词与数据库中数据名称完全一致才能检索出结果;(2)所用检索技术无法理解在语义上理解用户检索词的含义,BIM产品数据库无法为非专业用户所使用;(3)BIM产品数据库检索结果呈现顺序不与检索词呈正相关,并且呈现方式各样,不具统一性;(4)BIM产品数据库结构及分类多样,使得产品数据库的条件检索实施难度加大。
技术实现思路
为了克服现有技术存在的缺点与不足,本专利技术提供一种基于自然语言处理的BIM产品数据库语义检索方法。基于自然语言处理的BIM产品数据库语义检索方法,本专利技术首先对自然语言形式的专业搜索进行句法结构分析和依赖分析得到目标关键词和约束关键词,并依据约束排序规则集获得约束关键词序列;其次利用BIM产品领域本体对关键词序列进行概念标准化;接着利用语义相似度算法对关键词进行相似扩展,获得最终查询词;最后,利用本体与BIM产品数据库的索引关系来实现查询词到具体产品的匹配,并利用相似度算法进行排序后呈现结果。本专利技术采用如下技术方案:一种基于 ...
【技术保护点】
1.一种基于自然语言处理的BIM产品数据库语义检索方法,其特征在于,包括如下步骤:S1对自然语言形式的专业搜索进行句法结构分析及依赖分析,得到目标关键词及约束关键词,并根据约束排序规则集获得约束关键词序列;S2首先将目标关键词及约束关键词序列标准化,然后在BIM产品领域本体找到标准化的目标关键词及约束关键词序列对应的概念;S3采用语义相似度算法对目标关键词及约束关键词的概念进行相似扩展,形成最终查询词;S4通过BIM产品领域本体与BIM产品数据库建立对应的索引关系,将最终查询词与具体产品匹配,利用相似度算法衡量其匹配程度,并按匹配程度从高到低对产品进行排序并呈现。
【技术特征摘要】
1.一种基于自然语言处理的BIM产品数据库语义检索方法,其特征在于,包括如下步骤:S1对自然语言形式的专业搜索进行句法结构分析及依赖分析,得到目标关键词及约束关键词,并根据约束排序规则集获得约束关键词序列;S2首先将目标关键词及约束关键词序列标准化,然后在BIM产品领域本体找到标准化的目标关键词及约束关键词序列对应的概念;S3采用语义相似度算法对目标关键词及约束关键词的概念进行相似扩展,形成最终查询词;S4通过BIM产品领域本体与BIM产品数据库建立对应的索引关系,将最终查询词与具体产品匹配,利用相似度算法衡量其匹配程度,并按匹配程度从高到低对产品进行排序并呈现。2.根据权利要求1所述的BIM产品数据库语义检索方法,其特征在于,所述S1对自然语言形式的专业搜索进行句法结构分析及依赖分析,得到目标关键词及约束关键词,并根据约束排序规则集获得约束关键词序列,具体步骤如下:S1.1利用分词工具对自然语句进行分词,并利用词性标注器对切分的单词进行词性标注;接着利用句法分析器对各词之间的关系进行句法结构分析并生成句法结构树,根据各词相互关系获取目标关键词和约束关键词;如果出现两个连续的名词,则进行S1.2,否则进入S1.3;S1.2利用依赖分析对两个连续名词之间的依赖关系,确定目标关键词及约束关键词;S1.3对于获取的多个约束关键词,则结合目标关键词的特点及约束排序规则集来确定约束关键词的优先级,从而获取约束关键词序列。3.根据权利要求1所述的BIM产品数据库语义检索方法,其特征在于,所述S3采用语义相似度算法对目标关键词进行相似扩展,形成最终查询词,具体如下:通过BIM产品领域本体的概念结构对标准化后目标关键词与约束关键词进行概念扩展,然后计算目标关键词与约束关键词的概念对应的扩展概念的相似度值,根据预先设定的相似度阈值进行过滤得到相似度值高的扩展概念,最后得到目标关...
【专利技术属性】
技术研发人员:吴松飞,邓逸川,吴观众,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。