一种基于自然语言和知识图谱工程信息智能搜索方法技术

技术编号：25756414 阅读：30 留言：0更新日期：2020-09-25 21:05

本发明专利技术公开了一种基于自然语言和知识图谱工程信息智能搜索方法，包括如下步骤：S1、构建基于建筑领域的知识图谱；S2、收集用户对建筑领域的问题集；S3、针对步骤S2中的问题集对文本数据进行预处理，进行序列标注，构建建筑领域问题训练数据集；S4、获取步骤S3中所述问题训练数据集中的数据，并构建出问题集模型；S5、施工人员使用自然语言输入一段建筑领域的问题文本，使用步骤S4中的问题集模型对问题文本进行命名实体识别及关系抽取；S6、根据问题文本识别出实体和语义关系，生成相应的Cypher语句，从构建好的知识图谱中快速地查询对应的知识，从而提高现场的施工效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于自然语言和知识图谱工程信息智能搜索方法
本专利技术涉及建筑工程领域，特别是涉及一种基于自然语言和知识图谱工程信息智能搜索方法。
技术介绍
现有技术中当工程量进行统计之后，如何快速从大量的工程量数据中快速准确查询到指定的构件的工程量信息是影响工程效率的重要问题。建筑施工所涉及的人员与专业众多，算量信息查询的请求复杂多变。按照现有方式对工程量信息进行查询时，需要先到图纸或三维模型中找到对应的构件，然后到工程量信息表格中找到与之对应的工程量信息，这个过程较为繁琐且效率低下。
技术实现思路
本专利技术目的在于克服现有技术中的上述缺陷，提供了一种基于自然语言和知识图谱工程信息智能搜索方法，其让施工人员能够使用自然语言从构建好的知识图谱中快速地寻找到相应的工程信息，提高现场的施工效率。为实现上述目的，本专利技术提供了一种基于自然语言和知识图谱工程信息智能搜索方法，包括如下步骤：S1、把非结构化的建筑领域知识和关系型工程数据转化成实体关系组，存入图数据库，构建基于建筑领域的知识图谱；S2、收集用户对建筑领域的问题集；S3、针对步骤S2中的问题集对文本数据进行预处理，进行序列标注，构建建筑领域问题训练数据集；S4、获取步骤S3中所述问题训练数据集中的数据，并构建出问题集模型；S5、使用自然语言输入一段建筑领域的问题文本，使用步骤S4中的问题集模型对问题文本进行命名实体识别及关系抽取；S6、根据问题文本识别出实体和语义关系，生成相应的Cyphe...

【技术保护点】
1.一种基于自然语言和知识图谱工程信息智能搜索方法，其特征在于，包括如下步骤：/nS1、把非结构化的建筑领域知识和关系型工程数据转化成实体关系组，存入图数据库，构建基于建筑领域的知识图谱；/nS2、收集用户对建筑领域的问题集；/nS3、针对步骤S2中的问题集对文本数据进行预处理，进行序列标注，构建建筑领域问题训练数据集；/nS4、获取步骤S3中所述问题训练数据集中的数据，并构建出问题集模型；/nS5、使用自然语言输入一段建筑领域的问题文本，使用步骤S4中的问题集模型对问题文本进行命名实体识别及关系抽取；/nS6、根据问题文本识别出实体和语义关系，生成相应的Cypher语句，从步骤S1中构建好的知识图谱中查询对应的知识。/n

【技术特征摘要】
1.一种基于自然语言和知识图谱工程信息智能搜索方法，其特征在于，包括如下步骤：
S1、把非结构化的建筑领域知识和关系型工程数据转化成实体关系组，存入图数据库，构建基于建筑领域的知识图谱；
S2、收集用户对建筑领域的问题集；
S3、针对步骤S2中的问题集对文本数据进行预处理，进行序列标注，构建建筑领域问题训练数据集；
S4、获取步骤S3中所述问题训练数据集中的数据，并构建出问题集模型；
S5、使用自然语言输入一段建筑领域的问题文本，使用步骤S4中的问题集模型对问题文本进行命名实体识别及关系抽取；
S6、根据问题文本识别出实体和语义关系，生成相应的Cypher语句，从步骤S1中构建好的知识图谱中查询对应的知识。

2.根据权利要求1所述的一种基于自然语言和知识图谱工程信息智能搜索方法，其特征在于，所述步骤S1中构建基于建筑领域的知识图谱具体为：人工整理建筑领域的基本知识、施工流程及累计经验并将其转化成实体关系组，爬虫获取建筑领域的半结构化信息和相关文档并将其转化成实体关系组...

【专利技术属性】
技术研发人员：龙振佳，陈龙，
申请(专利权)人：广州华建工智慧科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人