当前位置: 首页 > 专利查询>重庆大学专利>正文

一种土木规范领域知识图谱构建方法及构建系统技术方案

技术编号:37444175 阅读:18 留言:0更新日期:2023-05-06 09:16
本发明专利技术涉及一种土木规范领域知识图谱构建方法及构建系统,包括将规范文本中需要抽取的语句筛选出来进行修改,选取符合Schema标签定义的句子,使其适合神经网络模型的抽取;将筛选出来的部分文本进行模型训练,根据设计好的三元组Schema标签对训练集进行数据标注,得到土木规范文本领域的三元组训练集;构建CE

【技术实现步骤摘要】
一种土木规范领域知识图谱构建方法及构建系统


[0001]本专利技术属于建筑智能审图
,涉及一种土木规范领域知识图谱构建方法及构建系统,尤其涉及一种基于深度神经网络的土木规范领域知识图谱构建方法及构建系统。

技术介绍

[0002]建筑工程整个生命周期都受各种规范、标准约束。审图作为其中保证设计和施工质量的关键环节,仍然高度依赖人工审核。人工审查目前存在诸多问题:审图人员水平不一,在审图过程中,不同地方和机构的审图人员对规范的理解不同,这将导致对图纸是否合格的评判存在差异;图纸中有很多重复的审查内容,但审核员需要逐一审核确认其合规性,造成很多重复劳动,降低工作效率;建筑规范条文多且广,理解难度较高,针对同一建筑构件,不同规范可能存在不同的要求,因此在实际中很难保证审图的全面性和无误性;智能化程度低,无法满足国家对于未来智能建造发展的要求。
[0003]基于上述原因,智能审图得到越来越多的关注和研究,其重要性也日益凸显。而智能审查过程中,最复杂也是最重要的就是计算机如何理解规范条文知识并进行推理。当前研究可以分为两部分,一是对规范知识的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种土木规范领域知识图谱构建方法,其特征在于,包括如下步骤:S1、将规范文本中需要抽取的语句筛选出来,对筛选出来的文本格式和文本句式进行修改,选取符合Schema标签定义的句子,使其适合神经网络模型的抽取;S2、将步骤S1筛选出来的部分文本进行模型训练,并将文本进行语句分割,得到若干语句,并根据设计好的三元组Schema标签对训练集进行数据标注,得到土木规范文本领域的三元组训练集;S3、构建CE

CasRel模型,用步骤S2标注后的数据集进行训练,并用验证集进行验证;其中在构建CE

CasRel模型时,使用的预训练模型为在土木领域数据集上优化过的BERT模型;S4、重复步骤S1和S2将得到待抽取的规范文本输入到训练好的CE

CasRel模型中,抽取出土木规范领域的三元组,并将其存储到json文件中;S5、读取json文件,解析三元组数据,使用Neo4j的API接口,建立土木规范领域知识图谱并实现可视化。2.如权利要求1所述的土木规范领域知识图谱构建方法,其特征在于,步骤S2的具体过程为:S21、利用正则表达式将分割后的句子整理到同一文件夹下,得到待标注的数据集;其中正则规则定义为根据句号、分号、冒号作为分割句子的标志;S22、按照预设比例,将数据集划分为数据集和测试集,利用标注软件对训练集进行标注,得到用于训练知识抽取的三元组训练集;S23、为了进行三元组抽取和知识图谱构建,将抽取的三元组训练集根据新的Schema标签定义规则分为实体标签和关系标签,实体标签MSub、Sub、Prop表示审图中需要审查的对象,关系标签Sub_Prop、Prop_Bx、Bx_RProp为规范条文最基础的三个关系,表示“某一个主体”的“某项属性”“应该满足”“某种规范要求”。3.如权利要求2所述的土木规范领域知识图谱构建方法,其特征在于,步骤S3的具体过程为:S31、构建CE

CasRel模型,在编码器端使用利用土木领域数据集重新预训练过的BERT模型替代原有编码器,本专利称为CEBERT;在解码端为了解决实体嵌套问题,使用层叠式指针标注方法;并且在预测三元组的尾实体前,将头实体的特征向量作为条件,对特征向量做一次Conditional Layer Normalization(CLN);S32、将标注后的训练集文本作为输入,进入CEBERT编码器;由编码器CEBERT对每条的规范条文进行多头注意力、层归一化处理和残差连接操作,提取文本特征,得到句子级别向量表示;S33、将经过预训练模型CEBERT后得到的向量表示传入解码器的头实体识别层,首先利用一个线性层和一个sigmoid激活函数判断每个token是不是头实体的start或end;然后,利用最近匹配原则将识别到的start和end配对获得候选头实体集合;S34、接着随机抽取一个头实体,将该实体作为条件,对句子级别的向量表示...

【专利技术属性】
技术研发人员:白久林陈耀坤刘毅
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1