【技术实现步骤摘要】
建筑图纸中长文本信息分析方法及装置
[0001]本专利技术涉及数据处理
,特别涉及一种建筑图纸中长文本信息分析方法及装置。
技术介绍
[0002]近年来随着智能化建设的快速发展,信息化技术被广泛应用到各个领域中。目前绝大部分的既有建筑是基于二维图纸进行设计的,例如CAD图纸,而建筑图纸中的长文本信息的结构化分析作为建筑智能化的重要部分,是建筑智能设计、智能审图、BIM模型智能构建等领域的基石。
[0003]长文本信息是建筑图纸的重要组成部分,包含设计说明、图表附注,是施工图的纲领,是未能充分表达的图纸、量单、做法的说明,是对审查机构关注的问题解决方法的阐述,是建筑图纸的图纸智能转BIM模型的信息来源之一。
[0004]例如,结构专业的建筑图纸的长文本信息,如“1、未注明板厚均为110mm;未注明板顶标高为8.950m。”,需要从中提取“混凝土板
‑
厚度
‑
未注明
‑
110mm”、“混凝土板
‑
顶标高
‑
未注明 />‑
8.本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种建筑图纸中长文本信息分析方法,其特征在于,所述方法包括:采集建筑行业知识并将所述建筑行业知识写入配置文件,所述配置文件中存储有多个构件信息、属性信息以及属性值信息;获取预设格式的建筑图纸,并对所述建筑图纸进行解析以得到所述建筑图纸的多个文本行;根据所述多个文本行按预设规则获取所述建筑图纸的标题层级信息,并根据所述标题层级信息确定所述建筑图纸的长文本信息中的构件提取范围;根据所述配置文件中的构件、属性以及属性值模板,从所述多个文本行的构件提取范围中匹配得到实体及实体对应的候选实体类别,并根据所述多个文本行匹配结果得到文本语义块信息;对所述文本语义块信息进行分析得到相应的语法树,并对所述语法树进行解析提取所述文本语义块信息中的构件信息和属性名称信息以将所述建筑图纸中的长文本信息的转化为预设结构。2.根据权利要求1所述的建筑图纸中长文本信息分析方法,其特征在于,所述根据所述多个文本行按预设规则获取所述建筑图纸的标题层级信息的步骤包括:检测每个所述文本行的起始片段是否存在序号以区分正文和标题,并根据所述序号格式的一致性获取标题层级;获取相同所述标题层级相邻之间的其他标题信息通过递归策略获取所述建筑图纸的标题层级信息。3.根据权利要求1所述的建筑图纸中长文本信息分析方法,其特征在于,所述根据所述标题层级信息确定所述建筑图纸的长文本信息中的构件提取范围的步骤包括:根据所述标题层级信息,按从大到小的规则依次从所述标题层级信息中获取短标题;确定所述短标题符合的目标构件限制模板,并存储所述目标构件和短标题的下级文本的映射关系以确定所述短标题的构件提取范围。4.根据权利要求1所述的建筑图纸中长文本信息分析方法,其特征在于,所述根据所述配置文件中的构件、属性以及属性值模板,从所述多个文本行的构件提取范围中匹配得到实体及实体对应的候选实体类别,并根据所述多个文本行匹配结果得到文本语义块信息的步骤包括:根据所述配置文件中的构件、属性以及属性值模板,从所述多个文本行的构件提取范围中匹配得到实体及实体对应的候选实体类别;按照取长不取短原则删除较短的匹配结果得到最终的实体匹配结果,并将所述实体匹配结果按照在所述文本行中的顺序进行依次排列,得到文本语义块信息。5.根据权利要求1所述的建筑图...
【专利技术属性】
技术研发人员:李一华,彭飞,周自强,刘玉,
申请(专利权)人:江西少科智能建造科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。