工程造价数据的识别方法、装置和数据识别系统制造方法及图纸

技术编号:42613763 阅读:36 留言:0更新日期:2024-09-03 18:20
本申请提供了一种工程造价数据的识别方法、装置和数据识别系统,该方法包括:根据第一目标数据确定工程造价词典;对第一目标数据进行数据提取得到第二目标数据、第三目标数据和第四目标数据;将第二目标数据和第四目标数据通过表格匹配规则进行转换得到第五目标数据,根据第五目标数据构建第一三元组;根据工程造价词典对第三目标数据通过词典匹配规则进行转换得到第六目标数据,根据第六目标数据构建第二三元组且根据第六目标数据构建第三三元组;根据三元组生成实体csv文件和关系csv文件,并根据实体csv文件和关系csv文件生成知识图谱得到目标文件。该方法解决了现有技术中工程造价数据难以进行自动提取并管理的问题。

【技术实现步骤摘要】

本专利技术涉及数据通信,具体而言,涉及一种工程造价数据的识别方法、装置、计算机可读存储介质和数据识别系统。


技术介绍

1、电网生产项目从设计、施工到验收的全流程中将产生大量来源丰富、格式复杂多样的生产造价数据,包含半结构化数据,如结算书;非结构化文本数据,如设计说明书等。这些海量的表格和文本数据中蕴含着丰富的与电网拓扑、资产、设备相关的知识。然而,以生产项目中产生的文本型数据为例,这些数据主要用于工程相关人员的阅读,因此文本内容未经格式化,不利于计算机处理和理解,极大地增加了从这些数据中获取知识的难度和成本,因此需要一种灵活高效的数据组织方式。自然语言处理技术能够有效地实现信息的抽取-转换-装载,进而自动分析非结构化的文本数据,从中挖掘有价值的知识,知识图谱是一种结构化的、语义丰富的知识表示形式,通过图的方式组织和表示现实世界中的实体、概念、关系及其属性。它是一个包含实体节点和关系边的图结构,用于描述不同实体之间的关联性和语义关系。两者结合实现挖掘知识,再将知识以结构化形式呈现给用户的过程。

2、现有技术中缺乏一种系统性的提取工程造假数据的方法本文档来自技高网...

【技术保护点】

1.一种工程造价数据的识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,根据所述工程造价词典对所述第一目标数据进行数据提取得到第二目标数据、第三目标数据和第四目标数据,包括:

3.根据权利要求1所述的方法,其特征在于,将所述第二目标数据和所述第四目标数据通过表格匹配规则进行转换得到第五目标数据,包括:

4.根据权利要求1所述的方法,其特征在于,利用表格数据匹配法根据所述第五目标数据按照主体、客体和关联关系的形式构建第一三元组,包括:

5.根据权利要求1所述的方法,其特征在于,根据所述工程造价词典对所述第三目标数据通过词...

【技术特征摘要】

1.一种工程造价数据的识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,根据所述工程造价词典对所述第一目标数据进行数据提取得到第二目标数据、第三目标数据和第四目标数据,包括:

3.根据权利要求1所述的方法,其特征在于,将所述第二目标数据和所述第四目标数据通过表格匹配规则进行转换得到第五目标数据,包括:

4.根据权利要求1所述的方法,其特征在于,利用表格数据匹配法根据所述第五目标数据按照主体、客体和关联关系的形式构建第一三元组,包括:

5.根据权利要求1所述的方法,其特征在于,根据所述工程造价词典对所述第三目标数据通过词典匹配规则进行转换得到第六目标数据,包括:

6.根据权利要求1所述的方法,其特征在于,利用正则表达式根据所述第六目标数据按照主语、谓语和宾语的形式构建第二...

【专利技术属性】
技术研发人员:张丽萍孙晓敏舒胜文黎立王年孝张峰蒙华伟饶成成喻凌立李欣吴莉琳龙雄峰庞圣养符方炫黄庆淡李敏周净龙召刘晓阳何璐羽丁鹏胡浩莹许超尧陈臻廖颖欢
申请(专利权)人:广东电网有限责任公司湛江供电局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1