【技术实现步骤摘要】
本专利技术涉及数据通信,具体而言,涉及一种工程造价数据的识别方法、装置、计算机可读存储介质和数据识别系统。
技术介绍
1、电网生产项目从设计、施工到验收的全流程中将产生大量来源丰富、格式复杂多样的生产造价数据,包含半结构化数据,如结算书;非结构化文本数据,如设计说明书等。这些海量的表格和文本数据中蕴含着丰富的与电网拓扑、资产、设备相关的知识。然而,以生产项目中产生的文本型数据为例,这些数据主要用于工程相关人员的阅读,因此文本内容未经格式化,不利于计算机处理和理解,极大地增加了从这些数据中获取知识的难度和成本,因此需要一种灵活高效的数据组织方式。自然语言处理技术能够有效地实现信息的抽取-转换-装载,进而自动分析非结构化的文本数据,从中挖掘有价值的知识,知识图谱是一种结构化的、语义丰富的知识表示形式,通过图的方式组织和表示现实世界中的实体、概念、关系及其属性。它是一个包含实体节点和关系边的图结构,用于描述不同实体之间的关联性和语义关系。两者结合实现挖掘知识,再将知识以结构化形式呈现给用户的过程。
2、现有技术中缺乏一种系统性的提
...【技术保护点】
1.一种工程造价数据的识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,根据所述工程造价词典对所述第一目标数据进行数据提取得到第二目标数据、第三目标数据和第四目标数据,包括:
3.根据权利要求1所述的方法,其特征在于,将所述第二目标数据和所述第四目标数据通过表格匹配规则进行转换得到第五目标数据,包括:
4.根据权利要求1所述的方法,其特征在于,利用表格数据匹配法根据所述第五目标数据按照主体、客体和关联关系的形式构建第一三元组,包括:
5.根据权利要求1所述的方法,其特征在于,根据所述工程造价词典对所
...【技术特征摘要】
1.一种工程造价数据的识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,根据所述工程造价词典对所述第一目标数据进行数据提取得到第二目标数据、第三目标数据和第四目标数据,包括:
3.根据权利要求1所述的方法,其特征在于,将所述第二目标数据和所述第四目标数据通过表格匹配规则进行转换得到第五目标数据,包括:
4.根据权利要求1所述的方法,其特征在于,利用表格数据匹配法根据所述第五目标数据按照主体、客体和关联关系的形式构建第一三元组,包括:
5.根据权利要求1所述的方法,其特征在于,根据所述工程造价词典对所述第三目标数据通过词典匹配规则进行转换得到第六目标数据,包括:
6.根据权利要求1所述的方法,其特征在于,利用正则表达式根据所述第六目标数据按照主语、谓语和宾语的形式构建第二...
【专利技术属性】
技术研发人员:张丽萍,孙晓敏,舒胜文,黎立,王年孝,张峰,蒙华伟,饶成成,喻凌立,李欣,吴莉琳,龙雄峰,庞圣养,符方炫,黄庆淡,李敏周,净龙召,刘晓阳,何璐羽,丁鹏,胡浩莹,许超尧,陈臻,廖颖欢,
申请(专利权)人:广东电网有限责任公司湛江供电局,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。