System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及知识图谱,更具体地说,是涉及一种配电网规划多源异构数据的知识图谱构建方法及相关设备。
技术介绍
1、作为配电网建设改造工作中的第一环,配电网规划在技术、形态和功能上正在加速转变,对效率、成本、服务更加关注,实现配电网精细化规划、精益化管理和精准化投资,是电力系统发展的重要任务。
2、然而,配电网涉及电压多、覆盖面广、项目繁杂、工程规模小,且配电网规划直接面向社会,与城乡发展规划、用户多元化需求、新能源和分布式电源发展密切相关,建设需求随机性大,不确定因素多,因此在配电网建设过程中不可避免会面对配电网规划的标准化问题。
3、国土空间规划、土地利用总体规划及中压配电网规划数据是配电网规划业务中的重要参考数据,基于规划地区的配电网发展需求,制定因地制宜的国土空间规划和土地利用总体规划,建立高质量的中压配电网规划标准,不仅能够提高配电公司规划水平,而且也能够为规划地区电网扩建、线路改造等基础设施业务提供指导。因此,为了提升配电网规划业务精益化水平,实现高效的配电网规划建设,需要规划人员对上述配电网规划数据进行系统学习。
4、然而,随着电力系统长时间的沉淀发展,国土空间规划、土地利用总体规划及中压配电网规划数据等配电网规划多源异构数据呈现出文本体量大、快速检索困难、人工学习效率较低的缺点。
技术实现思路
1、有鉴于此,本申请提供了一种配电网规划多源异构数据的知识图谱构建方法及相关设备,以构建配电网中多源异构数据的知识图谱,实现多源异构数据链接关系
2、为实现上述目的,本申请第一方面提供了一种配电网规划多源异构数据的知识图谱构建方法,包括:
3、获取配电网规划中多个数据源的文本数据,所述数据源包括国土空间规划数据源、土地利用总体数据源以及中压配电网规划数据源;
4、基于训练后的大语言模型获取所述多个数据的文本数据中的三元组数据;
5、基于所述三元组数据,构建知识图谱数据库;
6、基于所述知识图谱数据库,构建可视化知识图谱。
7、优选地,基于所述三元组数据,构建知识图谱数据库的过程,包括:
8、对所述三元组数据进行实体消歧以及共指消解,得到知识融合后的三元组数据;
9、对所述融合后的三元组数据进行本体构建、知识推理以及质量评估,得到目标三元组数据;
10、对所述目标三元组数据构建数据库,得到知识图谱数据库。
11、优选地,所述大语言模型为gpt-3.5模型;所述gpt-3.5模型的训练过程,包括:
12、构建微调数据集;
13、利用所述微调数据集对预训练的gpt-3.5模型进行微调,得到训练后的gpt-3.5模型。
14、优选地,基于所述知识图谱数据库,构建可视化知识图谱的过程,包括:
15、利用图表映射和视图设计的方式,基于所述知识图谱数据库中的数据生成可视化知识图谱。
16、本申请第二方面提供了一种配电网规划多源异构数据的知识图谱构建装置,包括:
17、数据获取单元,用于获取配电网规划中多个数据源的文本数据,所述数据源包括国土空间规划数据源、土地利用总体数据源以及中压配电网规划数据源;
18、三元组获取单元,用于基于训练后的大语言模型获取所述多个数据的文本数据中的三元组数据;
19、知识图谱构建单元,用于基于所述三元组数据,构建知识图谱数据库;
20、知识图谱可视化单元,用于基于所述知识图谱数据库,构建可视化知识图谱。
21、优选地,所述知识图谱构建单元基于所述三元组数据,构建知识图谱数据库的过程,包括:
22、对所述三元组数据进行实体消歧以及共指消解,得到知识融合后的三元组数据;
23、对所述融合后的三元组数据进行本体构建、知识推理以及质量评估,得到目标三元组数据;
24、对所述目标三元组数据构建数据库,得到知识图谱数据库。
25、优选地,所述装置还包括模型训练单元,所述模型训练单元用于训练所述大语言模型;
26、所述大语言模型为gpt-3.5模型;
27、模型训练单元训练所述gpt-3.5模型的过程,包括:
28、构建微调数据集;
29、利用所述微调数据集对预训练的gpt-3.5模型进行微调,得到训练后的gpt-3.5模型。
30、优选地,所述知识图谱可视化单元基于所述知识图谱数据库,构建可视化知识图谱的过程,包括:
31、利用图表映射和视图设计的方式,基于所述知识图谱数据库中的数据生成可视化知识图谱。
32、本申请第三方面提供了一种配电网规划多源异构数据的知识图谱构建设备,包括:存储器和处理器;
33、所述存储器,用于存储程序;
34、所述处理器,用于执行所述程序,实现上述的配电网规划多源异构数据的知识图谱构建方法的各个步骤。
35、本申请第四方面提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上述的配电网规划多源异构数据的知识图谱构建方法的各个步骤。
36、经由上述的技术方案可知,本申请首先获取配电网规划中多个数据源的文本数据,其中,所述数据源包括国土空间规划数据源、土地利用总体数据源以及中压配电网规划数据源。然后,基于训练后的大语言模型获取所述多个数据的文本数据中的三元组数据。可以理解,所述三元组数据包含“实体-关系-实体”和“实体-属性-性值”这两种形式,描述了文本数据中各实体的属性及关系等信息。接着,基于所述三元组数据,构建知识图谱数据库。例如,可以通过建立三元组表来将知识图谱存储到关系数据库中,通过构建知识图谱数据库,便于用户进行相关的检索。最后,基于所述知识图谱数据库,构建可视化知识图谱。所述可视化知识图谱建立了知识概念间的链接关系,实现了将知识体系中积累的信息组织起来,以可视化的方式向用户展示经过分类整理的结构化知识,使得人们从人工过滤知识体系寻找答案的模式中解脱出来。本申请可以帮助规划人员快速地从庞大的文本数据中检索到所需内容,并促进配电网规划业务数字化转型。
本文档来自技高网...【技术保护点】
1.一种配电网规划多源异构数据的知识图谱构建方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,基于所述三元组数据,构建知识图谱数据库的过程,包括:
3.根据权利要求1所述的方法,其特征在于,所述大语言模型为GPT-3.5模型;所述GPT-3.5模型的训练过程,包括:
4.根据权利要求1所述的方法,其特征在于,基于所述知识图谱数据库,构建可视化知识图谱的过程,包括:
5.一种配电网规划多源异构数据的知识图谱构建装置,其特征在于,包括:
6.根据权利要求5所述的装置,其特征在于,所述知识图谱构建单元基于所述三元组数据,构建知识图谱数据库的过程,包括:
7.根据权利要求5所述的装置,其特征在于,还包括模型训练单元,所述模型训练单元用于训练所述大语言模型;
8.根据权利要求5所述的装置,其特征在于,所述知识图谱可视化单元基于所述知识图谱数据库,构建可视化知识图谱的过程,包括:
9.一种配电网规划多源异构数据的知识图谱构建设备,其特征在于,包括:存储器和处理器;
1
...【技术特征摘要】
1.一种配电网规划多源异构数据的知识图谱构建方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,基于所述三元组数据,构建知识图谱数据库的过程,包括:
3.根据权利要求1所述的方法,其特征在于,所述大语言模型为gpt-3.5模型;所述gpt-3.5模型的训练过程,包括:
4.根据权利要求1所述的方法,其特征在于,基于所述知识图谱数据库,构建可视化知识图谱的过程,包括:
5.一种配电网规划多源异构数据的知识图谱构建装置,其特征在于,包括:
6.根据权利要求5所述的装置,其特征在于,所述知识图谱构建单元基于...
【专利技术属性】
技术研发人员:贾巍,汪帆,罗少威,潘威,李水天,彭里卓,谭伟涛,林振智,
申请(专利权)人:广东电网有限责任公司广州供电局,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。