【技术实现步骤摘要】
一种电网调度知识图谱数据优化方法及系统
[0001]本专利技术属于电网调度
,具体涉及一种电网调度知识图谱数据优化方法。
技术介绍
[0002]随着电力系统规模的不断扩大以及新能源占比的增大,有功调度的难度日益上升。作为电力系统最重要的系统控制手段之一,准确安全的调度不但牵涉到国家经济的发展,更是整个电力系统安全高效运作的保障。
[0003]当下阶段,由于电网设备数量和电力系统知识总量的迅速增长,传统的知识组织和管理手段早已无法满足需求。相较于基本数据库,包含了规则,基于专家系统现已投入运行的智能决策系统和输电网规划决策系统等知识库以其明显的优势在电力系统中得到了大量应用。然而,目前的知识库有赖于专家。提取整理并将相关内容最终以图表形式保存在数据库中,不但储存结构受到严重限制,在更新时还需要投入大量专业人员及时间。尤其对于现有的电力调度这类环境变化多,规则要求高,更新迭代快且案例特别丰富的专业领域,行业迫切需要一种更加自动化、智能化的知识提取、存储、管理及推理方法系统。
[0004]出于以上考虑,电网调 ...
【技术保护点】
【技术特征摘要】
1.一种电网调度知识图谱数据优化方法,其特征在于,包括以下步骤:步骤一.建立基于图数据库的电网调度知识图谱模型,包括电网历史文本类子图和电网设备子图, 各电网历史文本类子图的记录通过相关的厂站、线路、设备与电网设备子图连接;步骤二.识别并抽取电网调度实体;步骤三.对抽取的电网调度实体数据原始语料,利用开源分词工具对语句进行中文分词,并对分词结果进行评估;步骤四.初始化实体关系三元组;步骤五.构建及训练基于深度神经网络的实体识别模型与关系识别模型,生成准确的实体与关系。2.根据权利要求1所述的电网调度知识图谱数据优化方法,其特征在于:在步骤二中,识别并抽取电网调度实体,包括以下步骤:调度优化决策涉及多类数据,包括结构化数据和文本类数据;所述结构化数据从电网实时数据库中导出,使用规则化提取为三元组并存入电网调度知识图谱;所述文本类数据采用数据清洗或接口转化方法对文档内容进行遍历,并根据篇章结关联模型划分文档,统一原始数据格式。3.根据权利要求1所述的电网调度知识图谱数据优化方法,其特征在于:在步骤三中,具体包括以下步骤:31)采用中文分词方法对原始语料数据进行短语切分;32)使用基于深度神经网络的半监督学习方法完成统计指标特征的迭代计算;并使用半监督学习方法进行短语质量评价;使用基于深度神经网络的半监督学习方法对词汇进行迭代挖掘,挖掘出高质量词汇及新词;采用半监督学习方法建立命名实体分类体系;33)使用开源自然语言预处理模型进行实体识别,对调度优化决策类实体进行相应的分类与聚类,抽取调度实体、属性的专有名词,抽取实体信息;34)利用深度学习中的迭代训练方式对同名异意实体、异名同意实体做出归纳区分。4.根据权利要求1所述的电网调度知识图谱数据优化方法,其特征在于:在步骤四中,具体包括以下步骤:41)利用实体之间的距离限制和关系指示词的位置限制,自动获取实体
‑
关系
‑
实体的三元组,并对实体进行校验标注;42)标注出可信和不可信的关系三元组,并使用朴素贝叶斯分类器将关系三元组训练分类为可信及不可信,从而得出关系表示模型;43)通过训练得出的关系表示模型,叠加特征数据,在训练好的分类器上进行关系识别,获取候选关系三元组;44)合并所有近似关系候选三元组,并通过统计概率分布情况计算出各关系三元组可信度。5.根据权利要求1所述的电网调度知识图谱数据优化方法,其特征在于:
在步骤五中,具体包括以下步骤:51)构建基于深度神经网络的实体识别模型,完成实体识别模型训练后,在电网调度知识图谱所有数据范围内,对调度计划文本中的实体关系进行标注,标注出实体具体对应的类型,然后使用标注好的语料训练基于卷积神经网络的关系识别模型;52)使用已完成训练的关系识别模型对未标注的调度计划文本中的调度实体关系进行识别;53)基于步骤52)的识别结果进一步校验实体关系,实现实体关系的一致性,并根据电网调度知识图谱校验关系类型是否存在于关系集合中,若不存在,则提示审核;反之,通过实体语义特征搜索到电网调度知识图谱中相匹配的实体,若匹配识别得到的实体
‑
关系
‑
实体三元组和搜索电网调度知识图谱得到的实体
...
【专利技术属性】
技术研发人员:唐宁恺,陆继翔,旷文腾,谢峰,严晴,李红,
申请(专利权)人:国网浙江省电力有限公司国网电力科学研究院有限公司国家电网有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。