电网模型及其关联样本数据生成方法、装置、设备及介质制造方法及图纸

技术编号:39057126 阅读:12 留言:0更新日期:2023-10-12 19:50
本发明专利技术属于电力自动化领域,公开一种电网模型及其关联样本数据生成方法、装置、设备及介质;所述方法包括:获取对电网模型的标签化需求、需要的电网模型数量,以及样本和验证案例要求;根据所获取的对电网模型的标签化需求和所需要的电网模型数量,在预先构建的电网模型库中匹配电网模型,获得匹配的电网模型;根据样本和验证案例要求,生成样本预配置需求表;根据样本预配置需求表、所匹配的电网模型,从与所匹配的电网模型关联的样本数据库中抽取样本数据,获得匹配的电网模型的关联样本数据;根据样本预配置需求表中的输出样本格式,输出匹配的电网模型及关联样本数据。本发明专利技术能够根据电网调控应用的实际需求,动态生成训练样本和验证案例。样本和验证案例。样本和验证案例。

【技术实现步骤摘要】
电网模型及其关联样本数据生成方法、装置、设备及介质


[0001]本专利技术属于电力自动化
,特别涉及一种电网模型及其关联样本数据生成方法、装置、设备及介质。

技术介绍

[0002]近年来,“云大物移智链”等新兴ICT技术(information and communications technology,信息通信技术)获得长足的进步和广泛应用,在电网调控领域也是如此,而电网模型及其关联的样本数据往往是这些新兴ICT技术应用的重要基础。以人工智能技术应用为例,人工智能技术是21世纪最重要的新兴技术之一,全球各国目前都在积极进行研究和部署应用,在电网调控领域,有关人工智能技术的研究和应用也是方兴未艾。电网调控应用涉及到国计民生安全,属于高可靠性要求领域,然而目前主流的人工智能技术往往属于“黑盒”类技术,虽然有可能在精度(准确性)和效率方面达到很高的水平,但是有时也会“犯低级错误”,并且由于其可解释性不高,修正错误的过程中往往会带来新的错误,所以测试工作特别重要,这就需要大量有效的电网模型及其关联样本数据。
[0003]电网调控领域的数据和电网模型密切相关,本身有一定的复杂性,而不同的调控应用(甚至同一类型调控应用的不同人工智能模型)所需要的数据一般是不完全一样的;电网调控领域人工智能应用的训练样本和验证案例,往往都是独立构建的,相互间难以复用;构建一组适用于某一个电网调控领域具体应用的训练样本和配套验证案例,往往需要耗费大量精力,有时想要获得大量此类样本和案例甚至是难以实现的。

技术实现思路

>[0004]本专利技术的目的在于提供一种电网模型及其关联样本数据生成方法、装置、设备及介质,能够实现电网模型及其关联样本数据的动态按需生成,解决了电网调控领域人工智能应用的训练样本和验证案例,往往都是独立构建的,相互间难以复用,且需要耗费大量人力的技术问题。
[0005]为了实现上述目的,本专利技术采用如下技术方案:
[0006]第一方面,本专利技术提供一种电网模型及其关联样本数据生成方法,包括:
[0007]获取对电网模型的标签化需求、需要的电网模型数量,以及样本和验证案例要求;
[0008]根据所获取的对电网模型的标签化需求和所需要的电网模型数量,在预先构建的电网模型库中匹配电网模型,获得匹配的电网模型;
[0009]根据样本和验证案例要求,生成样本预配置需求表;根据样本预配置需求表、所匹配的电网模型,从与所匹配的电网模型关联的样本数据库中抽取样本数据,获得匹配的电网模型的关联样本数据;
[0010]根据样本预配置需求表中的输出样本格式,输出匹配的电网模型及关联样本数据。
[0011]本专利技术进一步的改进在于:所述预先构建的电网模型库为标签化的电网模型库;
所述标签化的电网模型库的构建方法,包括:
[0012]搜集并存储电网模型,为每一个电网模型建立特征标签;根据预设的电网模型存储格式及标签进行存储,获得标签化的电网模型库。
[0013]本专利技术进一步的改进在于:,所述预设的电网模型存储格式为CIM/E格式或CIM/XML格式;
[0014]所述特征标签包括:电网模型ID、时间、地点、规模、经度范围、维度范围、新能源占比、火电占比、水电占比、核电占比、负荷规模和节点数中一个或多个。
[0015]本专利技术进一步的改进在于:所述电网模型关联的样本数据库通过以下方法构建:针对每一个电网模型,搜集与对应电网模型对应的样本数据,按照预设存储格式存储,获得电网模型关联的样本数据库;
[0016]样本数据库预设存储格式是数据文件或者数据库;存储内容包括:对应电网模型ID、时间点、信号点ID、信号点名称、是否电网模型中设备信号、信号值中的一个或多个。
[0017]本专利技术进一步的改进在于:所述根据所获取的对电网模型的标签化需求和所需要的电网模型数量,在预先构建的电网模型库中匹配电网模型,获得匹配的电网模型的步骤,具体包括:
[0018]根据标签化需求,在预先构建的电网模型库中对各电网模型的标签进行匹配,选定匹配度最高的N个电网模型;所述N为所需要的电网模型数量;
[0019]匹配的步骤,具体包括:
[0020]为电网模型库中的所有电网模型建立匹配度变量数组V[i],该数组各分量初始值均设为0;
[0021]读入对电网模型的标签化需求,以及每一个需求的权重,针对每一个标签化需求,循环处理电网模型库中每一个电网模型的对应标签,按照下式计算模型匹配度数组的值:
[0022]其中V[i]表示电网模型库中第i个电网模型的模型匹配度值;n表示对电网模型的标签化需求总数;j表示第j个需求;w
j
表示第j个标签化需求的权重,0≤w
j
≤1,并且x
i,j
表示第i个电网模型在第j个标签化需求的得分,根据标签化需求是值或者范围的不同,比较标签化需求和电网模型的标签值,其评分标准如下:
[0023]如果标签化需求是一个值,那么如果两个标签相等,则对应电网模型的该项标签化需求得分为1,否则为0;
[0024]如果标签化需求是一个数值范围区域,那么如果电网模型的对应标签值正好等于所设定的标签化需求数值范围,则对应电网模型的该项标签化需求得分为1,否则,如果电网模型的对应标签值完全覆盖标签化需求的数值范围区域,则对应电网模型的该项标签化需求得分为0.5,否则为0;
[0025]对所有电网模型的匹配度变量进行从大到小的排序,如果2个电网模型的匹配度变量值相等,则按照循环读入的先后顺序排序;
[0026]选定排在最前面的N个电网模型作为匹配的电网模型。
[0027]本专利技术进一步的改进在于:所述根据样本和验证案例要求,生成样本预配置需求表;根据样本预配置需求表、所匹配的电网模型,从与所匹配的电网模型关联的样本数据库
中抽取样本数据,获得匹配的电网模型的关联样本数据的步骤,具体包括:
[0028]根据样本和验证案例要求,生成样本预配置需求表;所述样本预配置需求表包括以下2种形式中一种:第1种形式:时间范围、信号点ID;第2种形式:时间范围、综合信号ID组、综合信号计算公式;所述综合信号ID组包括至少两个信号点ID;
[0029]根据样本预配置需求表,从所匹配的电网模型所关联的样本数据库中,抽取指定时间范围内的信号点数据或者若干信号点数据通过综合信号计算公式计算出的新数据,作为匹配的电网模型的关联样本数据。
[0030]本专利技术进一步的改进在于:所述根据样本预配置需求表中的输出样本格式,输出匹配的电网模型及关联样本数据的步骤中,所述输出样本格式为CSV格式、txt格式、CIM/E格式、Excel文件格式中的一种或多种。
[0031]第二方面,本专利技术提供一种电网模型及其关联样本数据生成装置,包括:
[0032]获取模块,用于获取对电网模型的标签化需求、需要的电网模型数量,以及样本和验证案例要求;
[0033]模型匹本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.电网模型及其关联样本数据生成方法,其特征在于,包括:获取对电网模型的标签化需求、需要的电网模型数量,以及样本和验证案例要求;根据所获取的对电网模型的标签化需求和所需要的电网模型数量,在预先构建的电网模型库中匹配电网模型,获得匹配的电网模型;根据样本和验证案例要求,生成样本预配置需求表;根据样本预配置需求表、所匹配的电网模型,从与所匹配的电网模型关联的样本数据库中抽取样本数据,获得匹配的电网模型的关联样本数据;根据样本预配置需求表中的输出样本格式,输出匹配的电网模型及关联样本数据。2.根据权利要求1所述的电网模型及其关联样本数据生成方法,其特征在于,所述预先构建的电网模型库为标签化的电网模型库;所述标签化的电网模型库的构建方法,包括:搜集并存储电网模型,为每一个电网模型建立特征标签;根据预设的电网模型存储格式及标签进行存储,获得标签化的电网模型库。3.根据权利要求2所述的电网模型及其关联样本数据生成方法,其特征在于,所述预设的电网模型存储格式为CIM/E格式或CIM/XML格式;所述特征标签包括:电网模型ID、时间、地点、规模、经度范围、维度范围、新能源占比、火电占比、水电占比、核电占比、负荷规模和节点数中一个或多个。4.根据权利要求1所述的电网模型及其关联样本数据生成方法,其特征在于,所述电网模型关联的样本数据库通过以下方法构建:针对每一个电网模型,搜集与对应电网模型对应的样本数据,按照预设存储格式存储,获得电网模型关联的样本数据库;样本数据库预设存储格式是数据文件或者数据库;存储内容包括:对应电网模型ID、时间点、信号点ID、信号点名称、是否电网模型中设备信号、信号值中的一个或多个。5.根据权利要求2所述的电网模型及其关联样本数据生成方法,其特征在于,所述根据所获取的对电网模型的标签化需求和所需要的电网模型数量,在预先构建的电网模型库中匹配电网模型,获得匹配的电网模型的步骤,具体包括:根据标签化需求,在预先构建的电网模型库中对各电网模型的标签进行匹配,选定匹配度最高的N个电网模型;所述N为所需要的电网模型数量;匹配的步骤,具体包括:为电网模型库中的所有电网模型建立匹配度变量数组V[i],数组各分量初始值均设为0;读入对电网模型的标签化需求,以及每一个需求的权重,针对每一个标签化需求,循环处理电网模型库中每一个电网模型的对应标签,按照下式计算模型匹配度数组的值:其中V[i]表示电网模型库中第i个电网模型的模型匹配度值;n表示对电网模型的标签化需求总数;j表示第j个需求;w
j
表示第j个标签化需求的权重,0≤w
j
≤1,并且x
i,j
表示第i个电网模型在第j个标签化需求的得分,根据标签化需求是值或者范围的不同,比较标签化需求和电网模型的标签值,其评分标准如下:如果标签化需求是一个值,那么如果两个标签相等,则对应电网模型的该项标签化需求得分为1,否则为0;如果标签化需求是一个数值范围区域,那么如果电网模型的对应标签值正好等于所设定的标签化
需求数值范围,则对应电网模型的该项标签化需求得分为1,如果电网模型的对应标签值完全覆盖标签化需求的数值范围区域,则对应电网模型的该项标签化需求得分为0.5,否则为0;对所有电网模型的匹配度变量进行从大到小的排序,如果2个电网模型的匹配度变量值相等,则按照循环读入的先后顺序排序;选定排在最前面的N个电网模型作为匹配的电网模型。6.根据权利要求1所述的电网模型及其关联样本数据生成方法,其特征在于,所述根据样本和验证案例要求,生成样本预配置需求表;根据样本预配置需求表、所匹配的电网模型,从与所匹配的电网模型关联的样本数据库中抽取样本数据,获得匹配的电网模型的关联样本数据的步骤,具体包括:根据样本和验证案例要求,生成样本预配置需求表;所述样本预配置需求表包括以下2种形式中一种:第1种形式:时间范围、信号点ID;第2种形式:时间范围、综合信号ID组、综合信号计算公式;所述综合信号ID组包括至少两个信号点ID;根据样本预配置需求表,从所匹配的电网模型所关联的样本数据库中,抽取指定时间范围内的信号点数据或者若干信号点数据通过综合信号计算公式计算出的新数据,作为匹配的电网模型的关联样本数据。7.根据权利要求1所述的电网模型及其关联样本数据生成方法,其特征在于,所述根据样本预配置需求表中的输出样本格式,输出匹配的电网模型及关联样本数据的步骤中,所述输出样本格式为CSV格式、txt格式、CIM/E格式、Excel文件格式中的一种或多种。8.电网模型及其关联样本数据生成装置,其特征在于,包括:获取模块,用于获取对电网模型的标签化需求、需要的电网模型数量,以及样本和验证案例要求;模型匹配模块,用于根据所获取的对电网模型的标签化需求和所需要的电网模型数量,在预先构建的电网模...

【专利技术属性】
技术研发人员:高志远庄卫金于芳张鸿李峰严嘉豪邓雨田王治华陈宏福胡友琳肖大军徐遐龄李鑫
申请(专利权)人:国网上海市电力公司国家电网有限公司华中分部国家电网有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1