System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于深度学习的固定污染源异常数据识别系统及方法技术方案_技高网

一种基于深度学习的固定污染源异常数据识别系统及方法技术方案

技术编号:41379055 阅读:20 留言:0更新日期:2024-05-20 10:21
本发明专利技术涉及污染源数据识别领域,具体为一种基于深度学习的固定污染源异常数据识别系统及方法,包括决策树模型构建模块、有效决策树模型分析模块、异常污染源预警模块和第二可疑污染源分析模块;决策树模型构建模块用于分析污染源属性和类别间的关系以构建可区分固定污染源类别的决策树模型;有效决策树模型分析模块用于验证选取准确率最高的决策树模型作为固定污染源分类的有效决策树模型;异常污染源预警模块用于利用K‑means聚类分析算法对每一类固定污染源中的污染数据进行分析并预警异常污染源;第二可疑污染源分析模块用于在实时监测当存在任一满足异常响应区间的固定污染源预警时对存在关联的第二可疑污染源进行再预警。

【技术实现步骤摘要】

本专利技术涉及污染源数据识别,具体为一种基于深度学习的固定污染源异常数据识别系统及方法


技术介绍

1、固定污染源是指排放大气污染物的各类行业企业、场所生产设施、固定设备等,简称固定源。固定源是燃煤、燃油、燃气的锅炉和工业炉窑以及石油化工、治金、建材等生产过程中产生的废气通过排气筒向空气中排放的污染源;固定污染源数据主要以污染源在线监测、排污许可、环境统计、污染普查等数据为主,现有技术对固定污染源数据的监理多从数据的有效性、数据的真实性以及数据的可溯源性出发,对数据自身以现代化数据分析手段做出了充分的处理;但同时对于污染源数据的多样性,究其根本是污染源的分类不明确,以及在异常数据出现时,对数据所属的污染源类型以及可能关联影响到的污染源不敏感,导致现有很多污染源异常数据识别上都是基于已发生过异常事件上的识别,并不能有效利用数据分析异常事件做到前瞻性预警,使得降低污染源异常的风险性。


技术实现思路

1、本专利技术的目的在于提供一种基于深度学习的固定污染源异常数据识别系统及方法,以解决上述
技术介绍
中提出的问题。

2、为了解决上述技术问题,本专利技术提供如下技术方案:一种基于深度学习的固定污染源异常数据识别方法,包括以下分析步骤:

3、步骤s100:获取每一固定污染源在相同监测周期内记录的在线监测数据,基于在线监测数据,分析污染源属性和类别间的关系以构建可区分固定污染源类别的决策树模型;

4、步骤s200:获取利用若干决策树分类算法对应构建的若干决策树模型,验证选取准确率最高的决策树模型作为固定污染源分类的有效决策树模型;

5、步骤s300:基于有效决策树模型中的每一类固定污染源,利用k-means聚类分析算法对每一类固定污染源中的污染数据进行分析并预警异常污染源;

6、步骤s400:提取异常污染源在监测周期内的预警响应数据以构建固定污染源对应的异常响应区间,并在实时监测当存在任一满足异常响应区间的固定污染源预警时对存在关联的第二可疑污染源进行再预警。

7、进一步的,构建可区分固定污染源类别的决策树模型包括以下步骤:

8、步骤s110:将在线监测数据按照比例a:b分为训练数据和测试数据,且a≥b,决策树模型是指由非叶节点、分支和叶节点构成的树结构;每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,每个叶节点存放一个类别;

9、步骤s120:基于训练数据中的在线监测数据,标记在线监测数据的特征属性,从根节点开始利用决策树算法选取对应的特征属性,并按照在线监测数据对应的数值选择输出分支,直到到达叶节点,将叶节点存放的类别作为决策结果;

10、步骤s130:遍历训练数据中的所有在线监测数据直至将所有特征属性存储至对应的非叶节点,构成可区分固定污染源类别的决策树模型。

11、进一步的,步骤s200包括以下步骤:

12、步骤s210:决策树模型包含若干决策路径,决策路径是指由根结点为起始节点、经过对应分支直到到达叶节点为止的路径;

13、步骤s220:将相同测试数据分别代入每个决策树模型中,遍历匹配与每个决策树模型中根结点对应特征属性相同的测试数据,基于测试数据对应的在线监测数值定位满足分支输出值以及非叶节点中特征属性在到达叶节点前相同的决策路径为目标决策路径,标记目标决策路径中叶节点对应的类别为目标类别;将目标类别与测试数据对应的固定污染物类别进行比较;

14、当目标类别与测试数据对应的固定污染物类别相同时,决策树模型输出判断正确信号;当目标类别与测试数据对应的固定污染物类别不同时,决策树模型输出判断错误信号;

15、步骤s230:提取第i种决策树模型对应输出判断正确信号的次数ti和判断错误信号的次数fi,利用公式;

16、qi=ti/(ti+fi)

17、计算第i种决策树模型的决策正确率;选取决策正确率最大值对应的决策树模型作为固定污染源分类的有效决策树模型。

18、分析有效决策树模型的目的是选取与当前污染源数据精确匹配度最高的分类模型,使得污染源数据特征的分类可靠性更高,且可以最大化的降低后续利用k-means分析方法中由于k值的难以确定性带来的误差率。

19、进一步的,步骤s300包括以下步骤:

20、步骤s310:基于有效决策树模型中固定污染源的类别确定聚类中心的个数k,在数据集中随机选择k个污染源作为初始化为聚类中心,数据集是指每类固定污染源记录所有在线监测数据;

21、步骤s320:依次计算在线监测数据到k个聚类中心的距离,选择聚类最小的中心,将计算的在线监测数据划分到对应类别中;计算每个聚类的中心点,将中心点更新为对应类别新的聚类中心点;

22、步骤s330:不断重复步骤s310至s320,直到数据划分不再变化停止循环,以此实现对污染源的智能异常监测,将离群点划分为异常污染源;离群点是指在数据集中与其他数据点相比数值存在差值大于差值阈值的点;基于异常污染源确定对应的固定污染源并进行预警。

23、进一步的,步骤s400包括以下步骤:

24、预警响应数据包括预警响应次数和所需预警的污染数值,监测周期是指包含每一类固定污染源至少存在一次预警响应的最短监测时长;所需预警的污染数值是指在k-means分析中输出离群点对应的数值;

25、获取监测周期内的每一类固定污染源记录所需预警的污染数值w的最大值wmax和最小值wmin,并构成固定污染源对应的异常响应区间a,a=[wmin,wmax];

26、当实时监测获取的污染源数据属于任一固定污染源对应的异常响应区间a时,传输预警信号,并对存在关联的第二可疑污染源进行再预警;

27、存在关联的第二可疑污染源包括以下分析过程:

28、将每一类固定污染源按照预警次数进行由大到小的排序,选取排序第一的固定污染源记录的重点决策路径,重点决策路径是指在同一固定污染源存在多个决策路径时包含非叶节点最多的路径;当包含非叶节点最多的路径不唯一时,选取任一作为重点决策路径;

29、提取与重点决策路径存在路径部分相同且对应固定污染源类别不同的其他决策路径作为待分析决策路径,将待分析决策路径按照相同路径部分包含非叶节点的个数进行由大到小的排序生成第一序列;

30、基于第一序列记录待分析决策路径中包含的非叶节点个数1和待分析决策路径对应固定污染源预警响应的次数p1,计算每一待分析决策路径与重点决策路径对应固定污染源时的预警响应差值p0,p0=p2-p1,其中p2表示重点决策路径对应固定污染源的总预警响应次数;

31、并构成第一序列中每一待分析决策路径对应固定污染源的数据组,=(1,0),其中表示第一序列中第i个数据组,d1i表示第一序列中第i个待分析决策路径包含的非叶节点个数,p0i表示第一序列中第i个待分析决策路径与重点决策路径本文档来自技高网...

【技术保护点】

1.一种基于深度学习的固定污染源异常数据识别方法,其特征在于,包括以下分析步骤:

2.根据权利要求1所述的一种基于深度学习的固定污染源异常数据识别方法,其特征在于:所述构建可区分固定污染源类别的决策树模型包括以下步骤:

3.根据权利要求2所述的一种基于深度学习的固定污染源异常数据识别方法,其特征在于:所述步骤S200包括以下步骤:

4.根据权利要求3所述的一种基于深度学习的固定污染源异常数据识别方法,其特征在于:所述步骤S300包括以下步骤:

5.根据权利要求4所述的一种基于深度学习的固定污染源异常数据识别方法,其特征在于:所述步骤S400包括以下步骤:

6.一种基于深度学习的固定污染源异常数据识别系统,应用权利要求1-5中任一项所述的一种基于深度学习的固定污染源异常数据识别方法,其特征在于,包括决策树模型构建模块、有效决策树模型分析模块、异常污染源预警模块和第二可疑污染源分析模块;

7.根据权利要求6所述的一种基于深度学习的固定污染源异常数据识别系统,其特征在于:所述有效决策树模型分析模块包括数据分类单元、数据遍历单元、信号输出单元和决策正确率计算单元;

8.根据权利要求7所述的一种基于深度学习的固定污染源异常数据识别系统,其特征在于:所述第二可疑污染源分析模块包括异常响应区间分析单元、重点决策路径确定单元、第一序列生成单元和关联分析单元;

9.根据权利要求8所述的一种基于深度学习的固定污染源异常数据识别系统,其特征在于:所述关联关系分析单元包括预警响应差值计算单元、数据组构建单元、关联指数计算单元和预警分析单元;

...

【技术特征摘要】

1.一种基于深度学习的固定污染源异常数据识别方法,其特征在于,包括以下分析步骤:

2.根据权利要求1所述的一种基于深度学习的固定污染源异常数据识别方法,其特征在于:所述构建可区分固定污染源类别的决策树模型包括以下步骤:

3.根据权利要求2所述的一种基于深度学习的固定污染源异常数据识别方法,其特征在于:所述步骤s200包括以下步骤:

4.根据权利要求3所述的一种基于深度学习的固定污染源异常数据识别方法,其特征在于:所述步骤s300包括以下步骤:

5.根据权利要求4所述的一种基于深度学习的固定污染源异常数据识别方法,其特征在于:所述步骤s400包括以下步骤:

6.一种基于深度学习的固定污染源异常数据识别系统,应用权利要求1-5中任一项所述的一种基于深度学...

【专利技术属性】
技术研发人员:张巍李明娜黄宝琦金鹏侯永春李铸英冯涛贾冰郭雪征萧峰田贝宁杨伟民
申请(专利权)人:内蒙古生态环境大数据有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1