本发明专利技术公开了基于大数据分析的企业烟气排放数据检测方法及系统,包括:获取由企业客户端上传的第一烟气排放数据;根据第一烟气排放数据,确定烟气排放时间段;根据烟气排放时间段,获取由安装在企业的传感器采集的第二烟气排放数据;对第一烟气排放数据和第二烟气排放数据进行比较,得到相似系数,根据相似系数判断企业客户端上传的第一烟气排放数据是否准确。上述烟气排放数据检测方法,能够快速的对企业上报的烟气排放数据跟传感器实测数据进行比对,并采用线性回归模型进行大数据分析,快速的检测出两者的差异程度。该方法方便,迅捷,能够及时检测企业烟气排放数据是否存在造假行为,进而避免企业污染烟气的排放,保护我们的生态环境。
【技术实现步骤摘要】
基于大数据分析的企业烟气排放数据检测方法及系统
本公开涉及数据检测
,特别是涉及基于大数据分析的企业烟气排放数据检测方法及系统。
技术介绍
本部分的陈述仅仅是提到了与本公开相关的
技术介绍
,并不必然构成现有技术。随着我国经济水平的不断发展以及人们对物质的需求越来越高,我国现有大部分企业通过建设大量的工厂来提高生产力。这些企业建设的工厂能够生产出我们生活中所需要的产品,提高我们的生活质量,使我们的生活变得丰富多彩;但是,大部分企业(例如石油化工、钢铁、医药、塑料等)在生产过程中会产生大量的烟气,这些烟气中往往含有大量的SO2,CO,HCL等即污染环境又对人的身体有害的物质。这些烟气如果不加以控制直接排放到大气中会严重污染我们的生态环境。在保护生态环境大前提下,环保局要求各个企业在生产过程中对产生的烟气进行二次处理,达到排放要求后方可排放,确保不会污染环境。同时,环保局要求各个企业通过传感器实时监测烟气中各种污染物的浓度,确保污染物排放不会超标。在实现本公开的过程中,专利技术人发现现有技术中存在以下技术问题:各个企业以一个周或一个月为周期,将监测到的排放数据上报到环保局。环保局一方面核查企业上报数据中各污染物浓度是否存在超标现象;另一方面需要检测企业上报数据跟传感器实测数据是否存在差异,面对造假数据环保局无法做到快速识别和准确识别,对于造假数据的造假程度环保局也无法快速得知,现有技术中站位在环保局的角度对企业客户端上传的数据进行检测和甄别。
技术实现思路
为了解决现有技术的不足,本公开提供了基于大数据分析的企业烟气排放数据检测方法及系统;可以检测企业上报的烟气排放数据跟传感器实测数据是否存在差异,进一步检测两者的数据差异程度。第一方面,本公开提供了基于大数据分析的企业烟气排放数据检测方法;基于大数据分析的企业烟气排放数据检测方法,包括:获取由企业客户端上传的第一烟气排放数据;根据第一烟气排放数据,确定烟气排放时间段;根据烟气排放时间段,获取由安装在企业的传感器采集的第二烟气排放数据;对第一烟气排放数据和第二烟气排放数据进行比较,得到相似系数,根据相似系数判断企业客户端上传的第一烟气排放数据是否准确。第二方面,本公开提供了基于大数据分析的企业烟气排放数据检测系统;基于大数据分析的企业烟气排放数据检测系统,包括:第一获取模块,其被配置为:获取由企业客户端上传的第一烟气排放数据;根据第一烟气排放数据,确定烟气排放时间段;第二获取模块,其被配置为:根据烟气排放时间段,获取由安装在企业的传感器采集的第二烟气排放数据;检测模块,其被配置为:对第一烟气排放数据和第二烟气排放数据进行比较,得到相似系数,根据相似系数判断企业客户端上传的第一烟气排放数据是否准确。第三方面,本公开还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述第一方面所述的方法。第四方面,本公开还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述的方法。第五方面,本公开还提供了一种计算机程序(产品),包括计算机程序,所述计算机程序当在一个或多个处理器上运行的时候用于实现前述第一方面任意一项的方法。与现有技术相比,本公开的有益效果是:本专利技术在对企业上报数据和传感器实测数据进行核对的同时利用线性回归模型进行差异性检测。本专利技术可以让环保局工作人员更加直观的了解到企业上报数据跟传感器实测数据的差异程度,进一步确定企业上报数据是否存在造假情况。附图说明构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。图1为本公开实施例一的方法流程图;图2为本公开实施例一的相似系数获取流程图;图3为本公开实施例一的回归模型训练测试流程图。具体实施方式应该指出,以下详细说明都是示例性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。实施例一本实施例提供了基于大数据分析的企业烟气排放数据检测方法;如图1所示,基于大数据分析的企业烟气排放数据检测方法,包括:S101:获取由企业客户端上传的第一烟气排放数据;根据第一烟气排放数据,确定烟气排放时间段;S102:根据烟气排放时间段,获取由安装在企业的传感器采集的第二烟气排放数据;S103:对第一烟气排放数据和第二烟气排放数据进行比较,得到相似系数,根据相似系数判断企业客户端上传的第一烟气排放数据是否准确。作为一个或多个实施例,所述方法,还包括:对第一烟气排放数据和第二烟气排放数据进行比较,得到相似系数,根据相似系数与阈值的比较结果,当相似系数大于设定阈值时,则判定企业客户端上传的第一烟气排放数据是准确的;否则,判定企业客户端上传的第一烟气排放数据是不准确的。示例性的,所述设定阈值,例如:0.95、0.85、0.75;这里对阈值数值不做任何限定,本领域技术人员可以根据需要设置。根据得到的相似系数K是否大于0.95来确定企业上报数据跟传感器实测数据是否一致。如果K>0.95,两组数据一致,反之,两组数据不一致。进一步地,如图2所示,所述相似系数的计算步骤包括:S1031:设置第一变量和第二变量初始值均为零;S1032:从起始时间点开始,依次比对第一烟气排放数据和第二烟气排放数据相应时间点内的数据是否相同;S1033:开始比对时,第一变量值加一;如果比对的数据一致,则第二变量值加一;否则第二变量值不作任何处理;S1034:重复步骤S1033,直至抽取到最后一个时间点;比对结束后,计算相似系数,所述相似系数等于比对结束后的第一变量与第二变量的比值。示例性的,所述相似系数的计算步骤包括:第一步:设置变量n=0,m=0,设置相似系数K=0。第二步:从起始时间点开始,依次比对相应时间点内数据是否相同。本文档来自技高网...
【技术保护点】
1.基于大数据分析的企业烟气排放数据检测方法,其特征是,包括:/n获取由企业客户端上传的第一烟气排放数据;根据第一烟气排放数据,确定烟气排放时间段;/n根据烟气排放时间段,获取由安装在企业的传感器采集的第二烟气排放数据;/n对第一烟气排放数据和第二烟气排放数据进行比较,得到相似系数,根据相似系数判断企业客户端上传的第一烟气排放数据是否准确。/n
【技术特征摘要】
1.基于大数据分析的企业烟气排放数据检测方法,其特征是,包括:
获取由企业客户端上传的第一烟气排放数据;根据第一烟气排放数据,确定烟气排放时间段;
根据烟气排放时间段,获取由安装在企业的传感器采集的第二烟气排放数据;
对第一烟气排放数据和第二烟气排放数据进行比较,得到相似系数,根据相似系数判断企业客户端上传的第一烟气排放数据是否准确。
2.如权利要求1所述的方法,其特征是,所述方法,还包括:
对第一烟气排放数据和第二烟气排放数据进行比较,得到相似系数,根据相似系数与阈值的比较结果,当相似系数大于设定阈值时,则判定企业客户端上传的第一烟气排放数据是准确的;否则,判定企业客户端上传的第一烟气排放数据是不准确的。
3.如权利要求1或2所述的方法,其特征是,所述相似系数的计算步骤包括:
设置第一变量和第二变量初始值均为零;
从起始时间点开始,依次比对第一烟气排放数据和第二烟气排放数据相应时间点内的数据是否相同;
开始比对时,第一变量值加一;如果比对的数据一致,则第二变量值加一;否则第二变量值不作任何处理;
重复上一步,直至抽取到最后一个时间点;比对结束后,计算相似系数,所述相似系数等于比对结束后的第一变量与第二变量的比值。
4.如权利要求1或2所述的方法,其特征是,所述方法,还包括:
对于第一烟气排放数据结果为不准确时,利用回归模型检测数据的差异程度。
5.如权利要求4所述的方法,其特征是,利用回归模型检测数据的差异程度;具体是根据回归系数和截距确定两组烟气排放数据的差异程度,回归系数表示第一烟气排放数据的造假程度。
6.如权利要求4所述的方法,其特征是,对于第一烟气排放数据结果为...
【专利技术属性】
技术研发人员:刘方爱,鞠杰,
申请(专利权)人:山东师范大学,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。