System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种水处理大数据汇总分析方法及系统技术方案_技高网

一种水处理大数据汇总分析方法及系统技术方案

技术编号:40479723 阅读:6 留言:0更新日期:2024-02-26 19:14
一种水处理大数据汇总分析方法及系统,涉及大数据分析技术领域。在该方法中,获取各个企业对应的水处理数据、企业画像数据以及地区数据;确定多个缺失水处理数据和多个完整水处理数据,基于多个第二企业对应的完整水处理数据、企业画像数据以及地区数据对各个第一企业对应的缺失水处理数据中缺失的水处理子数据进行补全;基于完整水处理数据、企业画像数据以及地区数据,构建综合水处理大数据集;从各个综合水处理大数据集中提取多个水处理特征;基于多个水处理特征对各个企业的水排放进行污染风险预测,确定存在水排放污染风险的企业。实施本申请的技术方案,可以在对存在数据缺失的水处理大数据进行分析预测时,提高预测结果的准确程度。

【技术实现步骤摘要】

本申请涉及大数据分析,具体涉及一种水处理大数据汇总分析方法及系统


技术介绍

1、水处理大数据分析是指通过收集和分析与水处理相关的大量数据来进行决策和优化的过程。官方机构可根据企业的水处理大数据分析并预测企业的水排放是否超标。

2、然而,现如今在对企业的水处理大数据进行分析并预测企业的水排放是否超标时,获取的企业的水处理大数据往往会存在数据缺失的情况,从而导致在对存在数据缺失的水处理大数据进行分析预测时,得到的企业水排放是否超标的预测结果的准确程度较低。因此,如何在对存在数据缺失的水处理大数据进行分析预测时,提高预测结果的准确程度成为亟需解决的技术问题。

3、因此,亟需一种水处理大数据汇总分析方法及系统来解决当前技术存在的问题。


技术实现思路

1、本申请提供了一种水处理大数据汇总分析方法及系统,可以在对存在数据缺失的水处理大数据进行分析预测时,提高预测结果的准确程度。

2、第一方面,本申请提供了一种水处理大数据汇总分析方法,所述方法包括:获取各个企业对应的水处理数据、企业画像数据以及地区数据;其中,所述水处理数据中包括至少一个水处理子数据;遍历各个所述水处理数据,确定多个缺失水处理数据和多个完整水处理数据,并确定多个所述缺失水处理数据对应的第一企业和多个所述完整水处理数据对应的第二企业;其中,所述缺失水处理数据为存在所述水处理子数据缺失的水处理数据,所述完整水处理数据为不存在所述水处理子数据缺失的水处理数据;基于多个所述第二企业对应的所述完整水处理数据、所述企业画像数据以及所述地区数据对各个所述第一企业对应的所述缺失水处理数据中缺失的水处理子数据进行补全,得到各个所述第一企业对应的完整水处理数据;基于各个企业对应的所述完整水处理数据、所述企业画像数据以及所述地区数据,构建各个企业对应的综合水处理大数据集;从各个所述综合水处理大数据集中提取多个水处理特征;基于多个所述水处理特征对各个企业的水排放进行污染风险预测,确定存在水排放污染风险的企业。

3、通过采用上述技术方案,通过获取各个企业对应的水处理数据、企业画像数据以及地区数据,以确定各个企业的水处理情况、有关企业的详细信息以及有关地理位置和环境的信息,从而为后续分析预测提供基础;通过对水处理数据进行遍历,找出缺失水处理数据和完整水处理数据,并确定多个缺失水处理数据对应的第一企业和多个完整水处理数据对应的第二企业,再基于第二企业的完整水处理数据、企业画像数据和地区数据,对第一企业的缺失水处理数据中的缺失部分进行填充,从而获得第一企业的完整水处理数据,避免后续对水处理数据进行分析预测时存在数据缺失的情况,进而提高预测的精准程度;再使用各个企业的完整水处理数据、企业画像数据和地区数据,构建一个综合水处理大数据集,并从综合水处理大数据集中提取多个水处理特征,从而使得提取得到的水处理特征更加符合影响水排放和污染风险的关键因素;最后通过提取的特征进行污染风险预测,以使得得到的污染风险预测结构更加准确。

4、可选的,所述企业画像数据包括企业规模和企业类型;所述地区数据包括地理位置和地区环境;所述基于多个所述第二企业对应的所述完整水处理数据、所述企业画像数据以及所述地区数据对各个所述第一企业对应的所述缺失水处理数据中缺失的水处理子数据进行补全,得到各个所述第一企业对应的完整水处理数据,具体包括:基于所述第一企业对应的所述企业规模和所述企业类型,从多个所述第二企业中匹配得到多个第三企业;基于各个所述第三企业对应的地理位置和地区环境,计算各个所述第三企业对应的地理匹配值;基于多个所述地理匹配值,从多个所述第三企业中确定第四企业;所述第四企业对应的地理匹配值大于其余所述第三企业对应的地理匹配值;基于所述第四企业对应的所述完整水处理数据,对所述第一企业对应的所述缺失水处理数据中缺失的水处理子数据进行补全,得到所述第一企业对应的完整水处理数据。

5、通过采用上述技术方案,通过基于第一企业对应的企业规模和企业类型,从多个第二企业中匹配得到多个第三企业,进一步地基于多个地理匹配值,从多个第三企业中确定地理匹配值大于其余第三企业对应的地理匹配值的第四企业,以使得匹配得到的第四企业在企业条件和地理环境条件上与第一企业的相似度最高,再基于第四企业对应的完整水处理数据,对第一企业对应的缺失水处理数据中缺失的水处理子数据进行补全,以使得补全的第一企业对应的缺失水处理数据更加符合第一企业的实际情况,从而使得补全的水处理数据精准度更高。

6、可选的,所述基于各个所述第三企业对应的地理位置和地区环境,计算各个所述第三企业对应的地理匹配值,具体包括:基于各个所述第三企业对应的所述地理位置,确定各个所述第三企业对应的地理位置关联值;基于各个所述第三企业对应的所述地区环境,确定各个所述第三企业对应的地区环境关联值;基于各个所述地理位置关联值和各个所述地区环境关联值,计算各个所述第三企业对应的地理匹配值。

7、可选的,所述基于各个所述地理位置关联值和各个所述地区环境关联值,计算各个所述第三企业对应的地理匹配值,具体包括:通过以下公式计算各个所述第三企业对应的地理匹配值:x=αp+βq;其中,x为所述地理匹配值,p为所述地理位置关联值,q为所述地区环境关联值,α为第一影响权重,β为第二影响权重。

8、可选的,所述水处理子数据包括结构化子数据和非结构化子数据;所述基于所述第四企业对应的所述完整水处理数据,对所述第一企业对应的所述缺失水处理数据中缺失的水处理子数据进行补全,得到所述第一企业对应的完整水处理数据,具体包括:确定所述第四企业对应的所述完整水处理数据中的第一结构化子数据和第一非结构化子数据;确定所述第一企业对应的所述缺失水处理数据中缺失的缺失结构化子数据和缺失非结构化子数据;构建所述第一结构化子数据和所述确实结构化子数据的第一映射关系;构建所述第一非结构化子数据和所述缺失非结构化子数据的第二映射关系;对所述第一结构化子数据采用拟合结果填充和众数填充中的一种或两种方法进行结构化子数据处理,得到第二结构化子数据;基于所述第一映射关系和所述第二结构化子数据,对所述缺失结构化子数据进行补全;对所述第一非结构化子数据采用文本预处理和标准化处理中的一种或两种方法进行非结构化子数据处理,得到第二非结构化子数据;基于所述第二映射关系和所述第二非结构化子数据,对所述缺失非结构化子数据进行补全。

9、通过采用上述技术方案,通过确定第一企业缺失的结构化和非结构化子数据,以明确需要补全的具体数据点;构建第一结构化子数据与缺失结构化子数据之间的第一映射关系,以及第一非结构化子数据与缺失非结构化子数据之间的第二映射关系,从而为数据补全过程提供一个清晰的参考框架。根据第一映射关系和处理后的结构化子数据,补全第一企业缺失的结构化子数据,并根据第二映射关系和处理后的非结构化子数据,补全第一企业缺失的非结构化子数据,从而确保了补全后的水处理数据在格式和内容上的完整性,进而提高了后续分析及预测的准确程度。

10、可选本文档来自技高网...

【技术保护点】

1.一种水处理大数据汇总分析方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述企业画像数据包括企业规模和企业类型;所述地区数据包括地理位置和地区环境;所述基于多个所述第二企业对应的所述完整水处理数据、所述企业画像数据以及所述地区数据对各个所述第一企业对应的所述缺失水处理数据中缺失的水处理子数据进行补全,得到各个所述第一企业对应的完整水处理数据,具体包括:基于所述第一企业对应的所述企业规模和所述企业类型,从多个所述第二企业中匹配得到多个第三企业;

3.根据权利要求2所述的方法,其特征在于,所述基于各个所述第三企业对应的地理位置和地区环境,计算各个所述第三企业对应的地理匹配值,具体包括:

4.根据权利要求3所述的方法,其特征在于,所述基于各个所述地理位置关联值和各个所述地区环境关联值,计算各个所述第三企业对应的地理匹配值,具体包括:

5.根据权利要求2所述的方法,其特征在于,所述水处理子数据包括结构化子数据和非结构化子数据;所述基于所述第四企业对应的所述完整水处理数据,对所述第一企业对应的所述缺失水处理数据中缺失的水处理子数据进行补全,得到所述第一企业对应的完整水处理数据,具体包括:

6.根据权利要求1所述的方法,其特征在于,所述基于多个所述水处理特征对各个企业的水排放进行污染风险预测,确定存在水排放污染风险的企业,具体包括:

7.根据权利要求6所述的方法,其特征在于,所述基于多个所述水处理特征,计算得到各个企业对应的排放污染风险预测值,具体包括:

8.一种水处理大数据汇总分析系统,其特征在于,所述系统包括获取模块、处理模块以及水排放污染风险确定模块;

9.一种电子设备,其特征在于,包括处理器(401)、存储器(405)、用户接口(403)及网络接口(404),所述存储器(405)用于存储指令,所述用户接口(403)和网络接口(404)用于给其它设备通信,所述处理器(401)用于执行所述存储器(405)中存储的指令,以使所述电子设备(400)执行如权利要求1-7任意一项所述的方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有指令,当所述指令被执行时,执行如权利要求1-7任意一项所述的方法。

...

【技术特征摘要】

1.一种水处理大数据汇总分析方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述企业画像数据包括企业规模和企业类型;所述地区数据包括地理位置和地区环境;所述基于多个所述第二企业对应的所述完整水处理数据、所述企业画像数据以及所述地区数据对各个所述第一企业对应的所述缺失水处理数据中缺失的水处理子数据进行补全,得到各个所述第一企业对应的完整水处理数据,具体包括:基于所述第一企业对应的所述企业规模和所述企业类型,从多个所述第二企业中匹配得到多个第三企业;

3.根据权利要求2所述的方法,其特征在于,所述基于各个所述第三企业对应的地理位置和地区环境,计算各个所述第三企业对应的地理匹配值,具体包括:

4.根据权利要求3所述的方法,其特征在于,所述基于各个所述地理位置关联值和各个所述地区环境关联值,计算各个所述第三企业对应的地理匹配值,具体包括:

5.根据权利要求2所述的方法,其特征在于,所述水处理子数据包括结构化子数据和非结构化子数据;所述基于所述第四企业对应的所述完整水处理数据,对所述第一企业对应的所述缺失水处理数...

【专利技术属性】
技术研发人员:谢巍纪飞孙晓利王超张雷方强国
申请(专利权)人:北京连华永兴科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1