流域水质预测方法和装置、计算机可读存储介质制造方法及图纸

技术编号:28137288 阅读:15 留言:0更新日期:2021-04-21 19:08
本公开实施例提供流域水质预测方法和装置、计算机可读存储介质,属于水质预测领域。流域水质预测方法,包括:获取流域的样本数据集;对所述流域的样本数据集进行独热码预处理,得到预处理后的中间样本数据;将所述中间样本数据输入至预设的目标预测模型;通过所述目标预测模型对所述中间样本数据进行预测,得到目标水质数据,本公开实施例只需要构建目标预测模型,不需要构建多个模型,降低了构建模型的成本,并提高了预测水质数据的准确性。并提高了预测水质数据的准确性。并提高了预测水质数据的准确性。

【技术实现步骤摘要】
流域水质预测方法和装置、计算机可读存储介质


[0001]本专利技术涉及计算机领域,尤其涉及流域水质预测方法和装置、计算机可读存储介质。

技术介绍

[0002]流域水质预测方法通常使用机器学习算法,例如KNN、线性回归、逻辑回归、支持向量机等,能满足部分需求。但机器学习算法受限于其输入数据类型的要求,只能是数值类型,在这样的前提下,对流域水质影响权重较大的文本型数据不能进行处理;另外,流域环境复杂,很难找到一种算法较能好地拟合流域水质预测的需求,通用的方法利用常见的机器学习算法建立多个模型,比较麻烦和复杂。

技术实现思路

[0003]本公开实施例的主要目的在于提出一种流域水质预测方法和装置、计算机可读存储介质,以降低构建预测模型的成本、提高预测水质数据的准确性。
[0004]为实现上述目的,本公开实施例的第一方面提出了一种流域水质预测方法,包括:
[0005]获取流域的样本数据集;
[0006]对所述流域的样本数据集进行独热码预处理,得到预处理后的中间样本数据;
[0007]将所述中间样本数据输入至预设的目标预测模型;
[0008]接收所述预测模型根据所述中间样本数据预测出的目标水质数据。
[0009]在一些实施例中,所述流域的样本数据集包括文本数据,所述对所述流域的样本数据集进行独热码预处理,得到预处理后的中间样本数据,包括:
[0010]获取所述文本数据;
[0011]获取历史数据;
[0012]根据所述文本数据对所述历史数据进行独热码编码预处理,得到所述中间样本数据。
[0013]在一些实施例中,所述文本数据包括天气数据。
[0014]在一些实施例中,对所述流域的样本数据集进行清洗处理,得到清洗后的流域中间数据;其中,将所述清洗后的流域中间数据作为进行所述独热码预处理的数据。
[0015]在一些实施例中,所述流域中间数据至少包括以下数据之一:空值数据、重复数据、异常范围数据、通过天气接口获取到的外部数据,所述对所述流域中间数据进行清洗处理,得到清洗后的流域中间数据,至少包括以下步骤之一:
[0016]对所述空值数据进行清洗处理,得到所述清洗后的流域中间数据;
[0017]对所述重复数据进行清洗处理,得到所述清洗后的流域中间数据;
[0018]对所述异常范围数据进行清洗处理,得到所述清洗后的流域中间数据;
[0019]对所述外部数据进行清洗处理,得到所述清洗后的流域中间数据。
[0020]在一些实施例中,所述中间样本数据包括样本水质数据,所述方法还包括:构建所
述目标预测模型,具体包括:
[0021]根据所述样本水质数据构建初始预测模型;
[0022]将所述样本水质数据输入至所述初始预测模型进行训练,得到所述目标预测模型。
[0023]在一些实施例中,所述中间样本数据还包括测试水质数据,所述方法还包括:根据所述测试水质数据对所述目标预测模型进行评估。
[0024]在一些实施例中,所述方法还包括:
[0025]将所述目标预测模型部署至应用平台,所述应用平台至少为以下之一:应用数据库或者应用管理平台。
[0026]为实现上述目的,本公开实施例的第二方面提出了一种流域水质预测装置,包括:
[0027]获取模块,用于获取流域的样本数据集;
[0028]预处理模块,用于对所述流域的样本数据集进行独热码预处理,得到预处理后的中间样本数据;
[0029]输入模块,用于将所述中间样本数据输入至预设的目标预测模型;
[0030]接收模块,用于接收所述预测模型根据所述中间样本数据预测出的目标水质数据。
[0031]为实现上述目的,本公开实施例的第三方面提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行:如上述所述的方法。
[0032]本公开实施例提出的流域水质预测方法和装置、计算机可读存储介质,通过获取流域的样本数据集,对流域的样本数据集进行独热码预处理,得到预处理后的中间样本数据,将中间样本数据输入至预设的目标预测模型,通过目标预测模型对中间样本数据进行预测,得到目标水质数据,只需要构建目标预测模型,不需要构建多个模型,降低了构建模型的成本,并提高了预测水质数据的准确性。
附图说明
[0033]图1是本公开第一实施例提供的流域水质预测方法的流程图。
[0034]图2是图1中的步骤102的流程图。
[0035]图3是本公开第二实施例提供的流域水质预测方法的流程图。
具体实施方式
[0036]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
[0037]需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
[0038]除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的

技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本专利技术实施例的目的,不是旨在限制本专利技术。
[0039]首先,对本申请中涉及的若干名词进行解析:
[0040]酸碱度(pondus hydrogenii,PH):描述的是水溶液的酸碱性强弱程度,用pH来表示。热力学标准状况时,pH=7的水溶液呈中性,pH<7者显酸性,pH>7者显碱性。
[0041]K最近邻(K

NearestNeighbor,KNN)算法:是一种分类算法,是数据挖掘分类技术中的方法之一。其中K最近邻,是指每个样本都可以用最接近的K个邻近值来代表。近邻算法就是将数据集合中每一个记录进行分类的方法。
[0042]线性回归:是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为y=w'x+e,e为误差服从均值为0的正态分布。
[0043]逻辑回归:是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。
[0044]支持向量机:是由模式识别中广义肖像算法(generalized portrait algorithm)发展而来的分类器,是一类按监督学习(supervised learning)方式对数据进行二元分类的广义线性分类器(generalized linear classifier),其决策边界是对学习样本求解的最大边距超平面。
[0045]tf.keras.Model类:将定义好的网络结构封装入一个对象,用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种流域水质预测方法,其特征在于,包括:获取流域的样本数据集;对所述流域的样本数据集进行独热码预处理,得到预处理后的中间样本数据;将所述中间样本数据入至预设的目标预测模型;接收所述目标预测模型根据所述中间样本数据预测出的目标水质数据。2.根据权利要求1所述的方法,其特征在于,所述流域的样本数据集包括文本数据,所述对所述流域的样本数据集进行独热码预处理,得到预处理后的中间样本数据,包括:获取所述文本数据;获取历史数据;根据所述文本数据对所述历史数据进行独热码编码预处理,得到所述中间样本数据。3.根据权利要求2所述的方法,其特征在于,所述文本数据包括天气数据。4.根据权利要求1所述的方法,其特征在于,还包括:对所述流域的样本数据集进行清洗处理,得到清洗后的流域中间数据;其中,将所述清洗后的流域中间数据作为进行所述独热码预处理的数据。5.根据权利要求4所述的方法,其特征在于,所述流域中间数据至少包括以下数据之一:空值数据、重复数据、异常范围数据、通过天气接口获取到的外部数据,所述对所述流域中间数据进行清洗处理,得到清洗后的流域中间数据,至少包括以下步骤之一:对所述空值数据进行清洗处理,得到所述清洗后的流域中间数据;对所述重复数据进行清洗处理,得到所述清洗后的流域中间数据;对所述异常范围数据...

【专利技术属性】
技术研发人员:李震孙锋黄红杉
申请(专利权)人:深圳市水务科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1