【技术实现步骤摘要】
一种基于机器学习的市政污水的水质分类方法
[0001]本专利技术属于污水水质分析领域,特别涉及一种基于机器学习的市政污水的水质分类方法
。
技术介绍
[0002]水质在世界范围内都存在问题
。
在人口稠密的地区,由于人类活动
、
城市化
、
工业化和废物处理,水质参数急剧恶化
。
水质评估当前面临着全球性挑战,且水质评估对维护水体健康和人体安全至关重要
。
水质差的水体,溶解氧含量低,不适宜水中生物生存,且极易影响周边环境和危害人体健康
。
然而水体情况复杂,评估水质指标的种类丰富多样,选择具有代表性的指标来进行水体质量评价显得格外重要
。
市政污水是城市运转和人们生活中产生的废水,收集的废水会在污水厂中进行处理,达标后再排入附近河流
。
而市政污水在未处理前可评估一个城市的水质情况,以此来推测该城市发展情况和人们日常生活中具体行为,这不仅对城市经济发展重要,也有益于促进人们对水体保护的意识
。
[0003]然而市政污水水质等级评估,存在以下几个问题,导致水质评估过程难以实现
。
第一,需要采集全国各市中污水处理厂中进水端水样,然而这个过程成本大,周期长,对样品的处理和测定也需要十分谨慎;第二,市政污水中水质情况复杂,需要找到具有代表性的评价指标来反映水体情况;第三,传统方法不足以满足我们对市政污水水质评估的要求,且需要更好的方法从众多指标中找到最关键 ...
【技术保护点】
【技术特征摘要】
1.
一种基于机器学习的市政污水的水质分类方法,其特征在于,包括以下步骤:步骤1,建立市政污水数据库并对数据进行预处理;步骤2,采用聚类算法对数据库中的数据进行处理;步骤3,采用分类算法得到分类结果,分类结果按照准确度
、
召回率
、F
‑1分数和精确度来评价,获取重要性排前3的指标;步骤4,获取水质关键指标水质分类标签;步骤5,对市政污水水质等级进行划分;步骤6,将筛选出的关键指标数据和水质标签通过逆推神经网络的原理整理出市政污水水质等级公式
。2.
根据权利要求1所述的方法,其特征在于,步骤1包括:步骤1‑1,测定市政污水进水端五大类指标:常规指标
、
毒性指标
、
金属离子指标
、PPCPs
和
PFOS
;步骤1‑2,将市政污水数据按照五大类指标划分为五大类数据,然后将每一大类数据与别的一个或两个以上大类数据进行组合,得到数据库;步骤1‑3,采用当地污水处理厂测定指标的平均值来代替收集的数据中的缺失值
、
异常值或重复值
。3.
根据权利要求2所述的方法,其特征在于,步骤2包括:步骤2‑1,对数据库中的数据进行标准化和
PCA
降维;步骤2‑2,通过聚类算法对数据库中的数据进行聚类,按轮廓系数和聚类结果图来评价聚类效果;聚类效果图根据二维图进行综合评价;步骤2‑3,从根据每一大类指标进行组合的数据的聚类结果中,除了当前大类指标单独聚类结果,额外选择最好的两份组合聚类结果,作为初级分类标签
。4.
根据权利要求3所述的方法,其特征在于,步骤2‑2中,通过聚类算法将数据库中的数据分为了
k
个簇,对于簇中的每个向量,分别计算它们的轮廓系数:对于
k
个簇中的一个向量
i
:计算
i
向量到同一簇内其他点不相似程度的平均值
a(i)
=
average(X1)
;计算
i
向量到其他簇的平均不相似程度的最小值
b(i)
=
min(X2)
;其中,
X1表示
i
向量到所有
i
向量属于的簇中其它点的距离;
X2表示
i
向量到一个不包含
i
向量的簇内的所有点的平均距离;
i
向量轮廓系数为:可见轮廓系数的值是介于
[
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。