System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及生物环境科学,尤其涉及一种针对小样本水体的叶绿素含量辅助预测方法及系统。
技术介绍
1、在测量叶绿素含量时,通常使用传统的荧光检测技术来测量所需的参数,如荧光量,以计算叶绿素含量,或使用高光谱成像方法来测量叶绿素含量。这些方法通常需要特定的物理/化学参数,并且具有高成本和复杂的安装要求。因此,研究水体中的影响因子对叶绿素含量的影响情况以及相关预测模型进而推广其治理碳排放的应用具有重要意义。
2、水体中的影响因子包括水温、ph、溶解氧、电导率、浊度、高猛酸盐指数、氨氮、总磷、总氮等,现有技术对其中的各单元建立数据驱动的叶绿素预测模型,对数据量、质的要求高,当采集到的数据少或数据受污染严重时,难以建立准确的模型。而且各水域的环境影响因子不同,难以使用一个普适化的模型满足每一水域单元叶绿素预测的需求,因此单独对每一水域单元建模需要重复的数据采集及处理、模型训练等工作,建模成本较高。
3、综上所述,现有技术的叶绿素含量监测或预测方法存在建模成本高、忽视环境影像因子相关性以及数据不足情况下难以建模的问题。
技术实现思路
1、为此,本专利技术实施例提供了一种针对小样本水体的叶绿素含量辅助预测方法及系统,用于解决现有技术中叶绿素含量监测或预测方法存在建模成本高、忽视环境影像因子相关性以及数据不足情况下难以建模的问题。
2、为了解决上述问题,本专利技术实施例提供一种针对小样本水体的叶绿素含量辅助预测方法,该方法包括:
3、s1:采集不同
4、s2:对所述相关数据进行预处理,得到理想数据集;
5、s3:基于所述理想数据集,计算平均影响值,并对理想数据集进行降维处理;
6、s4:根据降维后的数据集,设置混合训练集与测试集,并将每个样本设置权重与样本更新系数;
7、s5:将降维后的数据集和权重向量相结合,对基本弱回归模型进行训练,并且不断更新样本权重;
8、s6:不断重复s4-s5,保存记录每一次的弱回归模型,最终选择预测效果最好的回归模型作为强回归模型;
9、s7:将测试样本输入所述强回归模型中,得到测试样本的叶绿素预测值。
10、优选地,所述采集不同环境下的水体信息,获得水体相关数据的方法为:
11、利用传感器采集不同环境下的水体信息,获得水体相关数据,所述相关数据包括水体的温度、ph值、溶解氧含量、高锰酸钾含量、氨氮含量、总磷量、总氮量、电导率、浊度以及上一时刻的叶绿素a含量。
12、优选地,所述对所述相关数据进行预处理,得到理想数据集,具体包括:
13、s21:去除数据集中的非数值样本;
14、s22:对数据集中每个样本中的叶绿素a含量使用3σ标准去除样本中的异常值;
15、s23:采用z评分法对数据进行标准化处理,消除不同变量之间的维度影响,其中标准化公式为:
16、
17、式中,xi是原始样本x中的第i个变量,是xi的平均值,σi是xi的标准差,是xi的标准化值。
18、优选地,所述基于所述理想数据集,计算平均影响值,并对理想数据集进行降维处理,具体包括:
19、s31:利用理想数据集中的原始数据训练一个bp神经网络gd(x),理想数据集形式为t(t={(xi,yi)},其中xi为训练样本,yi为测试样本;
20、s32:依次将其中一个自变量的数值增加10%,其他变量不变,得到新的训练样本之后将其输入bp神经网络中进行仿真得到结果
21、
22、式中,为第i个样本中第j个变量的值,t表示理想训练集中样本的个数,k表示每个样本中的变量个数;
23、s33:依次将其中一个自变量的数值减少10%,其他变量不变,得到新的训练样本之后将其输入bp神经网络中进行仿真得到结果
24、
25、s34:计算每一自变量得到结果的差值,按训练样本数进行平均,计算出第j个自变量对于网络的平均影响值:
26、
27、
28、式中,为每一自变量得到结果的差值,mivj为第j个自变量对于网络的平均影响值;
29、s35:根据s34的计算结果确定平均影响值绝对值大小,筛选出积累贡献值>90%的自变量,完成输入变量的选取。
30、优选地,所述设置混合训练集与测试集,并给每个样本设置权重与样本更新系数,具体包括:
31、s41:设置混合训练集t中每个样本的初始权重
32、
33、式中,n是混合训练集中来自辅助样本集的样本,m是混合训练集中来自小样本水体的样本数量;
34、s42:定义针对辅助样本集的样本权重更新系数β:
35、
36、优选地,所述将降维后的数据集和权重向量相结合,对基本弱回归模型进行训练,并且不断更新样本权重,具体包括:
37、s51:设置样本权重分布
38、
39、式中,为第t次迭代的样本权值,n是混合训练集中来自辅助样本集的样本,m是混合训练集中来自小样本水体的样本数量;
40、s52:将样本权重分布与样本相乘,并且根据相乘后的数据集训练一个弱回归器ft(x);
41、s53:计算函数误差
42、
43、其中
44、
45、式中,xi为训练样本,yi为测试样本;
46、s54:计算平均误差et:
47、
48、s55:定义目标样本集的更新系数βt:
49、βt=et/(1-et);
50、s56:更新样本权重:
51、
52、s57:基于新的样本权重,得到一个新的bp神经网络。
53、优选地,采用均方根误差对模型的性能进行评价,其中均方根误差公式为:
54、
55、式中,rmse为均方根误差值,yi为测试集中叶绿素a的真实值,为测试集中叶绿素a的预测值。
56、本专利技术实施例还提供了一种针对小样本水体的叶绿素含量辅助预测系统,该系统用于实现上述所述的针对小样本水体的叶绿素含量辅助预测方法,具体包括:
57、数据采集模块,采集不同环境下的水体信息,获取水体的相关数据,并构建数据集,其中所述数据集包括小样本水体相关数据和辅助样本水体相关数据,小样本水体和辅助样本水体来自不同环境;
58、数据预处理模块,用于对所述相关数据进行预处理,得到理想数据集;
59、平均影响值计算模块,用于基于所述理想数据集,计算平均影响值,并对理想数据集进行降维处理;
60、样本权重设置与样本系数更本文档来自技高网...
【技术保护点】
1.一种针对小样本水体的叶绿素含量辅助预测方法,其特征在于,包括:
2.根据权利要求1所述的针对小样本水体的叶绿素含量辅助预测方法,其特征在于,所述采集不同环境下的水体信息,获得水体相关数据的方法为:
3.根据权利要求1所述的针对小样本水体的叶绿素含量辅助预测方法,其特征在于,所述对所述相关数据进行预处理,得到理想数据集,具体包括:
4.根据权利要求1所述的针对小样本水体的叶绿素含量辅助预测方法,其特征在于,所述基于所述理想数据集,计算平均影响值,并对理想数据集进行降维处理,具体包括:
5.根据权利要求1所述的针对小样本水体的叶绿素含量辅助预测方法,其特征在于,所述设置混合训练集与测试集,并给每个样本设置权重与样本更新系数,具体包括:
6.根据权利要求1所述的针对小样本水体的叶绿素含量辅助预测方法,其特征在于,所述将降维后的数据集和权重向量相结合,对基本弱回归模型进行训练,并且不断更新样本权重,具体包括:
7.根据权利要求1所述的针对小样本水体的叶绿素含量辅助预测方法,其特征在于,采用均方根误差对模型的性能进
8.一种针对小样本水体的叶绿素含量辅助预测系统,其特征在于,所述系统用于实现权利要求1至7任意一项所述的针对小样本水体的叶绿素含量辅助预测方法,具体包括:
9.一种电子设备,其特征在于,所述电子设备包括处理器、存储器和总线系统,所述处理器和存储器通过该总线系统相连,所述存储器用于存储指令,所述处理器用于执行存储器存储的指令,以实现权利要求1至7任意一项所述的针对小样本水体的叶绿素含量辅助预测方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机软件产品,所述计算机软件产品包括的若干指令,用以使得一台计算机设备执行权利要求1至7任意一项所述的针对小样本水体的叶绿素含量辅助预测方法。
...【技术特征摘要】
1.一种针对小样本水体的叶绿素含量辅助预测方法,其特征在于,包括:
2.根据权利要求1所述的针对小样本水体的叶绿素含量辅助预测方法,其特征在于,所述采集不同环境下的水体信息,获得水体相关数据的方法为:
3.根据权利要求1所述的针对小样本水体的叶绿素含量辅助预测方法,其特征在于,所述对所述相关数据进行预处理,得到理想数据集,具体包括:
4.根据权利要求1所述的针对小样本水体的叶绿素含量辅助预测方法,其特征在于,所述基于所述理想数据集,计算平均影响值,并对理想数据集进行降维处理,具体包括:
5.根据权利要求1所述的针对小样本水体的叶绿素含量辅助预测方法,其特征在于,所述设置混合训练集与测试集,并给每个样本设置权重与样本更新系数,具体包括:
6.根据权利要求1所述的针对小样本水体的叶绿素含量辅助预测方法,其特征在于,所述将降维后的数据集和权重向量相结合,对基本弱回归模型进...
【专利技术属性】
技术研发人员:张浩楠,万海英,刘成越,平晓静,吴奇,栾小丽,刘飞,
申请(专利权)人:江南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。