【技术实现步骤摘要】
基于概率误差补偿的全球表层海水pH反演方法及系统
[0001]本专利技术属于机器学习和数据预测领域,具体涉及一种基于概率误差补偿和机器学习模型预测表层海水pH的方法。
技术介绍
[0002]海洋酸化(Ocean Acidification)是指海水吸收了人为产生的二氧化碳,破坏了海洋中碳酸盐循环的化学平衡,导致海水的pH和碳酸钙饱和度下降的现象,也被誉为全球变暖的罪恶孪生兄弟。海洋酸化对海洋生态平衡有巨大的影响,表层海水直接响应大气CO2浓度变化,使海洋钙化生物更难形成生物性碳酸钙,从而影响海洋生物的生长、代谢和繁殖进程,进而破坏海洋生态平衡。
[0003]由于科学界对海洋酸化的发现较晚,海洋常规的观测项目中不包括pH值,因此长时间大范围的pH的数据生产进度较为落后。虽然模式和传统经验公式可以在一定程度上推演全球海表pH分布和变化趋势,但区域性差异导致不同海域所需要的先验知识大相径庭,很难归纳出一个符合全球尺度的统一规律,模式对于全球表层海水pH的拟合能力有限。
[0004]现有技术中,已使用多种模式或机器学 ...
【技术保护点】
【技术特征摘要】
1.一种基于概率误差补偿的全球表层海水pH反演方法,其特征在于,包括:S1、根据全球范围内不同温盐实测点位的海表温度、海表盐度和二氧化碳逸度实测数据构建第一数据点集合,其中每个第一数据点包括海表温度、海表盐度、点位坐标和监测时间信息;S2、将第一数据点集合中的各第一数据点输入预先经过训练的第一机器学习模型中,预测得到各第一数据点的总碱度,再根据各第一数据点的点位坐标和监测时间对应的二氧化碳逸度计算各第一数据点的pH估计值,并构建第二数据点集合,其中每个第二数据点包括pH估计值、点位坐标和监测时间信息;S3、根据全球范围内不同pH实测点位的表层海水pH实测数据构建第三数据点集合,其中每个第三数据点包括pH实测值、点位坐标和监测时间信息;S4、分别以第二数据点集合中的每个第二数据点为中心,按照预设的时空搜索范围对第三数据点集合和第二数据点集合分别进行时空搜索,基于搜索到的两个样本集合计算用于消除概率分布差异和时空分布差异的补偿权重,从而利用搜索到的所有第三数据点的pH实测值对当前第二数据点的pH估计值进行加权误差补偿,将第二数据点集合转换为第四数据点集合;S5、将全球范围内与表层海水pH相关的遥感数据和再分析数据,与第四数据点集合中的各第四数据点进行时空匹配,以第四数据点中的pH估计值作为样本标签,以时空匹配得到的遥感数据特征指标、再分析数据理化指标、点位坐标和监测时间作为训练样本,构建带标签的训练样本集并对第二机器学习模型进行训练,得到pH反演模型;S6、根据需反演的目标时刻,利用pH反演模型得到全球范围内每个空间位置的表层海水pH估计值,从而生成目标时刻对应的全球表层海水pH分布。2.如权利要求1所述的基于概率误差补偿的全球表层海水pH反演方法,其特征在于,所述第一机器学习模型采用支持向量机、随机森林模型或BP神经网络。3.如权利要求1所述的基于概率误差补偿的全球表层海水pH反演方法,其特征在于,所述S4中,对每个第二数据点进行误差补偿的具体做法为:通过所述时空搜索,将第三数据点集合和第二数据点集合中位于所述时空搜索范围内的数据点分别构建为第一补偿样本集合和第二补偿样本集合,若第一补偿样本集合中的样本量超过预设的最小样本数量,则再根据两个补偿样本集合计算每个第三数据点对应的概率分布补偿因子和时空分布补偿因子,最后以两个补偿因子的乘积作为权重,将第一补偿样本集合中所有第三数据点的pH实测值与第二数据点的pH估计值的偏差加权叠加到第二数据点的pH估计值上,实现加权误差补偿;所述概率分布补偿因子为第一补偿样本集合的分位函数和第二补偿样本集合的累积分布函数的乘积,所述时空分布补偿因子为第一补偿样本集合中的第三数据点相对于当前第二数据点的时空距离权重。4.如权利要求3所述的基于概率误差补偿的全球表层海水pH反演方法,其特征在于,每个第三数据点的时空距离权重为该第三数据点的空间距离权重和时间距离权重的加权和;且计算时空距离权重时,需先计算该第三数据点相对于当前第二数据点的空间距离值和时间距离值,所述空间距离权重为预设的最大空间搜索半径和所述空间距离值的平方差与平方和之比,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。