基于多变量对抗生成网络的地理大数据缺值补入方法技术

技术编号:33706055 阅读:32 留言:0更新日期:2022-06-06 08:28
本发明专利技术公开了基于多变量对抗生成网络的地理大数据缺值补入方法,基于多变量对抗生成网络,创新性地引入循环神经网络模块对多变量地理数据包含的时间特征进行学习,创新性地引入图神经网络模块学习多变量地理数据之间的物理关联关系,对损失函数进行改进来获得更加接近原始数据的完整多变量地理数据集,其能够为相关人文社科与自然科学的研究提供最基础的数据支持。的数据支持。的数据支持。

【技术实现步骤摘要】
基于多变量对抗生成网络的地理大数据缺值补入方法


[0001]本专利技术涉及人工智能和地理大数据领域,特别涉及了一种地理大数据缺值补入方法。

技术介绍

[0002]地球系统由水圈、岩石圈、大气圈、生物圈与人类圈组成,这五大圈层相互作用、相互渗透,形成了一个完整的自然—社会—经济综合体,“水土气生人”五大地理要素及其构成的地理综合体对应了地球系统的五大圈层,通过研究五大地理要素及地理综合体的时空分布与变化规律,能够在局地、区域和全球不同尺度环境变化与经济发展的决策中发挥重要的作用,促进自然—社会—经济综合体的和谐发展。地理数据是开展地理学研究的基础,基于空间遥感的反演技术是获取地理数据的主要手段,随着近年来遥感卫星数量增加,使得通过遥感反演手段获取得到的地理数据呈现出“爆炸式”的增长,但随之而来的是由于人为质量控制、传感器损坏或大气云层干扰等主观或客观原因造成的数据缺失增多,缺失的地理数据很难直接用于研究中,因此需要对数据进行缺值的补入。
[0003]目前,处理地理数据缺失值的任务主要依靠一些传统插值算法实现,主要包括反距离加权平均法,样条本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于多变量对抗生成网络的地理大数据缺值补入方法,其特征在于,包括:对多变量地理数据进行预处理的步骤,所述预处理包括数据归一化与标准化、数据格式转换以及深度学习数据集的划分;构建及训练多变量地理数据缺值补入模型的步骤,所述多变量地理数据缺值补入模型支持多变量的同时输入;采用生成对抗网络作为模型的主体网络框架;在生成对抗网络的生成器与判别器中引入循环神经网络框架和图卷积神经网络结构;优化生成对抗网络的损失函数,加入能够反映地理数据数值差异的偏差损失函数和保证生成器生成的假样本与真样本之间随时间变化的规律一致的相关系数损失函数;多变量地理数据缺值补入的步骤,将多变量地理数据输入到训练好的多变量地理数据缺值补入模型中,获得完整的多变量地理大数据。2.根据权利要求1所述基于多变量对抗生成网络的地理大数据缺值补入方法,其特征在于,所述数据归一化与标准化的方法如下:在于,所述数据归一化与标准化的方法如下:在于,所述数据归一化与标准化的方法如下:其中,x1、x2、x3分别为均值归一化后的数据、最大最小化归一化后的数据和标准化后的数据,x为原始数据,max表示取最大值,min表示取最小值,为均值,δ为方差。3.根据权利要求1所述基于多变量对抗生成网络的地理大数据缺值补入方法,其特征在于,所述数据格式转换是指,将数据转换成时间序列格式来作为多变量地理数据缺值补入模型的输入数据格式。4.根据权利要求1所述基于多变量对抗生成网络的地理大数据缺值补入方法,其特征在于,所述生成对抗网络的目标函数V(D,G)如下:其中,x表示具有缺值的地理大数据,P
data
(x)表示具有缺值的地理大数据的数据分布,z表示随机噪声,P
G
(z)表示生成器的输出的数据分布,D与G分别为判别器与生成器的抽象函数。5.根据权利要求1所述基于多变量对抗生成网络的地理大数据缺值补入方法,其特征在于,将生成对抗网络的生成器与判别器中的卷积层替换为循环神经网络模块,依靠其特有的更新门与重置门来实现对多变量地理数据中包含的时间信息进行学习与利用,其中更新门z
t
和重置门r
t
的表达式如下:z
t
=σ(W
z
x
t
+U
z
h
t
‑1)r
t
=σ(W
r
x
t
+U
r
h
t
‑1)其中,x
t
表示t时刻的输入,h
t
‑1表示前一个时刻最终记忆内容,W
z
、U
z
、W
r
和U
r
为四个线性变化矩阵,σ表示Sigmoid激活函数;利用更新门与重置门生成的结果来更新当前时刻保存的信息:
h
t

=tanh(Wx
t
+r
t

Uh
t
‑1)h
t
=z
t

h
t
‑1+(1

【专利技术属性】
技术研发人员:胡一凡王国杰梁子凡魏锡坤路明月王艳君苏布达姜彤代文
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1