基于对抗生成网络的模型训练方法技术

技术编号:39517512 阅读:11 留言:0更新日期:2023-11-25 18:55
一种基于对抗生成网络的模型训练方法

【技术实现步骤摘要】
基于对抗生成网络的模型训练方法、系统、设备及介质


[0001]本申请涉及大数据
,具体涉及一种基于对抗生成网络的模型训练方法

系统

设备及介质


技术介绍

[0002]随着大数据的不断发展,区域地球化学数据的检测在大数据
也日渐成熟

区域地球化学数据的检测是地质勘探和环境监测等领域的重要任务

地球化学数据是通过地球化学方法获得的,包括岩石

土壤

矿物

水等的化学元素含量和分布等信息

这些数据可以提供有关地质构造

矿床类型

环境污染等方面的信息,对资源勘探和环境保护等领域具有重要的意义

[0003]目前,传统的地球化学元素数据采集方式是通过野外取样

实验室分析等手段获得区域地球化学数据来进行数据分析和预测

[0004]但是在实际应用中,传统确定地球化学元素浓度的方法需要工作人员大范围野外实地采样,并凭经验对目标区域的化学元素浓度分布进行预测,这种方法耗费时间大且不够准确

因此,目前工作人员用于评估目标区域地球化学元素浓度分布的方法亟待改进


技术实现思路

[0005]本申请提供了一种基于对抗生成网络的模型训练方法

系统

设备及介质,能够训练一种基于对抗生成网络的区域地球化学元素预测模型以实现快速准确预测区域地球化学元素浓度的效果

[0006]第一方面,本申请提供了一种基于对抗生成网络的模型训练方法,包括:获取训练区的历史化学元素分布图像数据,所述历史化学元素分布图像数据包括历史土壤特征数据和对应的历史化学元素浓度;响应于图像裁剪操作,根据预设参数信息处理所述图像数据,得到图像样本;将所述图像样本的文件格式转换为预设标准文件格式,得到输入样本,所述预设标准文件格式为
tfrecords
文件格式;响应于模型训练操作,提取所述输入样本中的所述历史土壤特征数据作为模型输入特征输入预设初始网络模型,并将所述对应的历史化学元素浓度按照预设比例划分为训练集数据和测试集数据进行模型训练,得到输出结果;计算所述输出结果和预设标准数据之间的误差值,并根据所述误差值构建损失函数;根据预设均方误差公式,判断所述损失函数对应的损失值是否大于预置损失阈值;若否,则将所述训练后的所述初始网络模型作为区域地球化学元素预测模型

[0007]通过采用上述技术方案,系统获取训练区的历史土壤特征信息并转换为图像数据,然后通过工作人员设定的预设参数信息裁剪该图像数据,得到图像样本并将该图像样
本的文件格式转换为
tfrecords
文件格式得到输入样本,便于模型训练时读取数据,之后响应于工作人员的模型训练操作,将该输入样本作为模型输入特征输入条件对抗生成网络模型进行模型训练,并提取对应的历史化学元素浓度作为训练集数据和测试集数据进行模型训练,得到输出结果,计算该输出结果与预设标准数据的误差值并构建误差函数,然后计算该误差函数的损失值,若是该损失值小于预置损失阈值则将该条件对抗生成网络模型作为区域地球化学元素预测模型,可有效提高区域地球化学元素浓度预测的准确性

[0008]可选的,所述预设参数信息包括:输入数据路径

裁剪图像大小阈值

裁剪步长和输出数据路径

[0009]通过采用上述技术方案,工作人员设定预设参数:输入数据路径

裁剪图像大小阈值

裁剪步长和输出数据路径,系统根据该预设参数裁剪图像,能够提高模型训练的准确性

[0010]可选的,响应于用户发出的图像裁剪指令,提取所述图像数据对应的原图像;根据所述预设参数信息中的裁剪图像大小阈值和裁剪步长,按照滑动窗口的裁剪方式将所述图像裁剪为对应大小的多个
tif
图像,并将所述多个
tif
图像作为所述图像样本

[0011]通过采用上述技术方案,按照滑动窗口的裁剪方式裁剪图像数据至指定裁剪图像大小,可减小系统的计算量

[0012]可选的,将所述多个
tif
图像附上所述各
tif
图像在原图像中的坐标标签,所述坐标标签包括行号

列号和样本号;将附有相同坐标标签的
tif
图像存入同一个文件夹,得到存储有相同坐标标签的
tif
图像对应的多个文件夹

[0013]通过采用上述技术方案,将得到的多个
tif
图像附上各
tif
图像在原图像中对应的坐标标签,然后系统将具有相同坐标标签的
tif
图像存储至同一文件夹中,得到多个文件夹,可将
tif
图像进行划分,防止在模型训练时读取数据出现混淆,造成模型训练效率的问题

[0014]可选的,调取所述多个文件夹中的各
tif
图像;根据预设序列化和反序列化数据算法,将所述
tif
图像转换为所述
tfrecords
文件格式对应的二进制数据;将所述二进制数据存入对应的预设
tfrecords
文件,并将所述预设
tfrecords
文件作为所述输入样本,所述预设
tfrecords
文件用于
tensorflow
框架读取数据

[0015]通过采用上述技术方案,根据预设序列化和反序列化数据算法,系统将
tif
图像转换为
tfrecords
文件格式对应的二进制数据,然后将该二进制数据存入对应的预设
tfrecords
文件,从而得到输入样本,能够为后续模型训练提供数据基础,提高模型训练的效率

[0016]可选的,所述预设均方差公式,包括:其中,
K
为损失值,
n
为输入样本数,
Y
t
为预设标准元素浓度,
Y
p
为元素浓度预测值

[0017]通过采用上述技术方案,结合模型训练得到的元素浓度预测值和预设标准元素浓度进行计算,得到损失值,可根据该损失值对模型训练进行评估,提高模型训练的准确性

[0018]可选的,获取未测区的土壤特征数据;将所述未测区的土壤特征数据输入所述区
域地球化学元素预测模型,得到对应的元素分布浓度预测结果;将所述元素分布浓度预测结果转换为
tif
格式图像,并发送给用户终端

[0019]通本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于对抗生成网络的模型训练方法,其特征在于,包括:获取训练区的历史化学元素分布图像数据,所述历史化学元素分布图像数据包括历史土壤特征数据和对应的历史化学元素浓度;响应于图像裁剪操作,根据预设参数信息处理所述图像数据,得到图像样本;将所述图像样本的文件格式转换为预设标准文件格式,得到输入样本,所述预设标准文件格式为
tfrecords
文件格式;响应于模型训练操作,提取所述输入样本中的所述历史土壤特征数据作为模型输入特征输入预设初始网络模型,并将所述对应的历史化学元素浓度按照预设比例划分为训练集数据和测试集数据进行模型训练,得到输出结果;计算所述输出结果和预设标准数据之间的误差值,并根据所述误差值构建损失函数;根据预设均方误差公式,判断所述损失函数对应的损失值是否大于预置损失阈值;若否,则将所述训练后的所述初始网络模型作为区域地球化学元素预测模型
。2.
根据权利要求1所述的一种基于对抗生成网络的模型训练方法,其特征在于,所述预设参数信息包括:输入数据路径

裁剪图像大小阈值

裁剪步长和输出数据路径
。3.
根据权利要求2所述的一种基于对抗生成网络的模型训练方法,其特征在于,所述响应于图像裁剪操作,根据预设参数信息处理所述图像数据,得到图像样本中,包括:响应于用户发出的图像裁剪指令,提取所述图像数据对应的原图像;根据所述预设参数信息中的裁剪图像大小阈值和裁剪步长,按照滑动窗口的裁剪方式将所述图像裁剪为对应大小的多个
tif
图像,并将所述多个
tif
图像作为所述图像样本
。4.
根据权利要求3所述的一种基于对抗生成网络的模型训练方法,其特征在于,所述得到图像样本之后,还包括:将所述多个
tif
图像附上所述各
tif
图像在原图像中的坐标标签,所述坐标标签包括行号

列号和样本号;将附有相同坐标标签的
tif
图像存入同一个文件夹,得到存储有相同坐标标签的
tif
图像对应的多个文件夹
。5.
根据权利要求3所述的一种基于对抗生成网络的模型训练方法,其特征在于,所述将所述图像样本的文件格式转换为预设标准文件格式,得到输入样本中,包括:调取所述多个文件夹中的各
tif
图像;根据预设序列化和反序列化数据算法,将所述
tif
图像转换为所述
tfrecords
文件格式对应的二进制数据;将所述二进制数据存入对应的预设
tfrecords
文件,并将所述预设
tfrecords
文件作为所述输入样本,所述预设
tfrecords
文件用于
tensorflow
框架读取数据
。6.
...

【专利技术属性】
技术研发人员:万翔谢淑云李启铭田野崔倩倩杨正论
申请(专利权)人:湖北省地质调查院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1