渔船作业区域的建模与预测方法、系统、存储介质、终端技术方案

技术编号:30019753 阅读:17 留言:0更新日期:2021-09-11 06:37
本发明专利技术属于渔场预测技术领域,公开了一种渔船作业区域的建模与预测方法、系统、存储介质、终端,所述渔船作业区域的建模与预测方法包括:对AIS数据进行预处理:利用R语言对AIS数据进行提取,并对出现多艘船只在同一经纬度网格内的情况进行处理;利用预处理后的AIS数据与环境数据构建模型并预测适宜捕捞区域。本发明专利技术首次利用AIS数据对渔船适宜作业区域进行预测,在原有模型基础上增加自动调整模型参数功能,扩大模型适用范围,实现对渔场的准确预测。同时,本发明专利技术能够充分利用数量较少且难以获得的海洋生物信息,绘制出适宜渔船作业区域,有利于提高捕捞效率,节约能源,加强渔业管理促进海洋渔业资源的可持续化发展。进海洋渔业资源的可持续化发展。进海洋渔业资源的可持续化发展。

【技术实现步骤摘要】
渔船作业区域的建模与预测方法、系统、存储介质、终端


[0001]本专利技术属于渔场预测
,尤其涉及一种渔船作业区域的建模与预测方法、系统、存储介质、终端。

技术介绍

[0002]自古以来,渔业是人类为了生存并适应地球生态环境的重要活动之一。在高分辨率卫星技术的飞速发展下,全球范围内的渔业活动已经能被较好的探测并管理。但是由于electronic vessel monitoring systems(VMS),捕捞日志等数据存在不完全公开和不能在大的时空尺度下反映渔船的捕捞作业活动的缺点。这就导致人类的捕捞活动只能间接通过渔获量数据推断,而不能得到直接的捕捞数据。AIS的最新发展可以弥补这一缺陷,它可以识别船舶的航迹。全球捕鱼观察网(GFW)致力于基于AIS数据提供船只捕鱼数据,以供其他研究人员进行一系列研究。
[0003]目前,渔场预测的主要算法包括广义加性模型,广义线性模型,机器学习模型。广义加性模型和广义线性模型是经典的参数模型。但构建时需要考虑环境因子之间复杂的相互作用,从而对模型进行多次尝试。随着计算机技术的发展,机器学习模型被广泛的应用于预测海洋生态系统中物种的生物量、分布图、丰富度和多样性。
[0004]相比于传统的参数模型,机器学习模型的优势在于能够更好处理数据集中的各种非线性关系和复杂的相互作用。目前,机器学习已经被广泛的应用于预测鱼类种群的分布、适宜栖息地和潜在作业区域的研究中。Smolinski等基于国际拖网调查数据利用机器学习的回归技术预测了波罗的海深海鱼类的分布空间。Compton等人利用提升回归树模型研究了Pagrus与栖息地之间的关系。Mugo等人基于遥感数据利用机器学习的集成模型探索了金枪鱼的适宜栖息地。
[0005]XGBoost是机器学习模型中一个新型的提升回归树模型。XGBoost是在梯度提升回归树(GBDT)的基础上发展而来的算法。GBDT是一种将许多简单模型组合在一起以提供改进提高回归效果的自适应模型,从2007年起就开始被广泛应用在生态建模与预测。XGBoost在GBDT的基础上对损失函数进行了二阶展开从而获取更多的信息来提高回归拟合的效果。由于其具有利用较少资源而能解决较为庞大的实际问题的优点,受到了数据科学家的青睐。
[0006]通过上述分析,现有技术存在的问题及缺陷为:
[0007](1)由于electronic vessel monitoring systems(VMS),捕捞日志等数据存在不完全公开和不能在大的时空尺度下反映渔船的捕捞作业活动的缺点,导致人类的捕捞活动只能间接通过渔获量数据推断,而不能得到直接的捕捞数据。
[0008](2)传统的渔场预测的参数模型,在构建时需要考虑环境因子之间复杂的相互作用,从而对模型进行多次尝试。

技术实现思路

[0009]针对现有技术存在的问题,本专利技术提供了一种渔船作业区域的建模与预测方法、
系统、存储介质、终端。
[0010]本专利技术是这样实现的,一种渔船作业区域的建模与预测方法,所述渔船作业区域的建模与预测方法包括以下步骤:
[0011]步骤一,对AIS数据进行预处理:利用R语言对AIS数据进行提取,并对出现多艘船只在同一经纬度网格内的情况进行处理;
[0012]步骤二,利用预处理后的AIS数据与环境数据构建模型并预测适宜捕捞区域。
[0013]进一步,步骤一中,所述对AIS数据进行预处理,包括:
[0014](1)对同一渔船每天的作业情况进行提取:筛选渔船数据,去除异常值;
[0015](2)对多艘渔船出现在同一经纬度网格内的情况进行处理。
[0016]进一步,步骤二中,所述利用处理好的AIS数据与环境数据构建模型并预测适宜捕捞区域,包括:
[0017]将数据集随机分为7:3两部分;采用XGBoost算法对70%的数据进行训练,构建预测模型,用30%数据进行验证评估该模型效果;最后利用构建好的模型预测适宜捕捞区域。
[0018]进一步,步骤二中,所述利用预处理后的AIS数据与环境数据构建模型,包括:
[0019](1)建立单个回归树模型;
[0020](2)采用加法模型对回归树模型进行组合形成提升树模型;
[0021](3)利用梯度提升方法训练提升树模型;
[0022](4)训练模型;
[0023](5)评估训练后的模型;
[0024](6)使用训练后的模型对AIS数据的处理方式进行选择;
[0025](7)使用训练后的模型绘制适宜作业区域图。
[0026]进一步,步骤(1)中,所述建立单个回归树模型,包括:
[0027]定义X为各项环境数据,即模型的输入;定义Y表示该网格的捕捞努力,即模型的输出,建模需要的样本数据表示如下:
[0028]D={{X,Y}}={(x1,y1),(x2,y2),

,(x
N
,y
N
)};
[0029]式中,N为样本总数。
[0030]假设将输入部分划分为M个区域:R1,R2,

,R
M
,并且在区域上有一个固定的输出值LM,单个回归提升树模型表示如下:
[0031][0032]式中,I为指示函数,当x∈R
m
时为1,否则为0;当输入部分的划分确定后,用平方误差的值的大小来表示模型对于训练数据预测误差的大小;其中,所述平方误差的表达式如下:
[0033][0034]式中,y
i
是实际值,是预测值,模型根据平方误差最小值来选择每个部分的最优输出值。
[0035]对输入部分进行划分时,采用启发式的方法选择第j个值即x
(j)
和它所取得值s分别作为分隔变量和分隔点,通过这个将所有环境变量划分为两个部分:R1(j,s)={x|x
(j)

s},R2(j,s)={x|x
(j)
>s},根据下式求解最优分隔变量j和最佳分隔点s:
[0036][0037]通过固定变量j从而得到最优分隔点s,将所有输入变量遍历一遍,确定最优切分变量j,从而找到最佳的(j,s)值使得公式最小,以此将输入部分分隔成两个部分并求出对应部分的输出值。
[0038][0039]式中,m∈{1,2};N
m
表示划分到两个不同部分样本的个数,随后继续对每个部分重复上面的划分步骤,直到满足停止条件,这样就生成了一个回归树。
[0040]进一步,步骤(2)中,所述采用加法模型对回归树模型进行组合形成提升树模型,包括:
[0041]基于Boosting思想通过多个回归树模型不断优化形成提升树模型:
[0042][0043]式中,单个回归树模型由f(x;θ
k
)表示,其中θ
k
为回归树参数;树的个数由K表示,若提升树中第一颗回归树设定为T0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种渔船作业区域的建模与预测方法,其特征在于,所述渔船作业区域的建模与预测方法包括:对AIS数据进行预处理:利用R语言对AIS数据进行提取,并对出现多艘船只在同一经纬度网格内的情况进行处理;利用预处理后的AIS数据与环境数据构建模型并预测适宜捕捞区域。2.如权利要求1所述的渔船作业区域的建模与预测方法,其特征在于,所述对AIS数据进行预处理,包括:(1)对同一渔船每天的作业情况进行提取:筛选渔船数据,去除异常值;(2)对多艘渔船出现在同一经纬度网格内的情况进行处理。3.如权利要求1所述的渔船作业区域的建模与预测方法,其特征在于,所述利用处理好的AIS数据与环境数据构建模型并预测适宜捕捞区域,包括:将数据集随机分为7:3两部分;采用XGBoost算法对70%的数据进行训练,构建预测模型,用30%数据进行验证评估该模型效果;最后利用构建好的模型预测适宜捕捞区域。4.如权利要求1所述的渔船作业区域的建模与预测方法,其特征在于,所述利用预处理后的AIS数据与环境数据构建模型,包括:(1)建立单个回归树模型;(2)采用加法模型对回归树模型进行组合形成提升树模型;(3)利用梯度提升方法训练提升树模型;(4)训练模型;(5)评估训练后的模型;(6)使用训练后的模型对AIS数据的处理方式进行选择;(7)使用训练后的模型绘制适宜作业区域图。5.如权利要求4所述的渔船作业区域的建模与预测方法,其特征在于,步骤(1)中,所述建立单个回归树模型,包括:定义X为各项环境数据,即模型的输入;定义Y表示该网格的捕捞努力,即模型的输出,建模需要的样本数据表示如下:D={{X,Y}}={(x1,y1),(x2,y2),

,(x
N
,y
N
)};式中,N为样本总数;将输入部分划分为M个区域:R1,R2,

,R
M
,并且在区域上有一个固定的输出值LM,单个回归提升树模型表示如下:式中,I为指示函数,当x∈R
m
时为1,否则为0;当输入部分的划分确定后,用平方误差的值的大小表示模型对于训练数据预测误差的大小;其中,平方误差的表达式:式中,y
i
是实际值,是预测值,模型根据平方误差最小值来选择每个部分的最优输出值;对输入部分进行划分时,采用启发式的方法选择第j个值即x
(j)
和它所取得值s分别作
为分隔变量和分隔点,通过将所有环境变量划分为两个部分:R1(j,s)={x|x
(j)
≤s},R2(j,s)={x|x
(j)
>s},根据下式求解最优分隔变量j和最佳分隔点s:通过固定变量j从而得到最优分隔点s,将所有输入变量遍历一遍,确定最优切分变量j,找到最佳的(j,s)值使得公式最小,将输入部分分隔成两个部分并求出对应部分的输出值;式中,m∈{1,2};N
m
表示划分到两个不同部分样本的个数,随后继续对每个部分重复上面的划分步骤,直到满足停止条件,即可生成回归树。6...

【专利技术属性】
技术研发人员:刘阳秦元哲田永军何良飞毛璐古丽努尔
申请(专利权)人:山西大地新亚科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1