一种基于增量学习的海洋观测大数据分布方法技术

技术编号：15725156 阅读：58 留言：0更新日期：2017-06-29 12:50

本发明专利技术涉及一种基于增量学习的海洋观测大数据分布方法，一种基于增量学习的海洋观测大数据分布方法，所述分布方法包括以下步骤：S1：输入待布局的增量海洋观测数据集；S2：初始化存储容量；S3：计算增量数据集中数据的数据价值；S4：对增量数据集中的所有数据进行划分；S5：利用增量学习方法对增量数据集进行训练；S6：对训练后的数据进行布局；S7：输出布局后的增量海洋观测数据集；其中，所述的步骤S5中的增量学习方法为支持向量机增量学习方法。其优点在于，保证分类正确率的同时，降低训练时间的开销和用户访问数据的响应时间；利用支持向量机的增量学习算法解决过量匹配的问题；有效压缩了样本集的大小并舍弃无用样本。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于增量学习的海洋观测大数据分布方法
本专利技术涉及海洋数据分布
，具体地说，是一种基于增量学习的海洋观测大数据分布方法。
技术介绍
随着我国海洋强国战略的逐步推进，科学大数据技术的迅猛发展为海洋经济产业注入了科学动力。此外，“海洋一号”A星和“海洋一号”B星等专题卫星的上轨成功优化了我国海洋立体化观测路网，使得高精度、高频度、大覆盖的实时多模态海洋数据呈几何级数爆炸式增长。海洋科学学科特征以及海洋数据获取手段的多源性导致了海洋数据具有海量性、多维、实时、强关联等特征，使得海洋数据成为大数据的典范。对海洋观测大数据有效地进行存储、管理并构建海洋大数据服务是挖掘海洋数据价值的关键途径。数据分布是数据存储中的关键问题，它是将数据划分为一系列不相交的数据片段或区域，并按照一定的数据分配策略分散放置到各个数据节点上。在数据分布过程中，良好的分片实施策略是数据分布的关键。已有的数据分片策略(如轮转划分)适用于有着固定模式的一般关系型数据库，在通用数据上效果显著。然而，多模态的实时海洋观测大数据具有特殊的性质，使得传统的分片策略在对海洋观测大数据进行分片时忽略了其本身的特点，缺乏一定的实用性。故需进一步考虑和分析海洋数据自身的数据价值，才可有效地对数据进行分布和存储。此外，随着大规模海洋立体观测技术的飞速发展，在实际海洋观测过程中，海洋观测大数据的信息不是一次性获得的，会不断地有新数据增加。面对大幅度不断增加的海洋观测大数据，如果每一次都要在所有数据上重新建模存储或进行数据挖掘需花费大量的时间，这显然是不现实的。而增量学习可有效地解决上述问题，使得海洋大数据...
一种基于增量学习的海洋观测大数据分布方法

【技术保护点】
一种基于增量学习的海洋观测大数据分布方法，其特征在于，所述分布方法包括以下步骤：S1：输入待布局的增量海洋观测数据集；S2：初始化存储容量；S3：计算增量数据集中数据的数据价值；S4：对增量数据集中的所有数据进行划分；S5：利用增量学习方法对增量数据集进行训练；S6：对训练后的数据进行布局；S7：输出布局后的增量海洋观测数据集；其中，所述的步骤S5中的增量学习方法为支持向量机增量学习方法。

【技术特征摘要】
1.一种基于增量学习的海洋观测大数据分布方法，其特征在于，所述分布方法包括以下步骤：S1：输入待布局的增量海洋观测数据集；S2：初始化存储容量；S3：计算增量数据集中数据的数据价值；S4：对增量数据集中的所有数据进行划分；S5：利用增量学习方法对增量数据集进行训练；S6：对训练后的数据进行布局；S7：输出布局后的增量海洋观测数据集；其中，所述的步骤S5中的增量学习方法为支持向量机增量学习方法。2.根据权利要求1所述的分布方法，其特征在于，所述的步骤S3中的数据价值计算包括计算时效性、计算关联性、计算地域性。3.根据权利要求1所述的分布方法，其特征在于，所述的步骤S4中的划分为利用k-means方法对数据集中的所有数据进行初始划分，将数据集分为活跃区和非活跃区。4.根据权利要求1所述的分布方法，其特征在于，所述的步骤S6中的布局为对训练后的数据按照活跃区和非活跃区进行布局。5.根据权利要求2所述的分布方法，其特征在于，所述的步骤S3的计算方法包括以下步骤：S31：计算时效性利用TF-IDF加权技术计算海洋观测大数据的时效性，其计算公式为如下：其中，N为海洋观测大数据集的总数据量，ni表示包含观测数据属性项d的数据集数，tfi(d)表示观测数据属性项d在数据集中出现的频率，Wi(d)表示属性项d的权值。S32：计算关联性设分别表示应用观测数据dk和dm的观测任务，则观测数据dk和dm之间的关联度Sij的计算公式如下：S33：计算地域性利用欧式距离计算方法计算各观测区内各观测位置间的距离Lmn，其计算公式如下：Lmn＝√(xm-xn)2+(ym-yn)2(3)其中Lmn表示观测点m和观测点n之间的距离，xm和xn分别表示观测点m和观测点n的经度值，ym...

【专利技术属性】
技术研发人员：黄冬梅，贺琪，随宏运，何盛琪，石少华，
申请(专利权)人：上海海洋大学，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人