一种水工环生态修复数据的高效存储方法技术

技术编号:39154811 阅读:15 留言:0更新日期:2023-10-23 15:00
本发明专利技术涉及电子数据处理技术领域,尤其涉及一种水工环生态修复数据的高效存储方法,该方法针对水工环生态环境中的任一类水工生态修复数据,基于采样频率获取每个采样时刻下水工生态修复数据对应的N维环境数据,组成时序环境数据;针对时序环境数据中的任一N维环境数据,计算N维环境数据的局部信息趋势优化因子;根据局部信息趋势优化因子,计算N维环境数据的两侧数据差异程度,根据两侧数据差异程度得到时序环境数据中的所有存储间断点;根据所有存储间断点对时序环境数据进行数据段划分,以将时序环境数据的所有环境数据段的线性拟合直线进行存储,提高了时序环境数据存储的准确性和效率。确性和效率。确性和效率。

【技术实现步骤摘要】
一种水工环生态修复数据的高效存储方法


[0001]本专利技术涉及电子数据处理
,尤其涉及一种水工环生态修复数据的高效存储方法。

技术介绍

[0002]水工环生态修复是水资源、水环境工程中的重要领域,其中涉及了生态、水文、水质、土壤、植被、微生物等多个方面的数据。由于在对生态数据进行监测与记录的过程中,水工环生态修复数据涉及了多种数据的多时间尺度记录,所以需要对记录到的数据进行压缩存储。在对于水工环生态修复数据的存储过程中,为了保证水工环生态修复数据的高效存储,需要对于水工环生态修复过程中的各种生态数据进行高效存储。
[0003]现有技术中,通常基于聚类进行数据存储,也即是在数据存储过程中,针对于生态修复数据中所记录的各种物种的监测数据,对每个标签都进行聚类过程,获取到标签中的时序数据点对应的簇类结果,对于每个簇类中的记录数据,通过该簇类中的簇类中心点作为该数据点的记录值,并在存储的过程中通过记录对应的簇类编号进行高效存储,并在数据的读取与提取过程中,通过所记录的簇类编号在聚类模型记录中获取到该数据点对应的记录值。
[0004]在现有的基于聚类的数据存储过程中,由于将簇类中心点作为监测数据的记录值会存在着同簇类中的数值偏差,那么对于含有时序信息的水工环生态修复数据,就会造成所记录的时序数据中数据点的趋势变化的信息缺失,那么在后续通过所记录的水工环生态修复数据进行分析时就会出现分析偏差。
[0005]因此,如何提高含有时序信息的水工环生态修复数据在数据存储过程中的数据准确性成为亟需解决的问题

技术实现思路

[0006]有鉴于此,本专利技术实施例提供了一种水工环生态修复数据的高效存储方法,以解决提高含有时序信息的水工环生态修复数据在数据存储过程中的数据准确性的问题。
[0007]本专利技术实施例提供一种水工环生态修复数据的高效存储方法,所述高效存储方法包括:针对水工环生态环境中的任一类水工生态修复数据,基于采样频率获取每个采样时刻下所述水工生态修复数据对应的N维环境数据,N>0,将预设时间段内所有的N维环境数据按照采样顺序组成时序环境数据;针对所述时序环境数据中的任一N维环境数据,构建所述N维环境数据的局部窗口,利用欧式距离计算公式,获取所述局部窗口中任意两个N维环境数据之间的欧式距离,根据所述局部窗口的所有欧式距离计算所述N维环境数据的局部信息趋势优化因子;根据所述时序环境数据在时序上的数据变化以及每个所述N维环境数据的局部信息趋势优化因子,计算所述时序环境数据中每个N维环境数据的两侧数据差异程度,将所述
两侧数据差异程度大于差异程度阈值所对应的N维环境数据作为存储间断点,得到所述时序环境数据中的所有存储间断点;根据所有存储间断点对所述时序环境数据进行数据段划分,对应得到至少一个环境数据段,针对任一环境数据段,对所述环境数据段中所有的N维环境数据进行线性拟合,得到对应的线性拟合直线,对所述时序环境数据的所有环境数据段的线性拟合直线进行存储。
[0008]进一步的,所述根据所述局部窗口的所有差异指标计算所述N维环境数据的局部信息趋势优化因子,包括:针对所述局部窗口中的任一目标N维环境数据,根据所述目标N维环境数据与所述局部窗口中其他N维环境数据之间的欧式距离,获取最小欧式距离,根据所述局部窗口中所有N维环境数据的最小欧式距离,计算得到所述N维环境数据的局部遍历路径距离;获取所述局部窗口中每个N维环境数据的局部遍历路径距离,根据所述局部窗口中每个N维环境数据的局部遍历路径距离对所述N维环境数据的局部遍历路径距离进行归一化处理,得到的归一化结果为所述N维环境数据的局部信息趋势优化因子。
[0009]进一步的,所述N维环境数据的局部遍历路径距离的计算公式为:
[0010]其中,为所述时序环境数据中的第t个采样时刻下的N维环境数据的局部遍历路径距离;为所述时序环境数据中的第t个采样时刻下的N维环境数据对应的局部窗口中所包含的N维环境数据的数量;为局部窗口中的第i个N维环境数据;为局部窗口中第i个N维环境数据的最小欧式距离。
[0011]进一步的,所述N维环境数据的局部信息趋势优化因子的计算公式为:
[0012]其中,为所述时序环境数据中的第t个采样时刻下的N维环境数据的局部信息趋势优化因子;为局部窗口中第p个采样时刻下的N维环境数据的局部遍历路径距离;Norm为归一化函数。
[0013]进一步的,所述根据所述时序环境数据在时序上的数据变化以及每个所述N维环境数据的局部信息趋势优化因子,计算所述时序环境数据中每个N维环境数据的两侧数据差异程度,包括:对所述时序环境数据中的所有N维环境数据进行聚类,得到每个所述N维环境数据的聚类中心点;针对所述时序环境数据中的第t个N维环境数据,计算第t个N维环境数据的聚类中心点与第t

1个N维环境数据的聚类中心点之间的第一距离,计算第t个N维环境数据的聚类中心点与第t+1个N维环境数据的聚类中心点之间的第二距离,计算所述第一距离和所述第
二距离之间的距离差值,获取常数1与所述距离差值之间的相加结果的绝对值;计算第t个N维环境数据的局部信息趋势优化因子与第t

1个N维环境数据的局部信息趋势优化因子之间的第一差值,计算第t个N维环境数据的局部信息趋势优化因子与第t+1个N维环境数据的局部信息趋势优化因子之间的第二差值,计算所述第一差值和所述第二差值之间的差值;根据第t个N维环境数据之前的每个N维环境数据的数据变化方向,获取相同数据变化方向对应的N维环境数据的数量;获取所述相加结果的绝对值、所述差值和所述数量之间的乘积,将所述乘积进行归一化后的结果作为第t个N维环境数据的两侧数据差异程度。
[0014]进一步的,所述根据第t个N维环境数据之前的每个N维环境数据的数据变化方向,获取相同数据变化方向对应的N维环境数据的数量,包括:分别第t个N维环境数据之前的每个N维环境数据的数据平均值,针对与第t个N维环境数据之前的任一N维环境数据,获取所述N维环境数据与其之前的N维环境数据之间的数据平均值之间的平均值差值,若平均值差值大于0,则确认所述N维环境数据的数据变化方向为数据增加方向, 若平均值差值小于0,则确认所述N维环境数据的数据变化方向为数据减少方向;统计所述数据变化方向为数据增加方向且数据连续的N维环境数据,得到相同数据变化方向对应的N维环境数据的数量,或者,统计所述数据变化方向为数据减少方向且数据连续的N维环境数据,得到相同数据变化方向对应的N维环境数据的数量。
[0015]进一步的,所述根据第t个N维环境数据之前的每个N维环境数据的数据变化方向,获取相同数据变化方向对应的N维环境数据的数量,包括:分别第t个N维环境数据之前的每个N维环境数据的数据平均值,针对与第t个N维环境数据之前的任一N维环境数据,获取所述N维环境数据与其之前的N维环境数据之间的数据平均值之间的平均值差值, 若平均值差值小于0,则确认所述N维环境数据的数据变化方向为数据减少方向;统计所述数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种水工环生态修复数据的高效存储方法,其特征在于,所述高效存储方法包括:针对水工环生态环境中的任一类水工生态修复数据,基于采样频率获取每个采样时刻下所述水工生态修复数据对应的N维环境数据,N>0,将预设时间段内所有的N维环境数据按照采样顺序组成时序环境数据;针对所述时序环境数据中的任一N维环境数据,构建所述N维环境数据的局部窗口,利用欧式距离计算公式,获取所述局部窗口中任意两个N维环境数据之间的欧式距离,根据所述局部窗口的所有欧式距离计算所述N维环境数据的局部信息趋势优化因子;根据所述时序环境数据在时序上的数据变化以及每个所述N维环境数据的局部信息趋势优化因子,计算所述时序环境数据中每个N维环境数据的两侧数据差异程度,将所述两侧数据差异程度大于差异程度阈值所对应的N维环境数据作为存储间断点,得到所述时序环境数据中的所有存储间断点;根据所有存储间断点对所述时序环境数据进行数据段划分,对应得到至少一个环境数据段,针对任一环境数据段,对所述环境数据段中所有的N维环境数据进行线性拟合,得到对应的线性拟合直线,对所述时序环境数据的所有环境数据段的线性拟合直线进行存储。2.根据权利要求1所述的高效存储方法,其特征在于,所述根据所述局部窗口的所有差异指标计算所述N维环境数据的局部信息趋势优化因子,包括:针对所述局部窗口中的任一目标N维环境数据,根据所述目标N维环境数据与所述局部窗口中其他N维环境数据之间的欧式距离,获取最小欧式距离,根据所述局部窗口中所有N维环境数据的最小欧式距离,计算得到所述N维环境数据的局部遍历路径距离;获取所述局部窗口中每个N维环境数据的局部遍历路径距离,根据所述局部窗口中每个N维环境数据的局部遍历路径距离对所述N维环境数据的局部遍历路径距离进行归一化处理,得到的归一化结果为所述N维环境数据的局部信息趋势优化因子。3.根据权利要求2所述的高效存储方法,其特征在于,所述N维环境数据的局部遍历路径距离的计算公式为:;其中,为所述时序环境数据中的第t个采样时刻下的N维环境数据的局部遍历路径距离;为所述时序环境数据中的第t个采样时刻下的N维环境数据对应的局部窗口中所包含的N维环境数据的数量;为局部窗口中的第i个N维环境数据;为局部窗口中第i个N维环境数据的最小欧式距离。4.根据权利要求3所述的高效存储方法,其特征在于,所述N维环境数据的局部信息趋势优化因子的计算公式为:其中,为所述时序环境数据中的第t个采样时刻下的N维环境数据的局部信息趋势优化因子;为局部窗口中第个采样
时刻下的N维环境数据的局部遍历路径距离;为归一化函数。5.根据权利要求1所述的高效存储方法,其特征在于,所述根据所述时序环境数据在时序上的数据变化以及每个所述N维环境数据的局部信息趋势优化因子,计算所述时序环境数据中每个N维环境数据的两侧数据差异程度,...

【专利技术属性】
技术研发人员:陈燕鲁震谢筱建赵宇辉吕晶姜晓芬韩子晨于巾萃
申请(专利权)人:山东省地质矿产勘查开发局八〇一水文地质工程地质大队山东省地矿工程勘察院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1