System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种用于水工环生态数据分析的监测数据状态划分方法技术_技高网

一种用于水工环生态数据分析的监测数据状态划分方法技术

技术编号:41069077 阅读:10 留言:0更新日期:2024-04-24 11:24
本发明专利技术涉及电数字数据处理技术领域,具体涉及一种用于水工环生态数据分析的监测数据状态划分方法。方法包括:获取SVM训练样本数据点集合、SVM训练样本数据点集合中的每个样本数据点对应的标签和待划分监测数据点集合;根据样本数据点集合中的各个样本数据点之间的距离,得到SVM训练样本数据点集合中样本数据点的分布密集程度;根据分布密集程度,得到参考数值;根据参考数值,得到划分超平面;根据划分超平面、SVM训练样本数据点集合和每个样本数据点对应的标签完成对SVM模型的训练;利用训练好的SVM模型对所有待划分监测数据点进行分类,得到各个待划分监测数据点的类别。本发明专利技术能够可靠的对待划分监测数据点集合进行类别划分。

【技术实现步骤摘要】

本专利技术涉及电数字数据处理,具体涉及一种用于水工环生态数据分析的监测数据状态划分方法


技术介绍

1、水工环生态数据通常是指与水资源、水质、生态环境等相关的各种数据,即水工环生态数据包括水文信息、水质数据、生物多样性数据、环境数据等;而由于对水工环生态数据的分析主要是用来研究水体生态系统的状态、变化等,即水工环生态数据能够反映水体生态系统的状态或者变化;例如通过对水体的酸碱度以及溶解氧(do)进行监测,来分析水体的富营养化程度或者分析水质质量,而通常情况下为了更加快速或者更加准确的进行分析,一般会对所监测的数据进行划分,即对所监测的数据进行划分有助于提高分析效率和准确性,例如通过对监测得到的水体的酸碱度以及溶解氧(do)进行类别划分,能够提高后续分析水体富营养化程度或者水质质量的效率和准确性。

2、但是现有技术中一般基于传统的svm(支持向量机)实现对所监测得到的水工环生态数据的类别划分,但是由于客观条件的影响会使得所监测得到的水工环生态数据中出现一些跳变值,例如环境变化、水源混合或者是水体遭受外界人为因素的短暂影响均有可能出现监测数值跳变的情况,而且在进行数据监测时可能由于测量误差或者其它方面的影响导致所监测得到的水工环生态数据中存在噪声数据,这些跳变值和噪声数据均可能使得svm(支持向量机)寻找最大化间隔的划分超平面时受到影响,即导致svm(支持向量机)获取的划分超平面的可信度较低,进而影响后续对所监测数据的类别划分结果,即导致再对所监测得到的水工环生态数据进行类别划分时,得到的划分结果的可信度较低。

<br/>

技术实现思路

1、为了解决上述问题,本专利技术提供一种用于水工环生态数据分析的监测数据状态划分方法,所采用的技术方案具体如下:

2、本专利技术一个实施例提供了一种用于水工环生态数据分析的监测数据状态划分方法,包括以下步骤:

3、获取svm训练样本数据点集合、svm训练样本数据点集合中的每个样本数据点对应的标签以及待划分监测数据点集合;

4、根据所述svm训练样本数据点集合中的各个样本数据点之间的距离,得到所述各个样本数据点的分布离散程度;

5、根据所述分布离散程度,得到所述svm训练样本数据点集合中样本数据点的分布密集程度;

6、根据所述分布密集程度,得到参考数值;根据所述参考数值,得到划分超平面;

7、根据所述划分超平面、所述svm训练样本数据点集合以及所述svm训练样本数据点集合中的每个样本数据点对应的标签完成对svm模型的训练,得到训练好的svm模型;利用训练好的svm模型对所述待划分监测数据点集合中的所有待划分监测数据点进行分类,得到各个待划分监测数据点的类别。

8、优选地,获取svm训练样本数据点集合的方法,包括:

9、获取目标区域和目标区域历史监测时间段;

10、对于所述目标区域历史监测时间段中的各个历史监测时刻,获取各个历史监测时刻下的目标区域中的每个监测点的水体酸碱度和水体溶解氧;

11、对所述各个历史监测时刻下的目标区域中的每个监测点的水体酸碱度和水体溶解氧进行标准化处理,将标准化处理后的水体酸碱度和水体溶解氧,记为对应历史监测时刻下的目标区域中的对应监测点的目标水体酸碱度和目标水体溶解氧;

12、构建得到数据空间;

13、对于任一历史监测时刻下的目标区域中的任一监测点的目标水体酸碱度和目标水体溶解氧:将该历史监测时刻下的目标区域中的该监测点的目标水体酸碱度和目标水体溶解氧映射到所述数据空间中,将映射后得到的数据点,记为该历史监测时刻下的目标区域中的该监测点对应的样本数据点;

14、将获取的所有的样本数据点构建的集合记为svm训练样本数据点集合。

15、优选地,获取待划分监测数据点集合的方法,包括:

16、获取目标区域待划分监测时间段;

17、对于所述目标区域待划分监测时间段中的各个待划分监测时刻,获取各个待划分监测时刻下的目标区域中的每个监测点的水体酸碱度和水体溶解氧;

18、对所述各个待划分监测时刻下的目标区域中的每个监测点的水体酸碱度和水体溶解氧进行标准化处理,将标准化处理后的水体酸碱度和水体溶解氧,记为对应待划分监测时刻下的目标区域中的对应监测点的目标水体酸碱度和目标水体溶解氧;

19、对于任一待划分监测时刻下的目标区域中的任一监测点的目标水体酸碱度和目标水体溶解氧:将该待划分监测时刻下的目标区域中的该监测点的目标水体酸碱度和目标水体溶解氧映射到所述数据空间中,将映射后得到的数据点记为该待划分监测时刻下的目标区域中的该监测点对应的待划分监测数据点;

20、将获取的所有的待划分监测数据点构建的集合记为待划分监测数据点集合。

21、优选地,得到所述各个样本数据点的分布离散程度的方法,包括:

22、根据所述svm训练样本数据点集合中的各个样本数据点之间的距离,得到所述各个样本数据点对应的各近邻数据点;

23、计算各个样本数据点与其对应的所有近邻数据点的欧式距离,并将所述各个样本数据点与其对应的所有近邻数据点的欧式距离的均值,记为对应样本数据点对应的近邻距离均值;

24、将所有样本数据点对应的近邻距离均值的均值记为目标距离均值;

25、对于任一样本数据点:将该样本数据点对应的近邻距离均值与所述目标距离均值之间的差值的绝对值的归一化值,记为该样本数据点的分布离散程度。

26、优选地,得到所述各个样本数据点对应的各近邻数据点的方法,包括:

27、对于任一样本数据点:

28、将所述svm训练样本数据点集合中除该样本数据点之外的其它的所有样本数据点,均记为该样本数据点对应的待选取数据点;

29、将该样本数据点与其对应的各个待选取数据点之间的欧式距离,记为该样本数据点与其对应的各个待选取数据点之间的第一距离;

30、按照所述第一距离从小到大的顺序,对该样本数据点对应的所有待选取数据点进行排序,得到该样本数据点对应的待选取数据点序列;

31、从所述待选取数据点序列中的第一个待选取数据点开始,将连续选取的a个待选取数据点,均记为该样本数据点对应的近邻数据点,所述a为正整数。

32、优选地,得到分布密集程度的方法,包括:

33、将所述svm训练样本数据点集合中分布离散程度小于离散阈值的样本数据点,记为特征数据点;

34、将所述svm训练样本数据点集合中的特征数据点的数量与所述svm训练样本数据点集合中的样本数据点的数量的比值,记为第一分布密集指标;

35、将计算得到的各个样本数据点与其对应的所有近邻数据点的欧式距离,均记为特征距离;

36、将所有特征距离中的最小特征距离与最大特征距离的比值的归一化值,记为第二分布密集指标;

37、将第一权重与所述第一分布密集指标的乘积,记为第一指本文档来自技高网...

【技术保护点】

1.一种用于水工环生态数据分析的监测数据状态划分方法,其特征在于,该方法包括如下步骤:

2.如权利要求1所述的一种用于水工环生态数据分析的监测数据状态划分方法,其特征在于,获取SVM训练样本数据点集合的方法,包括:

3.如权利要求2所述的一种用于水工环生态数据分析的监测数据状态划分方法,其特征在于,获取待划分监测数据点集合的方法,包括:

4.如权利要求1所述的一种用于水工环生态数据分析的监测数据状态划分方法,其特征在于,得到所述各个样本数据点的分布离散程度的方法,包括:

5.如权利要求4所述的一种用于水工环生态数据分析的监测数据状态划分方法,其特征在于,得到所述各个样本数据点对应的各近邻数据点的方法,包括:

6.如权利要求4所述的一种用于水工环生态数据分析的监测数据状态划分方法,其特征在于,得到分布密集程度的方法,包括:

7.如权利要求1所述的一种用于水工环生态数据分析的监测数据状态划分方法,其特征在于,得到参考数值的方法,包括:

8.如权利要求7所述的一种用于水工环生态数据分析的监测数据状态划分方法,其特征在于,根据所述参考数值,得到划分超平面的方法,包括:

...

【技术特征摘要】

1.一种用于水工环生态数据分析的监测数据状态划分方法,其特征在于,该方法包括如下步骤:

2.如权利要求1所述的一种用于水工环生态数据分析的监测数据状态划分方法,其特征在于,获取svm训练样本数据点集合的方法,包括:

3.如权利要求2所述的一种用于水工环生态数据分析的监测数据状态划分方法,其特征在于,获取待划分监测数据点集合的方法,包括:

4.如权利要求1所述的一种用于水工环生态数据分析的监测数据状态划分方法,其特征在于,得到所述各个样本数据点的分布离散程度的方法,包括:

5.如...

【专利技术属性】
技术研发人员:赵宇辉许强陈燕周兴涛谢筱建徐扬殷淑翠董浩
申请(专利权)人:山东省地矿工程勘察院山东省地质矿产勘查开发局八〇一水文地质工程地质大队
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1