一种基于实测数据的可疑点判别方法技术

技术编号:14145994 阅读:49 留言:0更新日期:2016-12-11 02:12
一种基于实测数据的可疑点判别方法,本发明专利技术涉及基于实测数据的可疑点判别方法。本发明专利技术的目的是为了解决现有现场实测上报数据不真实,查找可疑数据的精确度低、速度慢的缺点。一、得到n个实测数据所在位置间的距离矩阵;二、i=1时,n个实测数据各自构成一类,此时类间距离就是n个实测数据之间的距离;三、i=2时,对二得到的类间距离最小的两类进行合并,成为一个新类;计算新类与其他类之间的距离,得到新的类间距离矩阵;四、i=m时,对i=m‑1时得到的类间距离最小的两类进行合并,成为一个新类;五、得到类的个数及各类的成员;六、判定可疑点数据的可疑程度。本发明专利技术用于数据可疑点判别领域。

【技术实现步骤摘要】

本专利技术涉及基于实测数据的可疑点判别方法
技术介绍
公路现场的实测数据的合格标准我们称作规范,规范是国标,更新的情况较为普遍,因此,我们需要做到整个系统的及时更新,且不同的地理特征条件下的实测数据的标准也许会有不同,针对不同地区,可能会存在日后需要考察的问题出现;且核心技术较简单,主要是几个程序的组合,但是数据库较大,会影响运行速度。公路现场实测上报数据不真实的现象很普遍,但是大面积不合格的数据施工单位并不会谎报数据,一定会进行复测并进行重新的摊铺、碾压,但是个别数据的人为修改,这种情况很普遍且不易察觉,然而个别数据的不合格显示的正是小区间范围内的路段的质量不合格,容易造成应力集中或是提前使道路进入疲劳期,影响整条公路的正常运行,且后期维修、养护费用就会大幅度地提高,造成人力、财力的双重浪费。以及对不同城市的空气污染状况进行分析,实测上报数据不真实的现象很普遍,对个别数据的人为修改,这种情况很普遍且不易察觉,造成后期处理人力、财力的双重浪费,故需要查找可疑数据,然而现有技术查找可疑数据的精确度低、速度慢,需要一种快速、高精度的方法查找可疑数据。
技术实现思路
本专利技术的目的是为了解决现有现场实测上报数据不真实,查找可疑数据的精确度低、速度慢的缺点,而提出一种基于实测数据的可疑点判别方法。一种基于实测数据的可疑点判别方法具体过程为:步骤一、计算n个实测数据所在位置中的任意两个实测数据所在位置之间的距离,得到n个实测数据所在位置间的距离矩阵,n的取值范围为正整数;步骤二、初始第一步i=1时,n个实测数据各自构成一类,类的个数k=n,此时类间距离就是n个实测数据所在位置中任意两个实测数据所在位置之间的距离,k为正整数,i为正整数;步骤三、i=2时,对步骤二得到的类间距离最小的两类进行合并,成为一个新类,此时类的个数k=n-1;计算新类与其他类之间的距离,得到新的类间距离矩阵;步骤四、i=m时,对i=m-1时得到的类间距离最小的两类进行合并,成为一个新类,此时类的个数k=n-i+1,m为正整数;步骤五、如果步骤四合并后类的个数k仍大于1,重复步骤四和步骤五,直到类的个数为1时,得到谱系聚类图,即可得到类的个数及各类的成员;步骤六、根据类的个数及各类的成员选取步长最长或选取最后合并的实测数据,作为可疑点数据,并判定可疑点数据的可疑程度。本专利技术的有益效果为:本专利技术提出的一种基于实测的上报数据可疑点分析方法,能够快速、准确的找出造假数据的可疑点,并具体指出具体的可疑点位置,让现场的工作人员进行复测,确保实测上报数据的真实,避免造成应力集中或是提前使道路进入疲劳期,影响整条公路的正常运行的情况,大大降低了后期维修、养护费用,降低经济损失、节省人工。在已经确定路面的压实度指标时,用本专利技术提出的一种基于实测的上报数据可疑点分析方法进行拟合,查找可疑点,并对结果进行分析,结果的精确度已经达到98%以上,且对于路面结构的其他连续性指标均有较好的拟合效果,由此可以判断,本专利技术方法在技术上可行,是可以在施工单位推广的,而且会有很好的效果,为施工单位提供方便。例如在京津冀地区的13个城市的相对地理信息见图2-图8;根据6幅图片,对京津冀13座城市的AQI的数据进行分析,发现唐山的AQI数值难与其他城市聚类,根据面板匹配法及地理信息因素,唐山的空气污染状况应与天津、秦皇岛、承德相近,而天津、秦皇岛、承德的AQI数值却是相近,因此认为唐山的AQI数据存在造假的可能性,而作为唐山市主要污染物的PM2.5的数据并没有发现有可疑的现象,进行所有污染物的对比分析,我们认为唐山市的SO2数据造假;同理,我们对长三角地区进行分析,宁波SO2、PM2.5数据造假;同理,我们对珠三角地区进行分析,经分析,珠三角地区肇庆PM2.5、PM10数据造假,肇庆SO2数据造假,广州SO2数据造假。由此可以判断,本专利技术方法在技术上可行,是可以推广的,而且会有很好的效果,为检测单位提供方便。附图说明图1为本专利技术流程图;图2为京津翼地区PM10平均联接(组间)的树状图,横坐标为步长;图3为京津翼地区PM2.5平均联接(组间)的树状图,横坐标为步长;图4为京津翼地区SO2平均联接(组间)的树状图,横坐标为步长;图5为京津翼地区CO平均联接(组间)的树状图,横坐标为步长;图6为京津翼地区NO2平均联接(组间)的树状图,横坐标为步长;图7为京津翼地区AQI平均联接(组间)的树状图,横坐标为步长;图8为小波图像分解过程(重构时逆向即可)图;图9为小波基函数的相平面图;图10为嵌套的多分辨率子空间图,V0为原信号的频率空间,V1为经第一级分解后V0被分解成的低频子空间;V2为经第二级分解后V0被分解成的低频子空间;V3为经第三级分解后V0被分解成的低频子空间;W1为经第一级分解后V0被分解成的高频子空间;W2为经第二级分解后V0被分解成的高频子空间;W3为经第三级分解后V0被分解成的高频子空间;W4为经第四级分解后V0被分解成的高频子空间。具体实施方式具体实施方式一:结合图1说明本实施方式,本实施方式的一种基于实测数据的可疑点判别方法具体是按照以下步骤进行的:聚类分析方法聚类分析法,又称群分析,是根据失误本身的特性,研究对样品或指标进行分类的一种多元的统计方法。所谓的“类”,通俗地说就是相似元素的集合。聚类分析的原则是直接比较各事物之间的性质,将性质相似的归为一类,将性质差别较大的归入不同的类。聚类分析法是实用多元统计分析的一个新的分支,正处于发展阶段,理论上虽然并不是很完善,但是它却能解决很多的实际问题,因此这个方法很受人们的重视。其功能是选择一中度量个体接近程度的统计量,建立一种分类方法,并按接近程度对观测对象给出合理的分类。聚类分析的内容十分丰富,按其聚类的方法可分为以下几种:系统聚类法、动态聚类法、最优分割法、模糊聚类法、图论聚类法等。系统聚类法是目前在实际应用中使用最广泛的一种分类方法,本专利技术即使用的是系统聚类法。设有X个样品,每个样品测得某项指标抽样调查的若干实测数据点。系统聚类分析法的基本思想是:首先定义样品的距离(或相似系数),这是类间的距离(或相似系数),这时类间的距离与样品间的距离是等价的;然后将距离最近的两类合并成新类,并计算新类与其他类的类间距离,再按最小距离准则并类,这样每次缩小一类,直到所有的样品都并成一类为止,这个并类过程可以用谱系聚类形象地表达出来。由以上系统聚类法的基本思想,可以得到它的基本步骤如下:聚类分析方法是在SPSS软件中实现的;步骤一、计算n个实测数据所在位置中的任意两个实测数据所在位置之间的距离,得到n个实测数据所在位置间的距离矩阵,n的取值范围为正整数;步骤二、初始第一步i=1时,n个实测数据各自构成一类,类的个数k=n,此时类间距离就是n个实测数据所在位置中任意两个实测数据所在位置之间的距离,k为正整数,i为正整数;步骤三、i=2时,对步骤二得到的类间距离最小的两类进行合并,成为一个新类,此时类的个数k=n-1;计算新类与其他类之间的距离,得到新的类间距离矩阵;步骤四、i=m时,对i=m-1时得到的类间距离最小的两类进行合并,成为一个新类,此时类的个数k=n-i+1,m为正整数;步骤五、如果步骤四合并后类的个数k仍大本文档来自技高网...
一种基于实测数据的可疑点判别方法

【技术保护点】
一种基于实测数据的可疑点判别方法,其特征在于:一种基于实测数据的可疑点判别方法具体是按照以下步骤进行的:步骤一、计算n个实测数据所在位置中的任意两个实测数据所在位置之间的距离,得到n个实测数据所在位置间的距离矩阵,n的取值范围为正整数;步骤二、初始第一步i=1时,n个实测数据各自构成一类,类的个数k=n,此时类间距离就是n个实测数据所在位置中任意两个实测数据所在位置之间的距离,k为正整数,i为正整数;步骤三、i=2时,对步骤二得到的类间距离最小的两类进行合并,成为一个新类,此时类的个数k=n‑1;计算新类与其他类之间的距离,得到新的类间距离矩阵;步骤四、i=m时,对i=m‑1时得到的类间距离最小的两类进行合并,成为一个新类,此时类的个数k=n‑i+1,m为正整数;步骤五、如果步骤四合并后类的个数k仍大于1,重复步骤四和步骤五,直到类的个数为1时,得到谱系聚类图,即可得到类的个数及各类的成员;步骤六、根据类的个数及各类的成员选取步长最长或选取最后合并的实测数据,作为可疑点数据,并判定可疑点数据的可疑程度。

【技术特征摘要】
1.一种基于实测数据的可疑点判别方法,其特征在于:一种基于实测数据的可疑点判别方法具体是按照以下步骤进行的:步骤一、计算n个实测数据所在位置中的任意两个实测数据所在位置之间的距离,得到n个实测数据所在位置间的距离矩阵,n的取值范围为正整数;步骤二、初始第一步i=1时,n个实测数据各自构成一类,类的个数k=n,此时类间距离就是n个实测数据所在位置中任意两个实测数据所在位置之间的距离,k为正整数,i为正整数;步骤三、i=2时,对步骤二得到的类间距离最小的两类进行合并,成为一个新类,此时类的个数k=n-1;计算新类与其他类之间的距离,得到新的类间距离矩阵;步骤四、i=m时,对i=m-1时得到的类间距离最小的两类进行合并,成为一个新类,此时类的个数k=n-i+1,m为正整数;步骤五、如果步骤四合并后类的个数k仍大于1,重复步骤四和步骤五,直到类的个数为1时,得到谱系聚类图,即可得到类的个数及各类的成员;步骤六、根据类的个数及各类的成员选取步长最长或选取最后合并的实测数据,作为可疑点数据,并判定可疑点数据的可疑程度。2.根据权利要求1所述一种基于实测数据的可疑点判别方法,其特征在于:所述步骤一中计算n个实测数据所在位置中的任意两个实测数据所在位置之间的距离,得到n个实测数据所在位置间的距离矩阵,n的取值范围为正整数;具体过称为:通过皮尔逊相关系数距离得到n个实测数据所在位置中任意两个实测数据所在位置之间的距离。3.根据权利要求1或2所述一种基于实测数据的可疑点判别方法,其特征在于:所述步骤三中i=2时,对步骤二得到的类间距离最小的两类进行合并,成为一个新类,此时类的个数k=n-1;计算新类与其他类之间的...

【专利技术属性】
技术研发人员:徐建成孙歌武鹤
申请(专利权)人:黑龙江工程学院
类型:发明
国别省市:黑龙江;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1