当前位置: 首页 > 专利查询>云南大学专利>正文

一种基于AHP的多源位置轨迹数据的质量评估方法技术

技术编号:17346926 阅读:57 留言:0更新日期:2018-02-25 12:34
本发明专利技术公开了一种基于AHP的多源位置轨迹数据的质量评估方法,主要涉及数据质量评估技术领域。包括步骤:S1、制定一个动态、带反馈机制的数据质量评估流程;S2、根据数据质量评估流程,确定数据质量的评估指标体系;S3、根据评估指标体系,建立对应的数据质量评估模型;S4、根据数据质量评估模型,确定单源位置轨迹数据质量评估指标权重;S5、根据数据质量评估模型,确定多源位置轨迹数据质量评估指标权重;S6、应用数据质量评估模型测度数据质量。本发明专利技术的有益效果在于:能适应大数据时代下各种应用对多源、异构数据来源的质量评估需求,所提出的评估指标均为可量化分析指标,方便后续的质量评估软件的开发。

A quality evaluation method for multi source location trajectory data based on AHP

The invention discloses a quality evaluation method of multi source location trajectory data based on AHP, which mainly relates to the field of data quality assessment. Includes the steps of: S1, make the evaluation process of data quality, with a dynamic feedback mechanism; S2, according to the data quality evaluation process, determine the evaluation index system of the quality of the data; S3, according to the evaluation index system, establish corresponding data quality evaluation model; S4, according to the quality evaluation model of quality evaluation to determine the index weight single source position trajectory data; S5, according to the data quality evaluation model, evaluation index weights of multi position trajectory data model to measure data quality; quality evaluation and application of data quality of S6. The beneficial effect of the invention is that it can adapt to the quality assessment needs of various applications for multi-source and heterogeneous data sources in the era of big data, and the proposed evaluation indexes are all quantifiable analysis indexes, which facilitate the subsequent development of quality assessment software.

【技术实现步骤摘要】
一种基于AHP的多源位置轨迹数据的质量评估方法
本专利技术涉及数据质量评估
,具体是一种基于AHP的多源位置轨迹数据的质量评估方法。
技术介绍
随着我国城市化进程的不断深入,各大中城市普遍面临着交通拥堵、环境污染、社会老龄化、土地资源紧缺等问题。近年来,民用GPS等定位设备在车载以及移动终端上得到广泛使用,使得基于位置的服务(LocationBasedService,LBS)和移动社交网络(MobileSocialNetwork)得到飞速发展。作为移动社交网络的主体,人的移动性带来的位置轨迹不仅记录人的行为历史,也记录了人与社会的交互活动信息。移动社交网络中位置轨迹数据的分析与利用,为解决城市问题提供了一种新的思路。轨迹数据是指含有经纬度坐标和时间的数据,其数据来源主要包括四种方式:第一、浮动车的轨迹数据;第二、手机定位数据;第三、用户上传的签到(Check-in)记录,如新浪微博的签到数据;第四、公共交通卡数据(SmartCardData,SCD),位置轨迹数据来源众多,应用广泛。但长期以来,现有轨迹数据质量的评估方存在以下问题:1、侧重于单源轨迹数据的评估,针对手机定位数据和用户签到数据的评估方法较少;2、已有的质量评估指标和评估模型简单,不能全面反映业务需求;3、在多源位置轨迹融合的研究和应用中,如居民出行活动的时空分析,缺乏一个统一的评估标准和测度方法,造成数据质量不能进行有效质量测度,影响后续的分析和应用。
技术实现思路
本专利技术的目的在于提供一种能够解决现有位置轨迹的质量评估流程静态化,评估指标和评估模型简单,而且在多源位置轨迹融合中没有一个通用的评估标准和测度方法等问题的一种基于AHP的多源位置轨迹数据的质量评估方法。本专利技术为实现上述目的,通过以下技术方案实现:一种基于AHP的多源位置轨迹数据的质量评估方法,包括步骤:S1、制定一个动态、带反馈机制的数据质量评估流程;S2、根据数据质量评估流程,确定数据质量的评估指标体系,所述评估指标体系包括评估维度、质量特征和评估指标,所述评估维度包括准确性、完整性和一致性,所述准确性包括基础数据准确性和关联数据准确性,所述基础数据准确性包括经纬度准确性、时间准确性、速度准确性、方向准确性和位置准确性,所述关联数据准确性包括路段平均行程车速准确性、路段平均行程时间准确性,所述完整性由内容完整性、结构完整性和关联数据完整性组成,所述内容完整性的评估指标为属性取值完整性,即属性值非空,所述结构完整性的评估指标为数据规范程度,所述关联完整性的评估指标包括时间完整性、空间完整性、路段完整性,所述路段完整性包括路段数据点密度完整性、路段车辆密度完整性,所述一致性包括数据一致性和语义一致性,所述数据一致性的评估指标为属性取值一致性,所述语义一致性的评估指标为异形同义;S3、根据评估指标体系,建立对应的数据质量评估模型;S4、根据数据质量评估模型,结合数据质量评估场景,采用AHP方法确定单源位置轨迹数据质量评估指标权重;S5、根据数据质量评估模型,结合数据质量评估场景,采用AHP方法确定多源位置轨迹数据质量评估指标权重;S6、应用数据质量评估模型测度数据质量。所述步骤S1具体包括:S11、确定数据收集目标;S12、根据业务环境抽取数据质量维度和质量特征;S13、确定每一特征的评估指标,建立评估模型;S14、制定数据质量评估基线;S15、获取数据;S16、应用评估模型测度数据质量;S17、判断数据质量评估结果是否符合基线标准,如果符合,输出评估后的数据,并生成数据质量报告;如果不符合,返回步骤S15,重新获取数据;S18、经过评估并符合基线标准的数据可以执行后续的数据分析和数据挖掘工作;S19、判断数据分析或者数据挖掘的结果是否满足设定的目标,如果满足设定的目标,那么输出分析结果,同时,将其反馈给质量评估系统,为下一轮的评估提供更好的支持;如果不满足,有可能评估基线的制定不够合理,需要及时对评估基线进行调整,以便最终能得到符合目标的结果。根据步骤S2中的评估指标体系,建立的数据质量评估模型如下:所述基础数据准确性指标的数据质量评估模型,采用以下公式:其中,N表示待评估的轨迹数据总量,P表示若干个位置属性中的某个属性,即P∈{经度,纬度,时间,速度,位置,……},表示在该P个属性中,评估样本中满足准确性需求的样本数量,所述经纬度准确性的评估公式如下:其中,距离阈值为θm,落在标准POI点集θm范围内的待评估点集数量设置为所述标准POI点集的数量为N;所述路段平均行程车速准确性指标的数据质量评估模型,采用以下公式:其中,表示时间区间t内平均车速的平均绝对百分比误差,N为评估区域内的路段总数,表示第k个路段在时间区间t上的当前平均车速,表示同一路段在时间区间t上的历史平均车速,所述路段平均行程时间准确性指标的数据质量评估模型,采用以下公式:其中,表示时间区间t内平均行驶时间的平均绝对百分比误差,N为评估区域内的路段总数,表示第k个路段在时间区间t上的当前平均行驶时间,表示同一路段在时间区间t上的历史平均行驶时间,所述属性取值完整性评估指标的数据质量评估模型,采用以下公式:其中,N表示待评估的位置数据总量,P表示若干个位置属性中的某个属性,表示在该P个属性中,取值非空的样本数量,所述路段完整性评估公式如下:其中,表示路段k在时间区间t内的完整性,表示第k个路段在时间区间t上的数据点密度,表示第k个路段在时间区间t上的车辆数密度,代表在时间区间t上车辆所产生的GPS数据量与总数据量的比例,代表在时间区间t上出现的车辆数与总车辆数的比例;所述空间完整性的数据质量评估模型如下:其中,N表示手机定位数据总数,表示第i个区域在时间区间t上的手机用户数量,而且所述时间完整性的数据质量评估模型如下:其中,N表示手机定位数据总数,表示在时间区间s出现的手机用户数量,γ表示在一个时间段内手机用户数阈值,而且所述数据规范完整性的数据质量评估模型如下:其中,N表示总的数据量,NL表示名称不规范的数据量;所述属性取值一致性的数据质量评估模型如下:其中,表示路段k在时间区间t内的一致性,n代表出现在k路段上的车辆数,代表车辆c在时间区间t内在路段k的速度平均值,代表除去第c辆车所产生的GPS数据速度值集合后的全部速度值集合的平均值;所述语义一致性的数据质量评估模型如下:其中,N表示总的评估数据量,NS表示名称是异形同义的数据量。所述基础数据准确性评估公式如下:MNA=MN-MND-MNS其中,MNA表示去掉噪声数据后的手机定位数据数量,MN表示经过修改乒乓数据后的手机定位数据总量,MND表示漂移数据的数量,MNS表示长时间静止数据的数量。所述步骤S4具体包括:S41、采用AHP方法确定单源多维度准确性评估指标权重,设p个评估指标的权重分别为Waccuracy={w1,w2,…,wp},p≤m,m为评估对象的属性数量,单一数据源Si的准确性分别为Accuracyi1,Accuracyi2,…,Accuracyip,则单源多维度准确性评估模型为:S42、采用AHP方法确定单源多维度完整性评估指标权重,单源多维度完整性的评估模型为:S43、采用AHP方法确定单源多维度一致性评估指标权重,单源多维度本文档来自技高网...
一种基于AHP的多源位置轨迹数据的质量评估方法

【技术保护点】
一种基于AHP的多源位置轨迹数据的质量评估方法,其特征在于:包括步骤:S1、制定一个动态、带反馈机制的数据质量评估流程;S2、根据数据质量评估流程,确定数据质量的评估指标体系,所述评估指标体系包括评估维度、质量特征和评估指标,所述评估维度包括准确性、完整性和一致性,所述准确性包括基础数据准确性和关联数据准确性,所述基础数据准确性包括经纬度准确性、时间准确性、速度准确性、方向准确性和位置准确性,所述关联数据准确性包括路段平均行程车速准确性、路段平均行程时间准确性,所述完整性由内容完整性、结构完整性和关联数据完整性组成,所述内容完整性的评估指标为属性取值完整性,即属性值非空,所述结构完整性的评估指标为数据规范程度,所述关联完整性的评估指标包括时间完整性、空间完整性、路段完整性,所述路段完整性包括路段数据点密度完整性、路段车辆密度完整性,所述一致性包括数据一致性和语义一致性,所述数据一致性的评估指标为属性取值一致性,所述语义一致性的评估指标为异形同义;S3、根据评估指标体系,建立对应的数据质量评估模型;S4、根据数据质量评估模型,结合数据质量评估场景,采用AHP方法确定单源位置轨迹数据质量评估指标权重;S5、根据数据质量评估模型,结合数据质量评估场景,采用AHP方法确定多源位置轨迹数据质量评估指标权重;S6、应用数据质量评估模型测度数据质量。...

【技术特征摘要】
1.一种基于AHP的多源位置轨迹数据的质量评估方法,其特征在于:包括步骤:S1、制定一个动态、带反馈机制的数据质量评估流程;S2、根据数据质量评估流程,确定数据质量的评估指标体系,所述评估指标体系包括评估维度、质量特征和评估指标,所述评估维度包括准确性、完整性和一致性,所述准确性包括基础数据准确性和关联数据准确性,所述基础数据准确性包括经纬度准确性、时间准确性、速度准确性、方向准确性和位置准确性,所述关联数据准确性包括路段平均行程车速准确性、路段平均行程时间准确性,所述完整性由内容完整性、结构完整性和关联数据完整性组成,所述内容完整性的评估指标为属性取值完整性,即属性值非空,所述结构完整性的评估指标为数据规范程度,所述关联完整性的评估指标包括时间完整性、空间完整性、路段完整性,所述路段完整性包括路段数据点密度完整性、路段车辆密度完整性,所述一致性包括数据一致性和语义一致性,所述数据一致性的评估指标为属性取值一致性,所述语义一致性的评估指标为异形同义;S3、根据评估指标体系,建立对应的数据质量评估模型;S4、根据数据质量评估模型,结合数据质量评估场景,采用AHP方法确定单源位置轨迹数据质量评估指标权重;S5、根据数据质量评估模型,结合数据质量评估场景,采用AHP方法确定多源位置轨迹数据质量评估指标权重;S6、应用数据质量评估模型测度数据质量。2.根据权利要求1所述的一种基于AHP的多源位置轨迹数据的质量评估方法,其特征在于:所述步骤S1具体包括:S11、确定数据收集目标;S12、根据业务环境抽取数据质量维度和质量特征;S13、确定每一特征的评估指标,建立评估模型;S14、制定数据质量评估基线;S15、获取数据;S16、应用评估模型测度数据质量;S17、判断数据质量评估结果是否符合基线标准,如果符合,输出评估后的数据,并生成数据质量报告;如果不符合,返回步骤S15,重新获取数据;S18、经过评估并符合基线标准的数据可以执行后续的数据分析和数据挖掘工作;S19、判断数据分析或者数据挖掘的结果是否满足设定的目标,如果满足设定的目标,那么输出分析结果,同时,将其反馈给质量评估系统,为下一轮的评估提供更好的支持;如果不满足,有可能评估基线的制定不够合理,需要及时对评估基线进行调整,以便最终能得到符合目标的结果。3.根据权利要求1所述的一种基于AHP的多源位置轨迹数据的质量评估方法,其特征在于:根据步骤S2中的评估指标,建立的数据质量评估模型如下:所述基础数据准确性指标的数据质量评估模型,采用以下公式:其中,N表示待评估的轨迹数据总量,P表示若干个位置属性中的某个属性,即P∈{经度,纬度,时间,速度,位置,……},表示在该P个属性中,评估样本中满足准确性需求的样本数量,所述经纬度准确性的评估公式如下:其中,距离阈值为θm,落在标准POI点集θm范围内的待评估点集数量设置为所述标准POI点集的数量为N;所述路段平均行程车速准确性指标的数据质量评估模型,采用以下公式:其中,表示时间区间t内平均车速的平均绝对百分比误差,N为评估区域内的路段总数,表示第k个路段在时间区间t上的当前平均车速,表示同一路段在时间区间t上的历史平均车速,所述路段平均行程时间准确性指标的数据质量评估模型,采用以下公式:其中,表示时间区间t内平均行驶时间的平均绝对百分比误差,N为评估区域内的路段总数,表示第k个路段在时间区间t上的当前平均行驶时间,表示同一路段...

【专利技术属性】
技术研发人员:蔡莉梁宇胡洪斌
申请(专利权)人:云南大学
类型:发明
国别省市:云南,53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1