一种地理区域的采集参数确定方法及装置制造方法及图纸

技术编号:14743869 阅读:76 留言:0更新日期:2017-03-01 19:37
本发明专利技术实施例公开了一种地理区域的采集参数确定方法及装置。该方法包括:对历史采集点数据进行预处理,以获取预设等级区域的采集效率;根据预设等级区域的采集效率对待定关联性因素进行筛选,以确定有效关联性因素及权重值;按照设定的采集效率档位,根据采集效率和有效关联性因素及权重值,从地理区域中选择样本区域并确定区域分级;按照地理区域中的非样本区域与样本区域的相似性来确定非样本区域的区域分级;根据区域分级,确定级别区域的采集参数范围值。确定不同区域的采集参数,作为采集难度量化的基础,为采集工作的公平公正的绩效评估提供参考依据。

【技术实现步骤摘要】

本专利技术实施例涉及大数据处理和统计技术,尤其涉及一种地理区域的采集参数确定方法及装置
技术介绍
电子地图的制作需要采集室外基础地理数据,诸如道路/全景等信息,其采集的方式是驾驶装有专业采集设备的车辆在室外行驶,对道路、地物标识等信息进行拍照采集。采集作业工作会受到由地域因素(考虑为不同城市)的影响,不同的城市由于存在天然的客观条件综合差异,导致采集效率本身会有所不同。目前,对于不同城市的采集难度并没有区分,例如,采集车A:在路宽路多等级高,红绿灯少,人稀车少不堵的类似地域/城市采集作业8小时,共采集400公里;采集车B:在路窄路少等级低,红绿灯多,人密车多堵不停的类似地域/城市采集作业10小时,共采集300公里。若是仅按照车采里程进行工作绩效统计,会严重丧失公平性。那么对于不同车在不同城市进行采集作业,如何为采集效率的确定提供参考依据是当前面临的实际问题。如何确定地理区域的采集参数,以便实现采集难度的量化,是地理信息采集领域待解决的问题。
技术实现思路
本专利技术实施例提供一种地理区域的采集参数确定方法及装置,以实现不同地理区域采集参数的确定,便于对不同地理区域信息采集难度的量化。第一方面,本专利技术实施例提供了一种地理区域的采集参数确定方法,该方法包括:对历史采集点数据进行预处理,以获取预设等级区域的采集效率;根据预设等级区域的采集效率对待定关联性因素进行筛选,以确定有效关联性因素及权重值;按照设定的采集效率档位,根据采集效率和有效关联性因素及权重值,从地理区域中选择样本区域并确定区域分级;按照地理区域中的非样本区域与样本区域的相似性来确定非样本区域的区域分级;根据区域分级,确定级别区域的采集参数范围值。第二方面,本专利技术实施例还提供了一种地理区域的采集参数确定装置,该装置包括:数据预处理模块,用于对历史采集点数据进行预处理,以获取预设等级区域的采集效率;因素筛选模块,用于根据预设等级区域的采集效率对待定关联性因素进行筛选,以确定有效关联性因素及权重值;样本区域选择模块,用于按照设定的采集效率档位,根据采集效率和有效关联性因素及权重值,从地理区域中选择样本区域并确定区域分级;区域分级确定模块,用于按照地理区域中的非样本区域与样本区域的相似性来确定非样本区域的区域分级;采集参数确定模块,用于根据区域分级,确定级别区域的采集参数范围值。本专利技术实施例通过按照不同采集效率对地理区域进行分级的方法,确定不同区域的采集参数,作为采集难度量化的基础,解决了采集难度无法量化这一技术问题,为采集工作的公平公正的绩效评估提供了参考依据。附图说明图1为本专利技术实施例一提供的一种地理区域的采集参数确定方法的流程图;图2为本专利技术实施例提供的一种地理区域的采集参数确定方法中的某城市的一个区域示例图;图3为本专利技术实施例三提供的一种地理区域的采集参数确定方法中的建成区所有城市的采集效率区间叠加结果示意图;图4为本专利技术实施例二提供的一种地理区域的采集参数确定方法的流程图;图5为本专利技术实施例提供的一种地理区域的采集参数确定方法中的区域划分示意图;图6为本专利技术实施例二提供的一种地理区域的采集参数确定方法中的采集效率累积分布函数示意图;图7为本专利技术实施例三提供的一种地理区域的采集参数确定方法的流程图;图8为本专利技术实施例四提供的一种地理区域的采集参数确定方法的流程图;图9为本专利技术实施例五提供的一种地理区域的采集参数确定方法的流程图;图10为本专利技术实施例六提供的一种地理区域的采集参数确定方法的流程图;图11为本专利技术实施例七提供的一种地理区域的采集参数确定装置的示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种地理区域的采集参数确定方法的流程图,本实施例可适用于对地理区域的信息采集工作涉及的采集参数进行确定的情况,该方法可以由一种地理区域的采集参数确定装置来执行,该装置可以由软件和/或硬件的方式来实现,一般可集成于计算机等设备中。具体包括如下步骤:S110、对历史采集点数据进行预处理,以获取预设等级区域的采集效率。其中,历史采集点数据是指基础数据源,即各采集作业车每天(以下简称“车天”)历史作业的采集轨迹数据,该数据可遍布全国330多个城市。预处理包括对历史采集点的处理获得采集过程中涉及到的一些参数,主要是确定采集速度作为采集效率。由于各城市面积太大,且城市内各区域的特点不同,以一个城市作为独立个体场景考虑存在欠缺,因此可以结合采集业务需求将各城市(地级市)进行细化,归纳成多个不同的场景,每个场景就等同于一个预设等级区域。可选的,所述预设等级区域包括高速区、建成区和非建成区。其中,图2为本专利技术实施例提供的一种地理区域的采集参数确定方法中的某城市的一个区域示例图,含建成区、非建成区和高速区。建成区为“城市建成区”的简称,是指城市行政区内实际已成片开发建设、市政公用设施和公共设施基本具备的地区。非建成区即郊区。可以按照各城市的行政区域规划来设定。高速区是指各条高速公路组合而成的特殊区域。S120、根据预设等级区域的采集效率对待定关联性因素进行筛选,以确定有效关联性因素及权重值。其中,由于城市间客观因素的差别,需要对于建成区和非建成区两种场景各自进行城市分级。以建成区场景的城市分级为例,将建成区所有城市的采集效率区间叠加时,叠加结果如图3所示,不存在明显阶跃现象以及区间存在较大的范围叠加,故若采用直接设置几个等级阈值方法效果很差,而聚类算法也由于需要指定类别数目无法适用。故可以提供一种基于待定关联性数据的辅助划分方法来解决这个技术问题,需要首先进行关联性挖掘,找出关联性较强的有效关联性因素辅助后续操作。待定关联性因素指的是与采集效率可能有关联性的因素,对于从属于不同城市的采集效率,与各城市的特征数据相关,因此待定关联性因素可以是与采集效率相关的城市的特征数据,例如可以是人口数量等。预设等级区域的采集效率对待定关联性因素进行筛选,以确定关联性强的关联性因素,并确定每个有效关联性因素对应的权重值,权重值是关联性程度的表征。S130、按照设定的采集效率档位,根据采集效率和有效关联性因素及权重值,从地理区域中选择样本区域并确定区域分级。其中,样本区域是指代表城市。将每一个预设等级区域,设定采集效率的档位,从所有的城市中选取代表城市,结合采集效率、有效关联性因素的数值以及权重值,将接近某一个档位条件的代表城市的预设等级区域划归成一个级别,若不存在接近某一个档位条件的城市,则该级别自动消失,最终确定代表城市分级。示例性地,以建成区为例,代表城市的建成区分级情况如下表1所示:表1建成区的城市分级表级别城市1阿拉善盟、鄂尔多斯等2宁波、厦门、天津等……S140、按照地理区域中的非样本区域与样本区域的相似性来确定非样本区域的区域分级。其中,非样本区域指除了代表城市外的其他城市,由于城市代表已经完成分级,所以可以通过将非城市代表与城市代表的采集效率特征进行比对的方式,将非城市代表划分到与其相似性高的城市代表对应的分级中,示例性地,以建成区为例,假如已获知本文档来自技高网...
一种地理区域的采集参数确定方法及装置

【技术保护点】
一种地理区域的采集参数确定方法,其特征在于,包括:对历史采集点数据进行预处理,以获取预设等级区域的采集效率;根据预设等级区域的采集效率对待定关联性因素进行筛选,以确定有效关联性因素及权重值;按照设定的采集效率档位,根据采集效率和有效关联性因素及权重值,从地理区域中选择样本区域并确定区域分级;按照地理区域中的非样本区域与样本区域的相似性来确定非样本区域的区域分级;根据区域分级,确定级别区域的采集参数范围值。

【技术特征摘要】
1.一种地理区域的采集参数确定方法,其特征在于,包括:对历史采集点数据进行预处理,以获取预设等级区域的采集效率;根据预设等级区域的采集效率对待定关联性因素进行筛选,以确定有效关联性因素及权重值;按照设定的采集效率档位,根据采集效率和有效关联性因素及权重值,从地理区域中选择样本区域并确定区域分级;按照地理区域中的非样本区域与样本区域的相似性来确定非样本区域的区域分级;根据区域分级,确定级别区域的采集参数范围值。2.根据权利要求1所述的方法,其特征在于,所述预设等级区域包括高速区、建成区和非建成区。3.根据权利要求1或2所述的方法,其特征在于,对历史采集点数据进行预处理,以获取预设等级区域的采集效率包括:将各城市所有采集点所涉及的区域按照预设等级区域的特征,划分为高速区、建成区和非建成区;其中,所有城市的高速区归纳为一个高速区;按照基础路网数据将各采集点与道路进行匹配,按照采集点的道路属性,将采集点划归至各预设等级区域;在预设等级区域内,从采集点所对应的每车天采集轨迹数据中确定采集里程和采集时长,计算采集速度,作为采集效率。4.根据权利要求1所述的方法,其特征在于,根据预设等级区域的采集效率对待定关联性因素进行筛选,以确定有效关联性因素及权重值包括:预先选择多个待定关联性因素;根据所述采集点的采集效率,针对每种待定关联性因素,进行独立回归建模,以取得回归建模结果,其中,所述回归建模结果包括标识、P值和调整后的R方;将所述标识为通过、P值小于第一设定门限值、调整后的R方大于第二设定门限值且关联值大于第三设定门限值的待定关联性因素确定为有效关联性因素,并根据回归建模结果确定有效关联性因素的权重值。5.根据权利要求2所述的方法,其特征在于,按照设定的采集效率档位,根据采集效率和有效关联性因素及权重值,从地理区域中选择样本区域并确定区域分级包括:对于所有城市的建成区和非建成区场景的采集效率,分别计算采集效率概率密度函数,计算设定百分数处的采集效率,作为所述采集效率档位;选择待定样本城市,将所述待定样本城市的采集效率,乘以有效关联性因素的数值及其权重值,作为修正后的采集效率;按照修正后的采集效率,与预设的采集效率档位进行比对,确定待定样本城市的区域分级。6.根据权利要求2或5所述的方法,其特征在于,按照地理区域中的非样本区域与样本区域的相似性来确定非样本区域的区域分级包括:将各分级的样本区域的建成区和非建成区的采集效率均设定级别标签,形成训练集;将非样本区域的采集效率,计算采集效率概率密度函数,选择设定点位处的值作为采集效率的特征向量;将所述特征向量使用K邻近算法处理,与训练集中具备区域分级的样本城市的采集效率进行比对,以确定非样本城市的区域分级。7.根据权利要求1所述的方法,其特征在于,根据区域分级,确定级别区域的采集参数范围值包括:将每个级别的所有城市建成区和非建成区的采集效率分别计算概率密度函数,分别取三个概率区间的采集效率,作为最小可接受值、中心建议值和最大正常值;根据高速区的采集效率计算统一的高速采集效率。8.根据权利要求1所述的方法,其特征在于,根据区域分级,确定级别区域的采集参数范围值之后,还包括:将最高级别的采集效率设为基准值,除以其他级别的采集效率,以计算其他级别的采集难度系数。9.根据权利要求1所述的方法,其特征在于,根据区域分级,确定级别区域的采集参数范围值之后,还包括:将实际城市每车天的采集轨迹,划分至预设等级区域中;根据实际城市的等级,获取预设等级区域的采集效率范围值,与实际采集轨迹进行比对,以确定采集轨迹的效率。10.一种地理区域的采集参数确定装置,其特征在于,包括:数据预处理模块,用于对历史采集点数据进行预处理,以获...

【专利技术属性】
技术研发人员:石强刘玉亭种道晨史开贵张山张炎鹏张剑
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1