【技术实现步骤摘要】
本专利技术实施例涉及大数据处理和统计技术,尤其涉及一种地理区域的采集参数确定方法及装置。
技术介绍
电子地图的制作需要采集室外基础地理数据,诸如道路/全景等信息,其采集的方式是驾驶装有专业采集设备的车辆在室外行驶,对道路、地物标识等信息进行拍照采集。采集作业工作会受到由地域因素(考虑为不同城市)的影响,不同的城市由于存在天然的客观条件综合差异,导致采集效率本身会有所不同。目前,对于不同城市的采集难度并没有区分,例如,采集车A:在路宽路多等级高,红绿灯少,人稀车少不堵的类似地域/城市采集作业8小时,共采集400公里;采集车B:在路窄路少等级低,红绿灯多,人密车多堵不停的类似地域/城市采集作业10小时,共采集300公里。若是仅按照车采里程进行工作绩效统计,会严重丧失公平性。那么对于不同车在不同城市进行采集作业,如何为采集效率的确定提供参考依据是当前面临的实际问题。如何确定地理区域的采集参数,以便实现采集难度的量化,是地理信息采集领域待解决的问题。
技术实现思路
本专利技术实施例提供一种地理区域的采集参数确定方法及装置,以实现不同地理区域采集参数的确定,便于对不同地理区域信息采集难度的量化。第一方面,本专利技术实施例提供了一种地理区域的采集参数确定方法,该方法包括:对历史采集点数据进行预处理,以获取预设等级区域的采集效率;根据预设等级区域的采集效率对待定关联性因素进行筛选,以确定有效关联性因素及权重值;按照设定的采集效率档位,根据采集效率和有效关联性因素及权重值,从地理区域中选择样本区域并确定区域分级;按照地理区域中的非样本区域与样本区域的相似性来确定非样本区域的 ...
【技术保护点】
一种地理区域的采集参数确定方法,其特征在于,包括:对历史采集点数据进行预处理,以获取预设等级区域的采集效率;根据预设等级区域的采集效率对待定关联性因素进行筛选,以确定有效关联性因素及权重值;按照设定的采集效率档位,根据采集效率和有效关联性因素及权重值,从地理区域中选择样本区域并确定区域分级;按照地理区域中的非样本区域与样本区域的相似性来确定非样本区域的区域分级;根据区域分级,确定级别区域的采集参数范围值。
【技术特征摘要】
1.一种地理区域的采集参数确定方法,其特征在于,包括:对历史采集点数据进行预处理,以获取预设等级区域的采集效率;根据预设等级区域的采集效率对待定关联性因素进行筛选,以确定有效关联性因素及权重值;按照设定的采集效率档位,根据采集效率和有效关联性因素及权重值,从地理区域中选择样本区域并确定区域分级;按照地理区域中的非样本区域与样本区域的相似性来确定非样本区域的区域分级;根据区域分级,确定级别区域的采集参数范围值。2.根据权利要求1所述的方法,其特征在于,所述预设等级区域包括高速区、建成区和非建成区。3.根据权利要求1或2所述的方法,其特征在于,对历史采集点数据进行预处理,以获取预设等级区域的采集效率包括:将各城市所有采集点所涉及的区域按照预设等级区域的特征,划分为高速区、建成区和非建成区;其中,所有城市的高速区归纳为一个高速区;按照基础路网数据将各采集点与道路进行匹配,按照采集点的道路属性,将采集点划归至各预设等级区域;在预设等级区域内,从采集点所对应的每车天采集轨迹数据中确定采集里程和采集时长,计算采集速度,作为采集效率。4.根据权利要求1所述的方法,其特征在于,根据预设等级区域的采集效率对待定关联性因素进行筛选,以确定有效关联性因素及权重值包括:预先选择多个待定关联性因素;根据所述采集点的采集效率,针对每种待定关联性因素,进行独立回归建模,以取得回归建模结果,其中,所述回归建模结果包括标识、P值和调整后的R方;将所述标识为通过、P值小于第一设定门限值、调整后的R方大于第二设定门限值且关联值大于第三设定门限值的待定关联性因素确定为有效关联性因素,并根据回归建模结果确定有效关联性因素的权重值。5.根据权利要求2所述的方法,其特征在于,按照设定的采集效率档位,根据采集效率和有效关联性因素及权重值,从地理区域中选择样本区域并确定区域分级包括:对于所有城市的建成区和非建成区场景的采集效率,分别计算采集效率概率密度函数,计算设定百分数处的采集效率,作为所述采集效率档位;选择待定样本城市,将所述待定样本城市的采集效率,乘以有效关联性因素的数值及其权重值,作为修正后的采集效率;按照修正后的采集效率,与预设的采集效率档位进行比对,确定待定样本城市的区域分级。6.根据权利要求2或5所述的方法,其特征在于,按照地理区域中的非样本区域与样本区域的相似性来确定非样本区域的区域分级包括:将各分级的样本区域的建成区和非建成区的采集效率均设定级别标签,形成训练集;将非样本区域的采集效率,计算采集效率概率密度函数,选择设定点位处的值作为采集效率的特征向量;将所述特征向量使用K邻近算法处理,与训练集中具备区域分级的样本城市的采集效率进行比对,以确定非样本城市的区域分级。7.根据权利要求1所述的方法,其特征在于,根据区域分级,确定级别区域的采集参数范围值包括:将每个级别的所有城市建成区和非建成区的采集效率分别计算概率密度函数,分别取三个概率区间的采集效率,作为最小可接受值、中心建议值和最大正常值;根据高速区的采集效率计算统一的高速采集效率。8.根据权利要求1所述的方法,其特征在于,根据区域分级,确定级别区域的采集参数范围值之后,还包括:将最高级别的采集效率设为基准值,除以其他级别的采集效率,以计算其他级别的采集难度系数。9.根据权利要求1所述的方法,其特征在于,根据区域分级,确定级别区域的采集参数范围值之后,还包括:将实际城市每车天的采集轨迹,划分至预设等级区域中;根据实际城市的等级,获取预设等级区域的采集效率范围值,与实际采集轨迹进行比对,以确定采集轨迹的效率。10.一种地理区域的采集参数确定装置,其特征在于,包括:数据预处理模块,用于对历史采集点数据进行预处理,以获...
【专利技术属性】
技术研发人员:石强,刘玉亭,种道晨,史开贵,张山,张炎鹏,张剑,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。