一种基于移动大样本数据的历史人群规模推总方法及装置制造方法及图纸

技术编号:19068011 阅读:34 留言:0更新日期:2018-09-29 14:56
本申请实施例公开了一种基于移动大样本数据的历史人群规模推总方法及装置,包括:采集待推总区域内移动设备的设备位置信息;网格化划分所述待推总区域,并确定各个网格所属的分类;构建目标分类网格的人口推算模型,所述目标分类网格为对应目标分类的网格,所述人口推算模型与所述设备位置信息相关联;根据所述人口推算模型推总所述目标分类网格的人群规模。通过基于设备位置信息推总人群规模时结合网格分类,既能够保证数据的合理性,又能大大节省成本。

【技术实现步骤摘要】
一种基于移动大样本数据的历史人群规模推总方法及装置
本申请涉及人群规模推总
,具体涉及一种基于移动大样本数据的历史人群规模推总方法及装置。
技术介绍
商业地理分析需要大量人口数据、区域地理数据的支持,以往对于公众人流的跟踪采用人工抽样统计、闸口统计、视频采集等手段,成本高的同时还存在数据误差大、布放条件高等不利因素,特别是无法实现实时动态分析。随着移动设备的普及,设备自带GPS(GlobalPositioningSystem,全球定位系统)、陀螺仪、近场通信功能等,这使得利用移动终端采集更丰富的数据信息成为可能,进而产生完全不同于PC的新式互联网服务。我们目前已经可以享受到了比如导航、签到、O2O(OnlineToOffline,线上到线下)等新式服务,未来可能会出现更革命性的应用服务。现有主流方案主要是通过统计局公开数据、互联网开放数据、线下人工调研采集数据为基础,将宏观的人口原理与微观的行为需求原理相结合,完成对大规模人口的建模和仿真。针对这类技术而言,多方数据来源的人群定义口径、人群统计时间周期存在不一致的情况,建立在人群规模覆盖少、人群属性特征缺失,数据基础良莠不齐的基础上的大规模人口仿真建模必然存在较大的误差和风险。申请内容本申请提供一种基于移动大样本数据的历史人群规模推总方法及装置,能够基于设备位置信息推总人群规模,在保证数据的合理性的同时又能大大节省成本。有鉴于此,本申请实施例第一方面提供一种基于移动大样本数据的历史人群规模推总方法,包括:采集待推总区域内移动设备的设备位置信息;网格化划分所述待推总区域,并确定各个网格所属的分类;构建目标分类网格的人口推算模型,所述目标分类网格为对应目标分类的网格,所述人口推算模型与所述设备位置信息相关联;根据所述人口推算模型推总所述目标分类网格的人群规模。进一步的,所述根据所述人口推算模型推总所述目标分类网格的人群规模包括:根据所述设备位置信息确定所述目标分类网格内的移动设备总数;将所述移动设备总数代入所述人口推算模型以推算得到所述目标分类网格的人群规模。进一步的,所述人口推算模型为:网格修正系数*(移动设备总数/机型渗透率系数)/设备渗透率系数;其中,所述网格修正系数与所述目标分类网格相对应关联,所述机型渗透率系数与所述待推总区域内移动设备的数量、市场存量、厂家出货量相关联,所述设备渗透率系数与所述待推总区域内报点的移动设备数量以及人均移动设备持有量相关联。进一步的,所述确定各个网格所属的分类包括:分别统计各个网格内所有POI类型的数量,并对应确定数量比重最高的POI类型为网格所属的分类。进一步的,所述采集待推总区域内移动设备的设备位置信息包括:采集移动设备上报的报点信息,所述报点信息包含LBS位置数据和WiFi探针采集数据;获取所述报点信息的停留点,所述停留点通过对所述报点信息进行时序聚类处理获得;确定所述停留点为所述设备位置信息。本申请实施例第二方面提供了一种计算机可读存储介质,包括程序,所述程序能够被处理器执行以实现如上本申请实施例第一方面提供的所述基于移动大样本数据的历史人群规模推总方法。本申请实施例第三方面提供了一种基于移动大样本数据的历史人群规模推总装置,包括:采集模块,用于采集待推总区域内移动设备的设备位置信息;划分模块,用于网格化划分所述待推总区域,并确定各个网格所属的分类;构建模块,用于构建目标分类网格的人口推算模型,所述目标分类网格为对应目标分类的网格,所述人口推算模型与所述设备位置信息相关联;推总模块,用于根据所述人口推算模型推总所述目标分类网格的人群规模。进一步的,所述推总模块具体用于:根据所述设备位置信息确定所述目标分类网格内的移动设备总数;将所述移动设备总数代入所述人口推算模型以推算得到所述目标分类网格的人群规模;其中,所述人口推算模型为:网格修正系数*(移动设备总数/机型渗透率系数)/设备渗透率系数;所述网格修正系数与所述目标分类网格相对应关联,所述机型渗透率系数与所述待推总区域内移动设备的数量、市场存量、厂家出货量相关联,所述设备渗透率系数与所述待推总区域内报点的移动设备数量以及人均移动设备持有量相关联。进一步的,所述划分模块具体用于:分别统计各个网格内所有POI类型的数量,并对应确定数量比重最高的POI类型为网格所属的分类。进一步的,所述采集模块具体用于:采集移动设备上报的报点信息,所述报点信息包含LBS位置数据和WiFi探针采集数据;获取所述报点信息的停留点,所述停留点通过对所述报点信息进行时序聚类处理获得;确定所述停留点为所述设备位置信息。依据上述实施例的基于移动大样本数据的历史人群规模推总方法及装置,通过采集待推总区域内移动设备的设备位置信息作为移动大样本数据,将待推总区域网格化划分,构建人口推算模型推总目标分类网格的人群规模,可见,本申请实施例中在基于设备位置信息推总人群规模时结合网格分类,能够保证数据的合理性,同时又能大大节省成本。附图说明图1为本申请实施例中基于移动大样本数据的历史人群规模推总方法的一个实施例示意图;图2为本申请实施例中时序聚类示意图;图3为本申请实施例中基于移动大样本数据的历史人群规模推总装置的一个实施例示意图。具体实施方式下面通过具体实施方式结合附图对本申请作进一步详细说明。应理解,在现有技术中还有一类是通过从手机通信运营商实时获取的实时手机用户行为数据进行人群规模推总,将目标区域划分为不同的空间区域,统计当前统计时刻各个空间区域内的所有手机个体的出现概率,得到各个空间区域的手机终端总量,根据有效手机终端样本比例、人均随身手机持有比例与移动通信运营商市场占有比例,进行模型推算到总体人群。但对于这类技术来讲,由于运营商基站采集位置通常是方圆2公里内的范围,另外采集位置信息不完整,甚至漂移,从而造成用户行为轨迹的缺失和误判。而在本申请实施例中,主要通过移动互联网数据服务提供商,利用自身业务数据优势,将移动设备的LBS(LocationBasedService,基于移动位置服务)位置数据与WiFi(Wireless-Fidelity,无线保真)探针采集的数据相结合,采集大量的移动设备的报点信息作为移动大样本数据,并将其进行时序聚类优化处理以得到准确的设备位置信息。需要说明的是,本申请实施例中移动设备包括但不限于ios设备和Android设备,该ios设备即基于ios操作系统的移动设备,该Android设备基于Android操作系统的移动设备。具体的,如图1所示,在基于移动大样本数据的历史人群规模推总方法的一个实施例中,包括:S101、采集待推总区域内移动设备的设备位置信息;在本实施例中,采集待推总区域内移动设备上报的包含LBS位置数据和WiFi探针采集数据的报点信息,该待推总区域可以以一个待推总的城市区域为例进行举例说明。利用时序聚类对报点信息的数据进行聚类优化得到该移动设备在一天内的停留点,并将该停留点作为移动设备的设备位置信息。如图2所示,具体为:对于单个移动设备上报的报点信息,其位置轨迹可以抽象为一系列的报点构建出的报点序列,即T=S1→S2→…→Si→…→Sl(T为轨迹序列,S1,S2,…是具体停留点);以t小时(具体时间可根据实际场景自行设置)为标准,利用时本文档来自技高网...

【技术保护点】
1.一种基于移动大样本数据的历史人群规模推总方法,其特征在于,包括:采集待推总区域内移动设备的设备位置信息;网格化划分所述待推总区域,并确定各个网格所属的分类;构建目标分类网格的人口推算模型,所述目标分类网格为对应目标分类的网格,所述人口推算模型与所述设备位置信息相关联;根据所述人口推算模型推总所述目标分类网格的人群规模。

【技术特征摘要】
1.一种基于移动大样本数据的历史人群规模推总方法,其特征在于,包括:采集待推总区域内移动设备的设备位置信息;网格化划分所述待推总区域,并确定各个网格所属的分类;构建目标分类网格的人口推算模型,所述目标分类网格为对应目标分类的网格,所述人口推算模型与所述设备位置信息相关联;根据所述人口推算模型推总所述目标分类网格的人群规模。2.根据权利要求1所述的一种基于移动大样本数据的历史人群规模推总方法,其特征在于,所述根据所述人口推算模型推总所述目标分类网格的人群规模包括:根据所述设备位置信息确定所述目标分类网格内的移动设备总数;将所述移动设备总数代入所述人口推算模型以推算得到所述目标分类网格的人群规模。3.根据权利要求1所述的一种基于移动大样本数据的历史人群规模推总方法,其特征在于,所述人口推算模型为:网格修正系数*(移动设备总数/机型渗透率系数)/设备渗透率系数;其中,所述网格修正系数与所述目标分类网格相对应关联,所述机型渗透率系数与所述待推总区域内移动设备的数量、市场存量、厂家出货量相关联,所述设备渗透率系数与所述待推总区域内报点的移动设备数量以及人均移动设备持有量相关联。4.根据权利要求1所述的一种基于移动大样本数据的历史人群规模推总方法,其特征在于,所述确定各个网格所属的分类包括:分别统计各个网格内所有POI类型的数量,并对应确定数量比重最高的POI类型为网格所属的分类。5.根据权利要求1所述的一种基于移动大样本数据的历史人群规模推总方法,其特征在于,所述采集待推总区域内移动设备的设备位置信息包括:采集移动设备上报的报点信息,所述报点信息包含LBS位置数据和WiFi探针采集数据;获取所述报点信息的停留点,所述停留点通过对所述报点信息进行时序聚类处理获得;确定所述停留点为所述设备位置信息。6.一种计算机可读存储介质...

【专利技术属性】
技术研发人员:洪晶陈宇
申请(专利权)人:深圳市和讯华谷信息技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1