基于多源SDK空间活动大数据的目标识别机学习方法和系统技术方案

技术编号:26173808 阅读:20 留言:0更新日期:2020-10-31 13:58
本发明专利技术涉及基于多源SDK空间活动大数据的目标识别机学习方法和系统,包括以下步骤读取利用SDK接口从APP获取的多源匿名加密个体空间位置数据,匿名加密空间位置数据理论上在时间上连续,不同移动终端设备对应不同的ID编号,提取每个设备号在指定时间段内使用GPS功能和wifi链接的记录,从中提取个体在每个记录时间点的空间位置信息,构成个体持有该设备的出行时空数据集合。该基于多源SDK空间活动大数据的目标识别机学习方法和系统,充分利用现有的由移动端APP生成的海量个体空间位置记录,设计识别个体消费类型的指标体系和以此体系为识别基础的机器学习算法,有效地从大量空间位置信息中提取出个体的消费类型。

【技术实现步骤摘要】
基于多源SDK空间活动大数据的目标识别机学习方法和系统
本专利技术涉及数据统计
,具体为基于多源SDK空间活动大数据的目标识别机学习方法和系统。
技术介绍
近年来,随着信息技术的发展,数据信息量呈现爆炸式增长,数据来源越来越多,数据量也越来越庞大。其中,由手机、WIFI、物联网等信息传感器记录的数据已经成为大数据分析中最重要的数据来源,其较为完备的个体出行记录为大数据分析提供了很好的数据支持。SDK大数据指的是通过在移动端APP开发过程中在开发工具(softwaredevelopmentkit)中嵌入各种信息的读取程序而综合获取的海量多源数据,具体可包括个体的位置信息、APP使用信息、个体与个体间的交互信息等。其中,SDK数据源包含的大量个体的时空位置来源于移动设备的GPS功能和WIFI连接,较手机信令数据具有更高的空间位置精度和时效性,对于发掘个体的时间出行特征,进而探究个体的空间行为模式具有重要的价值,但SDK获取的数据只是空间位置信息,本身并不刻画个体的行为特征,因此我们设计了一套基于机器学习的客户消费模式判别机制,通过发掘个体的经本文档来自技高网...

【技术保护点】
1.基于多源SDK空间活动大数据的目标识别机学习方法和系统,其特征在于:包括以下步骤:/n步骤1、读取利用SDK接口从APP获取的多源匿名加密个体空间位置数据,匿名加密空间位置数据理论上在时间上连续,不同移动终端设备对应不同的ID编号,提取每个设备号在指定时间段内使用GPS功能和wifi链接的记录,从中提取个体在每个记录时间点的空间位置信息,构成个体持有该设备的出行时空数据集合,对多源空间位置数据其按时间排列后合并,获得以设备号为识别标志的个体出行时空轨迹,通过时空插值法对其按等时间间隔进行填充,获得个体出行时空序列;/n步骤2、获取目标城市的基础地理信息数据,依据道路网将城市划分为大量独立的...

【技术特征摘要】
1.基于多源SDK空间活动大数据的目标识别机学习方法和系统,其特征在于:包括以下步骤:
步骤1、读取利用SDK接口从APP获取的多源匿名加密个体空间位置数据,匿名加密空间位置数据理论上在时间上连续,不同移动终端设备对应不同的ID编号,提取每个设备号在指定时间段内使用GPS功能和wifi链接的记录,从中提取个体在每个记录时间点的空间位置信息,构成个体持有该设备的出行时空数据集合,对多源空间位置数据其按时间排列后合并,获得以设备号为识别标志的个体出行时空轨迹,通过时空插值法对其按等时间间隔进行填充,获得个体出行时空序列;
步骤2、获取目标城市的基础地理信息数据,依据道路网将城市划分为大量独立的地块,赋予其土地利用类型属性,基于不同的地块类型,赋予其地价、租金、房价、等级信息,将个体出行时空序列投射到地理信息数据上,获取个体在不同类型地块中的分布情况,构建个体空间出行频谱记录其在规定时间段内在不同类型地块的出现频率和所处地块的价值,分析其经济地位、消费能力和消费倾向,作为其消费类型判别的基础;
步骤3、预先划分消费类型,获取消费类型已知的先验样本,计算其出行过程中的累积地块价值、地块类型频谱、商业地块价值频谱,获取各种消费群体初步的判别条件,对未知消费类型的个体进行机器判定,对于机器无法识别的消费类型,则进行人工干预识别,并生成新的消费类型;
步骤4、在对个体的消费类型进行机器识别的基础上,以时间TD为间隔进行消费类型划分标准的自我学习,基于在TD时刻内新出现的消费类型,对已判别个体进行重新识别,进一步提高消费类型判别的准确性,同时基于已判断的个体对不同消费类型的判断条件进行不断修正,实现系统对消费类型识别的自我学习和完善;
步骤5、针对特定的商户消费者,判断其所在的消费类型区间,及其同类型的商户及其所在位置,将商户位置投射到地理信息系统上,从数据库中提取对应消费类型的个体,分析个体在指定商户所在地块出现的频率,为指定商户识别其潜在目标客户的数量和空间分布情况。


2.根据权利要求1所述的基于多源SDK空间活动大数据的目标识别机学习方法和系统,其特征在于:所述步骤1包括:
步骤1.1、系统基于SDK技术从大量APP读取多源个体匿名加密GPS和wifi连接数据,理论上匿名加密GPS数据在时间与空间上都应该是连续的,包括:个体手持移动设备的唯一编号EID、GPS定位动作发生时刻TIME、获得的空间定位经纬度LAT、LON,以及个体高程Z;wifi连接数据包含个体手持移动设备的唯一编号EID、连接动作发生时刻TIME、wifi固定传感器编号SID、wifi瞬时强度STRH;
步骤1.2、对每条GPS定位记录进行解密,读取记录中的EID、TIME、LAT、LON、Z等字段,将其转化为地理空间XY坐标系;对于wifi连接记录,由于wifi连接数据不能直接得到个体准确的空间位置,因此需要在获取与个体同时保持通信关系的多个wifi固定传感器之间的信号强度的基础上推导出个体的空间位置经纬度坐标和高程数据,同样将其转化为地理空间XY坐标;
步骤1.3、根据个体手持移动设备的唯一编号EID,查询其在指定时间段内所有APP调用GPS留下的定位记录和由wifi连接记录推导出的个体空间位置,将多个来源的空间位置相互融合,初步构建个体多源GSP和wifi连接数据组成的出行时空轨迹;
步骤1.4、采用基于时空插值算法,对每条个体出行时空轨迹进行等时间间距的空间插值,获得等时间间隔的个体出行时空序列,该时时空序列包含了个体在每个固定时间节点上的空间XY坐标,替代原始的移动通信卡与固定传感器之间的通信记录,完全以插值得到的个体出行时空序列代表个体在时空上的移动,最终获取个体在指定时间段T内等时间间隔Th的出行时空序列,序列中包含T/Th+1个节点,每个节点均包含了时间和XY坐标信息。


3.根据权利要求1所述的基于多源SDK空间活动大数据的目标识别机学习方法和系统,其特征在于:所述步骤2包括:
步骤2.1、获取所在城市的基础地理信息数据、土地利用数据,依据道路网将城市划分为大量小的地块,将土地利用类型赋予每个地块,针对不同的土地利用类型,获取其地块价值信息;
步骤2.1.1、将单位面积租金和房价信息赋予商业用地地块;
步骤2.1.2、将单位面积租金和房价信息赋予住宅用地地块;
步骤2.1.3、将人均消费数值赋予娱乐场所等地块;
步骤2.1.4、将公共设施,包括医院、公园、学校等,按照从小到大的等级划分,赋予等级数值;
步骤2.1.5、统计每块地块在其同类型地块中的租金、房价、人均消费排序,作为地块的价值系数在个体判别指标的构建中使用;
步骤2.1.6、对于同时拥有租金和房价信息的地块,其最终的地块价值排序为两者排序的平均值作为地块最终的地块价值;
步骤2.1.7、对于公共设施,采用其等级值作为地块价值指标;
步骤2.2、将个体出行时空序列中的节点投射到地理信息系统中的地块数据上,记录下个体在各个地块中的节点数量,即为个体在该地块中的停留时间,由于出行时空序列为等时间间隔,因此每个个体在固定时间段内可投射到地图上的节点数量是一致的;
步骤2.3、构建反映个体经济地位、消费倾向和消费能力的指标作为其消费类型的判别依据;
步骤2.3.1、统计个体在指定时间段内出行时空序列中所有节点所在地块的价值的平均值作为反映个体经济地位的指标:



式中,Ei表示个体i的经济地位,pj,k,t表示地块类型为k的地块j的价值系数,bi,j,t为布尔变量,显示个体i在t时刻是否出现在地块j上;
...

【专利技术属性】
技术研发人员:树宁林
申请(专利权)人:南京米星姆信息科技有限公司
类型:发明
国别省市:江苏;32

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1