【技术实现步骤摘要】
一种数据处理方法及相关设备
本申请涉及通信领域,尤其涉及一种数据处理方法及相关设备。
技术介绍
商场到访客流建模预测是商业地理学领域的传统问题,根据WaldoTobler提出的地理学第一定律(Tobler'sFirstLaw):空间上越相近的事物相互间关联越为紧密,而在地理学中,常使用由物理学中万有引力定律借鉴而来的重力模型来表征地理事物的相关性,例如从区域i被吸引至区域j的人数。Huff提出了著名的Huff模型,Huff模型针对零售商场的到访客流建模给出了基于重力模型的解释:消费者由地点i去商场j购物的影响因素包括商场自身的规模与地点到商场间的距离,商场自身的规模是正向影响因素,规模越大吸引的消费者数量越多,而地点到商场的距离是负向影响因素,距离越远吸引的消费者数量越少。Huff模型提出后,涌现了大量基于Huff模型及其变种的零售商场到访客流研究,例如Okoruwa等基于泊松重力模型估计商场的市场份额,Lee等基于社会经济调查数据对商场到访行为进行了建模,Piovani等基于路网距离对伦敦的商场到访量进行精细估计。 ...
【技术保护点】
1.一种数据处理方法,其特征在于,包括:/n确定N个小区中每个小区的画像特征,所述N个小区为目标区域中的小区,N为大于或等于1的正整数;/n获取第一区域对应的业态特征,所述第一区域与所述目标区域相关联;/n确定所述N个小区中每个小区与所述第一区域的距离数据;/n通过第一目标小区的画像特征、所述第一目标小区与所述第一区域的距离数据以及所述第一区域对应的业态特征构建K个回归决策树,其中,所述第一目标小区为所述N个小区中的任意一个小区,所述K个回归决策树与机器学习回归模型相对应;/n将所述K个回归决策树中所有回归决策树对应的预测值之和确定为所述第一目标小区向所述第一区域输入的客流 ...
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
确定N个小区中每个小区的画像特征,所述N个小区为目标区域中的小区,N为大于或等于1的正整数;
获取第一区域对应的业态特征,所述第一区域与所述目标区域相关联;
确定所述N个小区中每个小区与所述第一区域的距离数据;
通过第一目标小区的画像特征、所述第一目标小区与所述第一区域的距离数据以及所述第一区域对应的业态特征构建K个回归决策树,其中,所述第一目标小区为所述N个小区中的任意一个小区,所述K个回归决策树与机器学习回归模型相对应;
将所述K个回归决策树中所有回归决策树对应的预测值之和确定为所述第一目标小区向所述第一区域输入的客流量;
根据所述第一目标小区向所述第一区域输送的客流量计算所述第一区域总的客流量。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取预设时间段内所述目标区域中到访第二区域的目标用户列表;
确定第二目标小区与所述第二区域的到访关系数据,所述第二目标小区为目标用户对应的居住小区,所述目标用户为所述目标用户列表中的任意一个用户;
提取所述第二目标小区的画像特征;
确定所述第二区域对应的业态特征;
确定所述第二目标小区与所述第二区域之间的目标距离;
对所述第二目标小区与所述第二区域的到访关系数据、所述第二目标小区的画像数据、所述第二区域对应的业态特征以及所述目标距离进行训练,得到所述机器学习回归模型。
3.根据权利要求2所述的方法,其特征在于,所述获取预设时间段内所述目标区域内到访所述第二区域的目标用户列表包括:
获取所述预设时间段内的定位轨迹数据处于所述第二区域的第一用户列表;
剔除所述第一用户列表中符合预设条件的用户,得到所述目标用户列表,其中,所述预设条件为在所述第二区域居住、工作和/或在目标时段处于所述第二区域。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述获取第一区域对应的业态特征包括:
统计所述第一区域内各类别商业类信息点的数量;
将所述第一区域内各类别商业类信息点的数量确定为所述第一区域对应的业态特征。
5.根据权利要求1至3中任一项所述的方法,其特征在于,所述确定N个小区中每个小区的画像特征包括:
确定所述N个小区中每个小区内用户的用户画像;
根据所述N个小区中每个小区内用户的用户画像确定所述N个小区中每个小区的画像特征。
6.一种...
【专利技术属性】
技术研发人员:杨帆,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。