【技术实现步骤摘要】
数据栅格化、用户行为分析的方法和装置
本专利技术涉及数据处理领域,更具体的涉及一种数据栅格化、以及一种用户行为分析的方法和装置。
技术介绍
随着移动通信网络,互联网,移动终端(智能手机,汽车终端)等的发展,服务器可以借助网络中的其他节点获得海量的用户位置数据和用户行为数据。其中,用户位置数据是运营商通过给用户提供服务的基站采集到的用户在某个时刻所在的位置,比如张X在2014年10月23日10:00:00分,位置为经度113.5678,纬度23.111;用户行为数据则是用户在某个时间,通过某个终端产生的行为属性数据,比如张X在2014年10月23日10:00:00分打了一次电话,时长2分钟,又如百度用户xyz在xx时间搜索了“西餐”。某个区域一段时间内大量的用户位置数据和用户行为数据可以反映出这个区域内各种属性指标如人流量、消费情况、年龄或偏好等等以及这些属性指标随时间变化的趋势,因此对这些数据的按区域分析可以给运营商基建、连锁超市、餐饮或加油站等实体商业机构的选址或商业推广提供定量或定性的参考。然而,目前对某个区域内某时间段内的数据分析采用的数据栅格化的方法却不能满足以上需求。具体的,现行方法是待分析区域内基于运营商的位置数据和人群基本信息,比如人流量与待分析区域中划定的栅格进行匹配,即判断数据的位置在哪个栅格中,之后再以每个栅格为单位对栅格化的数据进行定性或定量的分析,得出某些规律或结论。通常,数据栅格化采用射线法,具体为在多边形外面任意一点画一条虚拟的射线到p(x,y)然后计算该射线与多边形上的边相交的次数。如果该次数是偶数,说明p(x,y)在多边形外 ...
【技术保护点】
一种数据栅格化的方法,所述方法应用于计算节点,其特征在于,所述方法包括:根据产生于目标时间段中目标区域内的用户行为数据,获得所述用户行为数据对应的用户关联数据,所述用户关联数据包括一个或多个用户的位置信息和所述一个或多个用户的行为信息;根据所述用户关联数据中的位置信息,计算所述用户关联数据对应的二维编号;以所述二维编号为查询条件,在二维索引号集中获得与所述二维编号匹配的二维索引号,其中所述二维编号落入所述匹配的二维索引号的取值范围,或者所述二维编号与所述匹配的二维索引号相同,其中所述匹配的二维索引号表示的二级矩形栅格为所述用户关联数据匹配的二级矩形栅格,所述二维索引号集包括多个二维索引号,每个所述二维索引号表示所述目标区域内或者与所述目标区域相交的一个二维矩形栅格;根据所述二级矩形栅格与所述一级栅格之间的对应关系,确定所述用户关联数据匹配的二级矩形栅格所对应的一级栅格的栅格标识,所述二级矩形栅格在所述目标区域的栅格密度大于所述目标区域的一级栅格的栅格密度;关联所述一级栅格的栅格标识与所述用户关联数据,以得到所述一级栅格的所述用户关联数据对应的栅格数据,所述栅格数据包括所述行为信息和所述 ...
【技术特征摘要】
1.一种数据栅格化的方法,所述方法应用于计算节点,其特征在于,所述方法包括:根据产生于目标时间段中目标区域内的用户行为数据,获得所述用户行为数据对应的用户关联数据,所述用户关联数据包括一个或多个用户的位置信息和所述一个或多个用户的行为信息;根据所述用户关联数据中的位置信息,计算所述用户关联数据对应的二维编号;以所述二维编号为查询条件,在二维索引号集中获得与所述二维编号匹配的二维索引号,其中所述二维编号落入所述匹配的二维索引号的取值范围,或者所述二维编号与所述匹配的二维索引号相同,其中所述匹配的二维索引号表示的二级矩形栅格为所述用户关联数据匹配的二级矩形栅格,所述二维索引号集包括多个二维索引号,每个所述二维索引号表示所述目标区域内或者与所述目标区域相交的一个二维矩形栅格;根据所述二级矩形栅格与一级栅格之间的对应关系,确定所述用户关联数据匹配的二级矩形栅格所对应的一级栅格的栅格标识,所述二级矩形栅格在所述目标区域的栅格密度大于所述目标区域的一级栅格的栅格密度;关联所述一级栅格的栅格标识与所述用户关联数据,以得到所述一级栅格的所述用户关联数据对应的栅格数据,所述栅格数据包括所述行为信息和所述栅格标识,所述栅格数据用于分析所述目标时间段中经过所述目标区域的用户的行为规律或偏好。2.根据权利要求1所述的方法,其特征在于,在根据所述用户关联数据中的位置信息,计算所述用户关联数据对应的二维编号的方面,所述方法具体包括:根据所述用户关联数据中的位置信息,计算所述位置信息表示的位置点相对于所述目标区域的标准点的位置参数,所述标准点为所述目标区域中或与所述目标区域相交的二维矩形栅格上经纬度的值已知的一个点;将所述位置参数转化为所述用户关联数据对应的二维编号。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:设置二级矩形栅格的网格尺寸;根据所述网格尺寸,将所述目标区域按所述二级矩形栅格划分;根据每个所述二级矩形栅格对应的区域的位置信息,计算每个所述二级矩形栅格对应的二维索引号。4.根据权利要求1所述的方法,其特征在于,在根据所述二级矩形栅格与所述一级栅格之间的对应关系,确定所述用户关联数据匹配的二级矩形栅格所对应的一级栅格的栅格标识的方面,所述方法具体包括:计算所述二级矩形栅格在所述目标区域内的每个顶点与所述一级栅格的网格的位置关系,以确定每个所述顶点所对应的一级栅格;根据每个所述顶点与所述一级栅格的对应关系,确定在所述目标区域内或与所述目标区域相交的每个所述二级矩形栅格对应的一级栅格;根据所述用户关联数据匹配的二级栅格的二维索引号,获得所述用户关联数据匹配的二级矩形栅格对应的一级栅格的栅格标识。5.根据权利要求1所述的方法,其特征在于,在根据产生于目标时间段中目标区域内的用户行为数据,获得所述用户行为数据对应的用户关联数据的方面,所述方法具体包括:在所述用户行为数据携带位置信息的情况下,将所述用户行为数据作为所述对应的用户关联数据;在所述用户行为数据不携带位置信息的情况下,根据所述用户行为数据的产生时间和用户信息,获得产生时间与所述用户行为数据的产生时间最接近的同一用户的用户位置数据,所述用户位置数据包括位置信息;将所述用户位置数据中的位置信息关联到所述用户行为数据,以得到所述用户行为数据对应的用户关联数据;在所述用户位置数据的产生时间与所述用户行为数据的产生时间之间的间隔大于关联时间阈值的情况下,计算所述用户关联数据的关联置信度以及根据所述关联置信度处理所述用户关联数据。6.一种用户行为分析方法,所述方法应用于计算节点,其特征在于,所述方法包括:根据产生于目标时间段中目标区域内的用户行为数据,获得所述用户行为数据对应的用户关联数据,所述用户关联数据包括一个或多个用户的位置信息和所述一个或多个用户的行为信息;根据所述用户关联数据中的位置信息,计算所述用户关联数据对应的二维编号;以所述二维编号为查询条件,在二维索引号集中获得与所述二维编号匹配的二维索引号,其中所述二维编号落入二维索引号的范围,或者所述二维编号与二维索引号相同,其中所述匹配的二维索引号表示的二级矩形栅格为所述用户关联数据匹配的二级矩形栅格,所述二维索引号集包括多个二维索引号,每个所述二维索引号表示所述目标区域内或者与所述目标区域相交的一个二维矩形栅格;根据所述二级矩形栅格与一级栅格之间的对应关系,确定所述用户关联数据匹配的二级矩形栅格所对应的一级栅格的栅格标识,所述二级矩形栅格在所述目标区域的栅格密度大于所述目标区域的一级栅格的栅格密度;关联所述一级栅格的栅格标识与所述用户关联数据,以得到所述一级栅格的所述用户关联数据对应的栅格数据,所述栅格数据包括所述行为信息和所述栅格标识;根据至少一个所述一级栅格的一条或多条所述栅格数据,提取所述一级栅格在所述目标时间段中的栅格特征数据,所述栅格特征数据表示所述目标时间段中经过所述目标区域的用户的行为规律或偏好。7.根据权利要求6所述的方法,其特征在于,在根据所述用户关联数据中的位置信息,计算所述用户关联数据对应的二维编号的方面,所述方法具体包括:根据所述用户关联数据中的位置信息,计算所述位置信息表示的位置点相对于所述目标区域的标准点的位置参数,所述标准点为所述目标区域中或与所述目标区域相交的二维矩形栅格上经纬度值已知的一个点;将所述位置参数转化为所述用户关联数据对应的二维编号。8.根据权利要求6或7所述的方法,其特征在于,所述方法还包括:设置二级矩形栅格的网格尺寸;根据所述网格尺寸,将所述目标区域按所述二级矩形栅格划分;根据每个所述二级矩形栅格对应的区域的位置信息,计算每个所述二级矩形栅格对应的二维索引号。9.一种数据栅格化的方法,所述方法应用于计算节点,其特征在于,所述方法包括:根据产生于目标时间段中目标区域内的用户行为数据,获得所述用户行为数据对应的用户关联数据,所述用户关联数据包括一个或多个用户的位置信息和所述一个或多个用户的行为信息;根据所述位置信息,与所述用户关联数据对应的用户历史栅格集中的栅格的位置信息进行匹配,以得到与所述用户关联数据对应的栅格的栅格标识;在获得所述栅格标识的情况下,根据所述用户关联数据与所述栅格标识,得到所述用户关联数据对应的栅格数据;在未获得所述栅格标识的情况下,将所述位置信息与所述目标区域的不在所述用户历史栅格集中的栅格的位置信息进行匹配,以得到所述用户关联数据对应的栅格的栅格标识,关联所述栅格标识与所述用户关联数据以得到所述用户关联数据对应的栅格数据,以及将所述栅格标识加入所述用户关联数据对应的用户历史栅格集;其中所述栅格数据包括所述行为信息和所述栅格标识,所述栅格数据用于分析所述目标时间段中经过所述目标区域的用户的行为规律或偏好。10.根据权利要求9所述的方法,其特征在于,所述方法还包括:根据所述用户关联数据中携带的用户信息,确定所述用户关联数据对应的用户历史栅格集。11.根据权利要求9或10任一项所述的方法,其特征在于,在根据产生于目标时间段中目标区域内的用户行为数据,获得所述用户行为数据对应的用户关联数据的方面,所述方法具体包括:在所述用户行为数据携带位置信息的情况下,将所述用户行为数据作为所述对应的用户关联数据;在所述用户行为数据不携带位置信息的情况下,根据所述用户行为数据的产生时间和用户信息,获得产生时间与所述用户行为数据的产生时间最接近的同一用户的用户位置数据,所述用户位置数据包括位置信息;将所述用户位置数据中的位置信息关联到所述用户行为数据,以得到所述用户行为数据对应的用户关联数据;在所述用户位置数据的产生时间与所述用户行为数据的产生时间之间的间隔大于关联时间阈值的情况下,计算所述用户关联数据的关联置信度以及根据所述关联置信度处理所述用户关联数据。12.一种用户行为的分析方法,所述方法应用于计算节点,其特征在于,所述方法包括:根据产生于目标时间段中目标区域内的用户行为数据,获得所述用户行为数据对应的用户关联数据,所述用户关联数据包括一个或多个用户的位置信息和所述一个或多个用户的行为信息;根据所述位置信息,与所述用户关联数据对应的用户历史栅格集中的栅格的位置信息进行匹配,以得到与所述用户关联数据对应的栅格的栅格标识;在获得所述栅格标识的情况下,根据所述用户关联数据与所述栅格标识,得到所述用户关联数据对应的栅格数据,其中所述栅格数据包括所述行为信息和所述栅格标识;在未获得所述栅格标识的情况下,将所述位置信息与所述目标区域的不在所述用户历史栅格集中的栅格的位置信息进行匹配,以得到所述用户关联数据对应的栅格的栅格标识,关联所述栅格标识与所述用户关联数据以得到所述用户关联数据对应的栅格的栅格数据,以及将所述栅格标识加入所述用户关联数据对应的用户历史栅格集,其中所述栅格数据包括所述行为信息和所述栅格标识;根据至少一个所述栅格的一条或多条所述栅格数据,提取一级栅格在所述目标时间段中的栅格特征数据,所述栅格特征数据表示所述目标时间段中经过所述目标区域的用户的行为规律或偏好。13.根据权利要求12所述的方法,其特征在于,所述方法还包括:根据所述用户关联数据中携带的用户信息,确定所述用户关联数据对应的用户历史栅格集。14.根据权利要求12或13任一项所述的方法,其特征在于,在根据产生于目标时间段中目标区域内的用户行为数据,获得所述用户行为数据对应的用户关联数据的方面,所述方法具体包括:在所述用户行为数据携带位置信息的情况下,将所述用户行为数据作为所述对应的用户关联数据;在所述用户行为数据不携带位置信息的情况下,根据所述用户行为数据的产生时间和用户信息,获得产生时间与所述用户行为数据的产生时间最接近的同一用户的用户位置数据,所述用户位置数据包括位置信息;将所述用户位置数据中的位置信息关联到所述用户行为数据,以得到所述用户行为数据对应的用户关联数据;在所述用户位置数据的产生时间与所述用户行为数据的产生时间之间的间隔大于关联时间阈值的情况下,计算所述用户关联数据的关联置信度以及根据所述关联置信度处理所述用户关联数据。15.一种数据栅格化的装置,其特征在于,所述装置包括:位置信息获取单元,用于根据产生于目标时间段中目标区域内的用户行为数据,获得所述用户行为数据对应的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。