一种基于语义轨迹的区域内兴趣点需求挖掘和选址方法及排名和分析系统技术方案

技术编号:23512763 阅读:23 留言:0更新日期:2020-03-18 00:05
本发明专利技术公开了一种基于语义轨迹的区域内兴趣点需求挖掘和选址方法,该方法主要包括以下步骤:步骤一:划分空间区域;对语义轨迹以及兴趣点进行预处理以添加区域信息,并对区域内的兴趣点数量、密度进行测算;步骤二:利用附带区域信息的语义轨迹挖掘人们的连续跨区域移动模式;步骤三:利用挖掘到的连续跨区域移动模式量化区域兴趣点需求,得出区域内人们对各种类型兴趣点的需求强度,并最终根据区域以及兴趣点类型分别给出两种层次的需求排名以推荐商户选址。本发明专利技术还提出了一种基于语义轨迹的区域内兴趣点的需求挖掘、排名和分析系统。

A method of mining and locating interest points in a region and its ranking and analysis system based on semantic trajectory

【技术实现步骤摘要】
一种基于语义轨迹的区域内兴趣点需求挖掘和选址方法及排名和分析系统
本专利技术涉及数据挖掘中轨迹模式挖掘
,更为具体地讲,涉及一种基于语义轨迹的区域内兴趣点需求挖掘和选址方法及排名和分析系统。
技术介绍
随着定位技术的发展和随身携带设备中定位装置的普及,以及位置分享平台的兴起,人们产生了越来越多的语义轨迹。语义轨迹,即指不仅包含传统交通轨迹数据中带有的经纬度和时间戳信息,还附带文本信息的一类轨迹数据。位置分享平台中最常见的一类轨迹数据附带的文本信息是签到点的兴趣点信息。这类轨迹包含了丰富的人们生活方式以及生活需求的相关信息。目前研究者们主要关注用语义轨迹分析事件预测或者为人们推荐下一个兴趣点。而目前人们很少考虑用语义数据去解决选址问题。而随着城市化进程,建筑选址也变得越来越重要,甚至能影响企业的存亡。所以,选址问题的研究有着重大的经济、社会和军事意义。传统方法有离线手动调查、基于人口普查数据的分析模型等,这些模型无法适应动态市场或非常耗时。近年来,基于位置的服务已被广泛用于解决选址问题。目前存在的几类基于轨迹数据的选择工作有以下不足之处:首先一些工作利用数据中部分属性针对特定兴趣点类型进行选址分析和推荐;二来一些工作基于传统交通轨迹数据,没将本身就语义丰富的语义考虑进去,会影响对需求强度的分析;三、一些模式发现只注重挖掘频繁移动模式而忽略了人们对于需求的移动往往出发点会分散在不同类别而终点会落于不同区域的这一现实。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提出了一种基于语义轨迹的区域内兴趣点需求挖掘和选址方法。对语义轨迹及现有兴趣点数据添加区域信息生成区域移动模式,并考虑人们现实移动情况,即从同区域内不同类别兴趣点出于对特定兴趣点类型的需要移动到不同区域相同类型兴趣点的事实,来挖掘连续跨区域移动模式。进而量化需求强度,并按照区域以及兴趣点类型对区域需求进行排名,并根据排名进行选址推荐。具体步骤包括如下:步骤(1)划分空间区域,对普通的语义轨迹以及兴趣点进行预处理以添加区域信息,并对区域内的兴趣点数量、密度进行测算;步骤(2)利用附带区域信息的语义轨迹挖掘人们的连续跨区域移动模式;步骤(3)利用挖掘到的连续跨区域移动模式量化区域兴趣点需求,得出区域内人们对各种类型兴趣点的需求强度,并最终根据区域以及兴趣点类型分别给出两种层次的需求排名以供推荐商户选址。本专利技术中,利用语义轨迹数据以及现有兴趣点数据对区域内潜在兴趣点需求进行挖掘和选址推荐;所述语义轨迹数据包括:经纬度、时间戳以及签到兴趣点所属类型;所述现有兴趣点数据包括:id,经纬度以及兴趣点所属类型。本专利技术中,所述步骤(1)的具体步骤包括:步骤(11)轨迹切分,根据设置的两条签到信息间可忍受的最大转移时间,如果两次签到相距时间超过设置好的可忍受最大转移时间,从两次签到当中将将轨迹切成两段,两次签到分别是前段轨迹的终点以及后段轨迹的起点。如果整条语义轨迹数据的签到时间差都符合可忍受的最大转移时间则不切分轨迹,若不满足语义轨迹数据就被切分成两到多条符合转移时间要求的子轨迹;步骤(12)区域划分,将全局空间均匀划分成预先设置好数量的相同大小且不互相重叠的矩形网格状子区域;并将普通的语义轨迹数据添加区域信息,得到区域移动模式;步骤(13)区域表达,统计落入各区域的兴趣点总的数量以及各个类别下兴趣点数量,分别从区域内各类别数量占全区内兴趣点数量的占比以及区域内该类别兴趣点数量在全局下该类别兴趣点数量的占比两个角度计算兴趣点密度,提出公式计算该区域内该类别在全局全类别下的密度。本专利技术所述步骤(11)中,将输入的语义轨迹按照最大可忍受转移时间切分;转移时间是指相邻两次签到相隔多少时间;所述最大可忍受转移时间是指相邻两次签到最多可以相隔多少时间;如果两次签到相隔时间超过最大可忍受转移时间,则将新建一条语义轨迹,给予新的编号,并将从后一次签到开始后满足最大可忍受转移时间的所有签到都加入新的语义轨迹中。本专利技术所述步骤(12)中,根据预先设定好的网格参数g,将空间尽量划分成一样大小的g×g个不重叠矩形;通过全局矩形区域左上角顶点和右下角顶点经纬度的差的计算出矩形的长度和宽度,再将长度和宽度除以网格参数g计算出每个子区域矩形的长度和宽度;将子区域从左到右,从上到下都赋予一个不重复的编号。本专利技术所述步骤(13)中,对于语义轨迹集合中所有轨迹,将轨迹中的每一个签到都通过搜寻兴趣点数据集对应记录来转换成包含时间戳、签到区域以及签到兴趣点类型的一条记录;通过计算兴趣点的经纬度与子区域长宽的倍数计算出落到区域的编号;转换后的区域移动模式编号和语义轨迹编号保持一致。本专利技术所述步骤(13)中,将所有的现有兴趣点信息按照经纬度获取该区域编号;接着取出该兴趣点所属的具体类型,更新兴趣点所属区域的区域空间信息,首先将该区域该兴趣点类型对应的数量加一,接着将整个区域的兴趣点总数加一;最终统计出所有区域内的兴趣点数量,并按兴趣点类型归类分别计数。本专利技术中,将两个相邻签到落于不同区域的情况称为跨区域,利用步骤(12)转化后的区域移动模式挖掘当中连续跨区域移动模式:首先过滤掉长度小于2的移动模式;跨区域移动模式M的编号不与区域移动模式O的编号混排,采用新的编号;遍历区域移动模式中的所有停留签到点,判断和上一个签到点是否在同一个区域,找到第一个出现的跨区域行为;接着依次往下挖掘,尽可能延长跨区域移动模式,直到两个相邻签到落在同一区域为止;将这一段跨区域移动模式加入跨区域移动模式集合M;然后从这段签到往后重新找下一个跨区域移动行为,循环往复,直到遍历完所有区域移动模式。本专利技术中,进一步包括:通过轨迹反向方法挖掘非住宅类型需求。本专利技术中,根据两次签到间距离和签到兴趣点类型的频度量化区域内对类型兴趣点的需求强度。本专利技术中,按照区域需求强度以及区域内类别密度筛选出最终区域需求。基于以上方法,本专利技术还提出了一种基于语义轨迹的区域内兴趣点的需求挖掘、排名和分析系统,所述系统包括:数据预处理模块,其包括切割区域、转换语义轨迹以及统计区域内兴趣点数量和密度;挖掘模块,其包括挖掘连续跨区域移动模式;需求发现模块,其包括利用挖掘到的跨区域移动模式对人们出现需求强度进行量化,并考虑区域内密度筛选区域需求;选址推荐模块,其包括从区域以及兴趣点类型对区域需求进行排名,并根据排名进行选址推荐。本专利技术与现有技术相比的有益效果包括:基于语义轨迹能准确识别出人们的出行目的地,能够更精准地分析人们对各类别兴趣点的需求;针对各种类型兴趣点提出一个普适的选址方法;考虑到人们现实移动情况,即从同区域内不同类别兴趣点出于对特定兴趣点类型的需要移动到不同区域相同类型兴趣点的事实。附图说明图1为本专利技术基于语义轨迹的区域内兴趣点需求挖掘和选址方法的流程图。图2为本专利技术数据预处理流程图。图3为本专利技术模式挖掘流程图。图4为本专利技术需求发本文档来自技高网...

【技术保护点】
1.一种基于语义轨迹的区域内兴趣点需求挖掘和选址方法,其特征在于,包括以下步骤:/n步骤(1)划分空间区域,对普通的语义轨迹以及兴趣点进行预处理以添加区域信息,并对区域内的兴趣点数量、密度进行测算;/n步骤(2)利用附带区域信息的语义轨迹挖掘人们的连续跨区域移动模式;/n步骤(3)利用挖掘到的连续跨区域移动模式量化区域兴趣点需求,得出区域内人们对各种类型兴趣点的需求强度,并最终根据区域以及兴趣点类型分别给出两种层次的需求排名以供推荐商户选址。/n

【技术特征摘要】
1.一种基于语义轨迹的区域内兴趣点需求挖掘和选址方法,其特征在于,包括以下步骤:
步骤(1)划分空间区域,对普通的语义轨迹以及兴趣点进行预处理以添加区域信息,并对区域内的兴趣点数量、密度进行测算;
步骤(2)利用附带区域信息的语义轨迹挖掘人们的连续跨区域移动模式;
步骤(3)利用挖掘到的连续跨区域移动模式量化区域兴趣点需求,得出区域内人们对各种类型兴趣点的需求强度,并最终根据区域以及兴趣点类型分别给出两种层次的需求排名以供推荐商户选址。


2.根据权利要求1所述的基于语义轨迹的区域内兴趣点需求挖掘和选址方法,其特征在于,利用语义轨迹数据以及现有兴趣点数据对区域内潜在兴趣点需求进行挖掘和选址推荐;所述语义轨迹数据包括:经纬度、时间戳以及签到兴趣点所属类型;所述现有兴趣点数据包括:id,经纬度以及兴趣点所属类型。


3.根据权利要求1所述的基于语义轨迹的区域内兴趣点需求挖掘和选址方法,其特征在于,所述步骤(1)的具体步骤包括:
步骤(11),根据设置的两条签到信息间可忍受的最大转移时间,若两次签到相距时间超过设置好的可忍受最大转移时间,则从两次签到当中将将轨迹切成两段,两次签到分别是前段轨迹的终点以及后段轨迹的起点;若整条语义轨迹数据的签到时间差均符合可忍受的最大转移时间,则不切分轨迹,若不满足语义轨迹数据就被切分成两到多条符合转移时间要求的子轨迹;
步骤(12),将全局空间均匀划分成预先设置好数量的相同大小且不互相重叠的矩形网格状子区域;并将普通的语义轨迹数据添加区域信息,得到区域移动模式;
步骤(13),统计落入各区域的兴趣点总的数量以及各个类别下兴趣点数量,分别从区域内各类别数量占全区内兴趣点数量的占比以及区域内该类别兴趣点数量在全局下该类别兴趣点数量的占比两个角度计算兴趣点密度,计算该区域内该类别在全局全类别下的密度。


4.根据权利要求3所述的基于语义轨迹的区域内兴趣点需求挖掘和选址方法,其特征在于,所述步骤(11)中,将输入的语义轨迹按照最大可忍受转移时间切分;转移时间是指相邻两次签到相隔多少时间;所述最大可忍受转移时间是指相邻两次签到最多可以相隔多少时间;如果两次签到相隔时间超过最大可忍受转移时间,则将新建一条语义轨迹,给予新的编号,并将从后一次签到开始后满足最大可忍受转移时间的所有签到都加入新的语义轨迹中。


5.根据权利要求3所述的基于语义轨迹的区域内兴趣点需求挖掘和选址方法,其特征在于,所述步骤(12)中,根据预先设定好的网格参数g,将空间尽量划分成一样大小的g×g个不重叠矩形;通过全局矩形区域左上角顶点和右下角顶点经纬度的差的计算出矩形的长度和宽度,再将长度和宽度除以网格参数g计算出...

【专利技术属性】
技术研发人员:金莹杨世宇马国杰林学民
申请(专利权)人:华东师范大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1