基于模式挖掘的城市过度旅游区域识别方法技术

技术编号:34127666 阅读:18 留言:0更新日期:2022-07-14 14:37
一种基于模式挖掘的城市过度旅游区域识别方法,首先将城市区域进行网格划分,结合城市旅游POI数据,筛选出城市旅游区域网格。然后对出租车轨迹数据进行处理,计算出城市旅游网格平均拥堵指数和城市旅游网格出租车到达数量,并将此二者定义为城市旅游网格过度旅游模式。利用马氏距离筛选出异常网格过度旅游模式,然后筛选出因过度旅游而造成的异常网格过度旅游模式。最后使用K

Pattern mining based method for urban over tourism region recognition

【技术实现步骤摘要】
基于模式挖掘的城市过度旅游区域识别方法


[0001]本专利技术涉及智慧城市中的智慧旅游领域,尤其涉及一种基于模式挖掘的城市过度旅游区域识别方法。

技术介绍

[0002]旅游业依托于旅游地的自然环境或人文景观,通过吸引众多游客,为旅游目的地创造了投资、就业机会和经济效益,显而易见地带来了新的经济增长点。但在繁荣之外,旅游衍生出的负面效应更值得人们思考,如“过度旅游(Over

tourism)”现象。
[0003]“过度旅游”是指特定旅游地的游客数量过度增长,一方面对景点当地生态环境、社会秩序等方面产生了负面效应,另一方面,旅游地过高的人口密度造成拥堵,破坏了游客的旅游体验,甚至引起游客行程取消、旅游地口碑受损等抑制旅游需求的问题。同时需要强调的是,过度旅游现象不仅仅专指旅游景区内,过度旅游所造成的危害影响是包括旅游景区及城市旅游景区周边的区域。如此爆发式增长的游客人数使得政府的管理难度升级,居民日用品店被改造成迎合游客的纪念品店,物价被旅游市场哄抬,导致生活成本提高,环境恶化、复杂人群造成交通拥堵和社会不安全现象,严重影响了当地居民的正常生活。
[0004]近年来已经有越来越多的学者关注到过度旅游问题。一些研究人员提出通过寻找“通用POI”来缓解过度旅游问题,所谓“通用POI”就是从全世界找与著名景点类似的地方,然后希望通过那些“通用POI”来分流游客。然而事实上,游客显然会选择真正有名的景点,而不是那些仅仅看起来像的景点。一些研究人员使用基于代理的方法来建模游客对于拥堵信息的反应,还有一些研究人员利用博弈论中的“哈定悲剧”模型和“囚徒困境”模型等来研究过度旅游问题。
[0005]目前,现有的对于过度旅游问题的研究存在以下主要问题:1)现有的研究主要致力于对过度旅游问题定性的分析,缺少对于过度旅游问题定量的分析。2)缺少对于城市过度旅游区域的识别方法。3)缺少对于过度旅游的等级划分。
[0006]本方法采用了城市出租车轨迹数据和城市旅游POI数据,旨在利用多源城市数据来识别城市过度旅游区域,并划分城市过度旅游区域的过度旅游等级。在城市中,过度旅游最直观的体现就是会造成交通拥堵和人群聚集,因此,本专利技术提出包含网格拥堵指数和网格出租车到达数量的网格过度旅游模式(Grid Over

tourism Mode)来识别城市过度旅游区域和划分城市过度旅游等级,为旅游景区和城市管理部门提供行动依据,从而降低过度旅游问题造成的影响。

技术实现思路

[0007]为解决现有技术的不足,本专利技术提供一种基于模式挖掘的城市过度旅游区域识别方法,使得能够识别出城市潜在过度旅游区域,并划分城市过度旅游等级。
[0008]本专利技术公开了一种基于模式挖掘的城市过度旅游区域识别方法,首先将城市区域进行网格划分,结合城市旅游POI数据,筛选出城市旅游区域网格。然后对出租车轨迹数据
进行处理,计算出城市旅游网格平均拥堵指数和城市旅游网格出租车到达数量,并将此二者定义为城市旅游网格过度旅游模式。利用马氏距离筛选出异常网格过度旅游模式,然后筛选出因过度旅游而造成的异常网格过度旅游模式。最后使用K

means算法对网格过度旅游模式的异常程度值进行聚类,得到过度旅游等级。本专利技术利用多源城市数据来识别城市过度旅游区域和划分城市过度旅游等级,能够区别过度旅游与网格内一般的交通拥堵和一般的出租车到达数量增加,实现更准确的过度旅游识别。
[0009]本专利技术是通过以下技术方案达到上述目的:一种基于模式挖掘的城市过度旅游区域识别方法,具体的实施步骤如下:
[0010]S1:对原始数据进行预处理,并进行时间,区域划分;
[0011]S2:根据步骤S1所述数据,筛选城市旅游区域网格;
[0012]S3:根据步骤S1和S2所述数据,计算在每个时间片下,城市旅游区域的网格过度旅游模式;
[0013]S4:根据步骤S3所述数据,筛选因过度旅游造成的异常城市网格过度旅游模式;
[0014]S5:根据步骤S4所述数据,对异常城市网格过度旅游模式的异常程度值进行过度旅游等级划分。
[0015]其中步骤S1具体包括如下步骤:
[0016]S1.1:对出租车数据进行清洗,包括清除缺失值、异常值、噪声数据等,以及出租车基础数据的规范化处理;
[0017]S1.2:对出租车数据进行时间片划分,划分为t
n
个时间片;
[0018]S1.3:根据城市研究区域的经度和纬度的最大值和最小值,将城市研究区域划分为R个网格单元;
[0019]S1.4:在高德地图开放平台申请web服务的密钥,基于高德地图提供的数据接口,爬取城市旅游景点POI数据,每条数据包括旅游景点的名称、旅游景点的经度和纬度。
[0020]其中步骤S2具体包括如下步骤:
[0021]S2.1:根据步骤S1所述城市旅游POI数据的经度和纬度,计算出每个城市旅游POI所在的城市网格编号;
[0022]S2.2:根据每个城市旅游POI所对应的城市网格编号,筛选出含有旅游POI的网格作为城市旅游区域网格。
[0023]其中步骤S3具体包括如下步骤:
[0024]S3.1:根据步骤S1和S2所述数据,计算城市旅游网格内道路平均速度,给定某辆车一组连续的时间戳(t1,t2,...,t
n
),对应的定位点计算公式如下所示(其中,表示定位点和定位点之间的欧式距离,v
i
表示第i辆车的平均速度,V
j
表示第j条道路上所有车辆的平均速度):
[0025][0026][0027]S3.2:根据S3.1中道路实际平均速度和该条道路的限速,计算当前时间片道路的拥堵指数,计算公式如下所示(其中V
j,t
表示第t个时间片下第j条道路的平均速度,V
j,std
表示第j条道路的限速,c
j,t
表示t时刻下第j条道路的拥堵指数):
[0028][0029]S3.3:根据步骤S3.2中道路拥堵指数,计算城市旅游网格中所有道路的平均拥堵指数作为该城市旅游网格在该时间片下的拥堵指数,计算公式如下(其中c
i,t
表示第i条道路在第t个时间片中的拥堵指数,C
r,t
表示网格r在第t个时间片下的拥堵指数):
[0030][0031]S3.4:根据步骤S1和S2所述数据,计算每个城市旅游网格在每个时间片的出租车到达数量,记为N
r,t
,表示第r个网格中在第t个时间片中出租车到达数量。
[0032]S3.5:根据步骤S3.3和S3.4所述数据,定义城市网格过度旅游模式(Grid Over

tourism Mode)为二维向量GOM
t
<N,C>,其中,N是指特定时间步长范围内,在此网格的出租车到达数量,C是指网格本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于模式挖掘的城市过度旅游区域识别方法,其特征在于,包括以下步骤:S1:对原始数据进行预处理,并进行时间,区域划分;S2:根据步骤S1所述数据,筛选城市旅游区域网格;S3:根据步骤S1和S2所述数据,计算在每个时间片下,城市旅游区域的网格过度旅游模式;S4:根据步骤S3所述数据,筛选因过度旅游造成的异常城市网格过度旅游模式;S5:根据步骤S4所述数据,对异常城市网格过度旅游模式的异常程度值进行过度旅游等级划分。2.如权利要求1所述的一种基于模式挖掘的城市过度旅游区域识别方法,其特征在于:所述步骤S1具体包括如下步骤:S1.1:对出租车数据进行清洗,包括清除缺失值、异常值、噪声数据,以及规范化处理出租车基础数据;S1.2:对出租车数据进行时间片划分,划分为t
n
个时间片;S1.3:根据城市研究区域的经度和纬度的最大值和最小值,将城市研究区域划分为R个网格单元;S1.4:在高德地图开放平台申请web服务的密钥,基于高德地图提供的数据接口,爬取城市旅游景点POI数据,每条数据包括旅游景点的名称、旅游景点的经度和纬度。3.如权利要求1所述的一种基于模式挖掘的城市过度旅游区域识别方法,其特征在于:所述步骤S2具体包括如下步骤:S2.1:根据步骤S1所述城市旅游POI数据的经度和纬度,计算出每个城市旅游POI所在的城市网格编号;S2.2:根据每个城市旅游POI所对应的城市网格编号,筛选出含有旅游POI的网格作为城市旅游区域网格。4.如权利要求1所述的一种基于模式挖掘的城市过度旅游区域识别方法,其特征在于:所述步骤S3具体包括如下步骤:S3.1:根据步骤S1和S2所述数据,计算城市旅游网格内道路平均速度,给定某辆车一组连续的时间戳(t1,t2,...,t
n
),对应的定位点计算公式如下所示(其中,表示定位点和定位点之间的欧式距离,v
i
表示第i辆车的平均速度,V
j
表示第j条道路上所有车辆的平均速度):示第j条道路上所有车辆的平均速度):S3.2:根据S3.1中道路实际平均速度和该条道路的限速,计算当前时间片道路的拥堵指数,计算公式如下所示,其中V
j,t
表示第t个时间片下第j条道路的平均速度,V
j,std
表示第j条道路的限速,c
j,t
表示t时刻下第j条道路的拥堵指数:
S3.3:根据步骤S3.2中道路拥堵指数,计算城市旅游网格中所有道路的平均拥堵指数作为该城市旅游网格在该时间片下的拥堵指数,计算公式如下,其中c
i,t
表示第i条道路在第t个时间片中的拥堵指数,C
r,t
表示网格r在第t个时间片下的拥堵指数:S3.4:根据步骤S1和S2所述数据,计算每个城市旅游网格在每个时间片的出租车到达数量,记为N
r,t
,表示第r个网格中在第t个时间片中出租车到达数量;S3.5:根据步骤S3.3和S3.4所述数据,...

【专利技术属性】
技术研发人员:孔祥杰黄志强沈国江刘志
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1