【技术实现步骤摘要】
一种基于特征选择和LSTM的景区日客流量预测方法
本专利技术涉及数据预测的人工智能
,具体为一种基于特征选择和LSTM算法的景区日客流量预测方法。
技术介绍
客流量的时段性差异是景区所面临的主要挑战。受自然气候和地理环境等因素的影响,旅游景区一般都存在旺季和淡季,进而导致客流量在不同的时期分布严重不平衡,给景区日常管理服务带来了巨大压力。在以节假日为基础的旅游旺季,景区客流量短时间内急剧增多,容易造成景区内人员物资供不应求、各景点交通拥挤、旅游资源过度利用,进而导致游客对旅游景区管理服务的不满。而在以平常日为基础的旅游淡季,尤其是周一至周五工作期间,景区游客人数相对较少,容易造成人员的空闲和物资的浪费,因此,提出能够对景区未来日客流量的预测方法显得尤为重要,景区管理者可根据未来游客量和景区实际接待能力提前采取有效的防范措施。当前景区的客流量预测主要面临两个问题。第一,研究者们主要以中长期预测(包括年度、月度、季度客流量预测)为主,而旅游短期客流量预测(包括周、日客流量预测)的研究甚少。景区依据长期客流量的预测仅 ...
【技术保护点】
1.一种基于特征选择和LSTM算法的景区日客流量预测方法,其特征在于:包括以下步骤:/n步骤1:确定游客出行前的主要搜索因素,并结合所述主要搜索因素,针对具体景区归纳出相应的关键词;/n计算所有关键词与景区旅游游客量之间的斯皮尔曼相关系数,所述景区旅游游客量指延迟天数为0-K天的景区旅游游客量;/n筛选相关系数不小于0.4的关键词作为初步确定的网络搜索指数关键词;/n步骤2:计算初步确定的网络搜索指数关键词之间的互信息以及网络搜索指数关键词与日客流量之间的互信息;并利用网络搜索指数关键词之间的互信息以及网络搜索指数关键词与日客流量之间的互信息采用mRMR算法对初步确定的网络 ...
【技术特征摘要】
1.一种基于特征选择和LSTM算法的景区日客流量预测方法,其特征在于:包括以下步骤:
步骤1:确定游客出行前的主要搜索因素,并结合所述主要搜索因素,针对具体景区归纳出相应的关键词;
计算所有关键词与景区旅游游客量之间的斯皮尔曼相关系数,所述景区旅游游客量指延迟天数为0-K天的景区旅游游客量;
筛选相关系数不小于0.4的关键词作为初步确定的网络搜索指数关键词;
步骤2:计算初步确定的网络搜索指数关键词之间的互信息以及网络搜索指数关键词与日客流量之间的互信息;并利用网络搜索指数关键词之间的互信息以及网络搜索指数关键词与日客流量之间的互信息采用mRMR算法对初步确定的网络搜索指数关键词进行排序,得到由排序后的网络搜索指数关键词组成的特征集S;
步骤3:获取样本数据的特征集S,并进行数据清洗和归一化处理,而且将数据划分为训练集和测试集;
步骤4:采用前向搜索策略将特征集S中排好序的网络搜索指数关键词逐一添加至已选训练样本集合中,并将训练集数据送入LSTM长短期记忆神经网络中,对LSTM网络模型进行迭代优化,得到不同特征组合的LSTM模型,取其中预测性能最佳的LSTM网络模型进行景区日客流量预测。
2.根据权利要求1所述一种基于特征选择和LSTM算法的景区日客流量预测方法,其特征在于:步骤1中,选择将风景、住宿、餐饮、游览、购物和交通六个方面定义为...
【专利技术属性】
技术研发人员:殷茗,芦菲娅,方亚群,刘汉龙,刘家龙,姜继娇,
申请(专利权)人:西北工业大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。