一种基于特征选择和LSTM的景区日客流量预测方法技术

技术编号:26479655 阅读:37 留言:0更新日期:2020-11-25 19:24
本发明专利技术提出一种基于特征选择和LSTM的景区日客流量预测方法,建立了基于网络搜索指数特征选择的景区日客流量预测模型mRMR‑LSTM。由于如百度搜索等网络搜索指数所代表的数据可能具有一定的共线性,在预测模型中使用大量搜索指数数据项会导致模型过拟合的问题,而使用单一数据项又不足以完全体现搜索指数的各项特征趋势,因此,本发明专利技术将mRMR算法用于对网络搜索指数进行特征选择,根据每一维指数特征计算mRMR指标,用于清除噪声及高相关无用特征,并构建应用于长期时间序列数据回归预测的LSTM模型对景区日客流进行预测。本发明专利技术不但提高了模型训练速度,而且提升LSTM的预测性能。

【技术实现步骤摘要】
一种基于特征选择和LSTM的景区日客流量预测方法
本专利技术涉及数据预测的人工智能
,具体为一种基于特征选择和LSTM算法的景区日客流量预测方法。
技术介绍
客流量的时段性差异是景区所面临的主要挑战。受自然气候和地理环境等因素的影响,旅游景区一般都存在旺季和淡季,进而导致客流量在不同的时期分布严重不平衡,给景区日常管理服务带来了巨大压力。在以节假日为基础的旅游旺季,景区客流量短时间内急剧增多,容易造成景区内人员物资供不应求、各景点交通拥挤、旅游资源过度利用,进而导致游客对旅游景区管理服务的不满。而在以平常日为基础的旅游淡季,尤其是周一至周五工作期间,景区游客人数相对较少,容易造成人员的空闲和物资的浪费,因此,提出能够对景区未来日客流量的预测方法显得尤为重要,景区管理者可根据未来游客量和景区实际接待能力提前采取有效的防范措施。当前景区的客流量预测主要面临两个问题。第一,研究者们主要以中长期预测(包括年度、月度、季度客流量预测)为主,而旅游短期客流量预测(包括周、日客流量预测)的研究甚少。景区依据长期客流量的预测仅能从中提取宏观层面的本文档来自技高网...

【技术保护点】
1.一种基于特征选择和LSTM算法的景区日客流量预测方法,其特征在于:包括以下步骤:/n步骤1:确定游客出行前的主要搜索因素,并结合所述主要搜索因素,针对具体景区归纳出相应的关键词;/n计算所有关键词与景区旅游游客量之间的斯皮尔曼相关系数,所述景区旅游游客量指延迟天数为0-K天的景区旅游游客量;/n筛选相关系数不小于0.4的关键词作为初步确定的网络搜索指数关键词;/n步骤2:计算初步确定的网络搜索指数关键词之间的互信息以及网络搜索指数关键词与日客流量之间的互信息;并利用网络搜索指数关键词之间的互信息以及网络搜索指数关键词与日客流量之间的互信息采用mRMR算法对初步确定的网络搜索指数关键词进行排...

【技术特征摘要】
1.一种基于特征选择和LSTM算法的景区日客流量预测方法,其特征在于:包括以下步骤:
步骤1:确定游客出行前的主要搜索因素,并结合所述主要搜索因素,针对具体景区归纳出相应的关键词;
计算所有关键词与景区旅游游客量之间的斯皮尔曼相关系数,所述景区旅游游客量指延迟天数为0-K天的景区旅游游客量;
筛选相关系数不小于0.4的关键词作为初步确定的网络搜索指数关键词;
步骤2:计算初步确定的网络搜索指数关键词之间的互信息以及网络搜索指数关键词与日客流量之间的互信息;并利用网络搜索指数关键词之间的互信息以及网络搜索指数关键词与日客流量之间的互信息采用mRMR算法对初步确定的网络搜索指数关键词进行排序,得到由排序后的网络搜索指数关键词组成的特征集S;
步骤3:获取样本数据的特征集S,并进行数据清洗和归一化处理,而且将数据划分为训练集和测试集;
步骤4:采用前向搜索策略将特征集S中排好序的网络搜索指数关键词逐一添加至已选训练样本集合中,并将训练集数据送入LSTM长短期记忆神经网络中,对LSTM网络模型进行迭代优化,得到不同特征组合的LSTM模型,取其中预测性能最佳的LSTM网络模型进行景区日客流量预测。


2.根据权利要求1所述一种基于特征选择和LSTM算法的景区日客流量预测方法,其特征在于:步骤1中,选择将风景、住宿、餐饮、游览、购物和交通六个方面定义为...

【专利技术属性】
技术研发人员:殷茗芦菲娅方亚群刘汉龙刘家龙姜继娇
申请(专利权)人:西北工业大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1