一种基于游客行为的旅游城市网络关联度评估方法技术

技术编号:30017758 阅读:19 留言:0更新日期:2021-09-11 06:29
本发明专利技术公开了一种基于游客行为的旅游城市网络关联度评估方法,该方法主要是通过收集游客数据,并经过异常值处理,去报旅游数据收集的完备性,同时基于全国旅游电子合同数据,建立省际间的旅游联系度,利用网络关联分析方法,形成多个年份的31

【技术实现步骤摘要】
一种基于游客行为的旅游城市网络关联度评估方法


[0001]本专利技术属于旅游信息服务
,具体涉及一种基于游客行为的旅游城市网络关联度评估方法。

技术介绍

[0002]随着生活水平的提高,旅游逐渐成为人们娱乐消遣的一种方式,近年来我国旅游人数不断攀升,甚至越来越多的人开始选择境外游,在一定程度上带动了我国的经济发展和消费。而且新一代的年轻消费群体正在逐渐崛起,他们在旅游方面具备极大的消费潜力,因此需要对旅游的喜好或区域进行预判;
[0003]专利201910162410.9公开了基于梯度提升决策树的用户旅游出行意向及类型预测方法,该专利包括以下步骤:步骤1、采集移动运营商提供的用户基本信息、业务使用、亲情网亲密度和出行行为数据表,并进行脱敏;步骤2、对数据表进行数据预处理;步骤3、根据样本数据中出行类别的数量,构造向量表示对应的类别;步骤4、对样本数据中每个可能的类别都训练一个分类回归树;步骤5、计算得到每个特征在各个特征值上的损失函数值,取损失函数值最小的情况构造预测函数;步骤6、生成待预测的用户在各个特征上的详细数据,使用预测函数进行预测。该专利技术使用梯度提升决策树算法预测用户的旅游出行意向以及目的地的类型,具有较高的准确性。该专利技术在预测游客出行意向时并没有将各省之间的联系进行进一步的预测,导致旅行社无法做出一个长远的规划。
[0004]由于中国面积比较大,有31个省及自治区,每个省及自治区都有自己的旅游景点,因此各个省及自治区之间的游客会相互流动,对于旅行社来说,游客之间的流动,对旅行社的客运交通以及酒店住宿都有相对重要的影响,因此如何去评判下一年度的与酒店和交通的安排需要一种关联度来评估;而现在还没有相关的技术能够处理,因此造成了旅行社的规划管理混乱。

技术实现思路

[0005]针对上述
技术介绍
所提出的问题,本专利技术的目的是:旨在提供一种基于游客行为的旅游城市网络关联度评估方法。
[0006]一种基于游客行为的旅游城市网络关联度评估方法,其特征在于:包括,
[0007]S1:收集游客电子合同数据;
[0008]S2:处理游客非结构化文本旅游数据;
[0009]S3:异常值处理及游客完备性旅游数据归集;
[0010]S4:构建省际间旅游联系度模型;
[0011]S5:计算省际间网络关联指数;
[0012]S6:获取省际间旅游网络关联指数表。
[0013]作为本专利技术的一种优选方案,所述步骤S1中,游客电子合同数据来源于全国旅游电子合同数据库。
[0014]作为本专利技术的一种优选方案,所述步骤S2中,从游客非结构化文本旅游数据进行基于自然语言处理NLP算法的语义文本识别,提取出游客行程出发地、目的地、游玩时间信息。
[0015]作为本专利技术的一种优选方案,所述步骤S3中,将S2中提取出的游客行程出发地、目的地、游玩时间信息与S1中电子合同备案数据库数据进行比较,剔除掉异常值旅游数据,确保游客旅游数据的完备性。
[0016]作为本专利技术的一种优选方案,所述步骤S4中,省际间的旅游联系度模型如下:
[0017][0018]公式(1)中,NCI
j

i
表示出发地j到目的地i的单向旅游联系度;
[0019]T
j

i
表示出发地j到目的地i的游客数量;
[0020]表示出发地m到目的地n的所有游客数量之和;
[0021]表示出发地n到目的地m的所有游客数量之和;
[0022]K代表观察对象个数;且
[0023]i≠j,i、j∈[1,m],i、j∈[1,n]。
[0024]作为本专利技术的一种优选方案,所述步骤S5中,由于省际间旅游客流存在双向空间流动关系,在最后的省际间网络关联指数计算中,将“省份j

省份i”和“省份i

省份j”的各自单向旅游联系度相加得到两个省份双向网络关联指数,即为
[0025]NCI
ij
=NCI
j

i
+NCI
i

j
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0026]作为本专利技术的一种优选方案,所述省际间网络关联指数的大小反映的是旅游省份间的密切程度,省际间网络关联指数越大,两座旅游省份间的旅游密切度越高,旅游要素互动越频繁;相反,省际间网络关联指数越小,则两座旅游省份间的旅游密切度越低,旅游要素互动越不活跃。
[0027]作为本专利技术的一种优选方案,所述步骤S6中,通过计算本省市与其他31个省市的省际间网络关联指数,构建本省与外界旅游网络关联指数情况表,并通过计算不同年份的省际间网络关联指数,最终构成31
×
31的省际间旅游网络关联指数表。
[0028]本专利技术的有益效果:
[0029]1、通过本专利技术的评估方法,能够为旅行社下一年的规划做评估,能够有效的解决其管理混乱的问题。
[0030]2、本专利技术构建了基于游客行为的旅游城市网络关联度评估模型,通过网络关联指数测算,在很大程度上改变了传统旅游业的经营模式。
附图说明
[0031]本专利技术可以通过附图给出的非限定性实施例进一步说明;
[0032]图1为本专利技术一种基于游客行为的旅游城市网络关联度评估方法的流程示意图;
[0033]图2为本专利技术一种基于游客行为的旅游城市网络关联度评估方法的城市间游客轨迹联系度网络图。
具体实施方式
[0034]为了使本领域的技术人员可以更好地理解本专利技术,下面结合附图和实施例对本专利技术技术方案进一步说明。
[0035]一种基于游客行为的旅游城市网络关联度评估方法,包括,
[0036]S1:收集游客电子合同数据;
[0037]S2:处理游客非结构化文本旅游数据;
[0038]S3:异常值处理及游客完备性旅游数据归集;
[0039]S4:构建省际间旅游联系度模型;
[0040]S5:计算省际间网络关联指数;
[0041]S6:获取省际间旅游网络关联指数表。
[0042]其中,所述步骤S1中游客电子合同数据来源于全国旅游电子合同数据库。
[0043]其中,所述步骤S2中从游客非结构化文本旅游数据进行基于自然语言处理NLP算法的语义文本识别,提取出游客行程出发地、目的地、游玩时间信息。
[0044]其中,所述步骤S3中,将S2中提取出的游客行程出发地、目的地、游玩时间信息与S1中电子合同备案数据库数据进行比较,剔除掉异常值旅游数据,确保游客旅游数据的完备性。
[0045]通过网络关联指数测算,得到省际间双向网络关联指数。
[0046]具体实施例,
[0047]S1:收集2019年和2020年的游客数据,游客数据是基于全国旅游电子合同中的游客合同数据,游客合同是游客出行前本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于游客行为的旅游城市网络关联度评估方法,其特征在于:包括,S1:收集游客电子合同数据;S2:处理游客非结构化文本旅游数据;S3:异常值处理及游客完备性旅游数据归集;S4:构建省际间旅游联系度模型;S5:计算省际间网络关联指数;S6:获取省际间旅游网络关联指数表。2.根据权利要求1所述的一种基于游客行为的旅游城市网络关联度评估方法,其特征在于:所述步骤S1中,游客电子合同数据来源于全国旅游电子合同数据库。3.根据权利要求1所述的一种基于游客行为的旅游城市网络关联度评估方法,其特征在于:所述步骤S2中,从游客非结构化文本旅游数据进行基于自然语言处理NLP算法的语义文本识别,提取出游客行程出发地、目的地、游玩时间信息。4.根据权利要求1所述的一种基于游客行为的旅游城市网络关联度评估方法,其特征在于:所述步骤S3中,将S2中提取出的游客行程出发地、目的地、游玩时间信息与S1中电子合同备案数据库数据进行比较,剔除掉异常值旅游数据,确保游客旅游数据的完备性。5.根据权利要求1所述的一种基于游客行为的旅游城市网络关联度评估方法,其特征在于:所述步骤S4中,省际间的旅游联系度模型如下:公式(1)中,NCI
j

i
表示出发地j到目的地i的单向旅游联系度;T
j

i
表示出发地j到目的地i的游客数量;表示出发地m到目的地n的所有游客数量之和;表示出发...

【专利技术属性】
技术研发人员:宋佳维张宏利杨荣平
申请(专利权)人:江苏唱游数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1