一种全周期数据碰撞低价游判断方法及系统技术方案

技术编号:30138158 阅读:26 留言:0更新日期:2021-09-23 14:53
本发明专利技术公开了一种全周期数据碰撞低价游判断方法及系统,其中方法包括:获取历史价格数据,计算不同时间段的人均价的市场价;分别计算得到不同的旅游天数分不同目的地相应的人均价的市场价;确定所述市场价的低价阈值;从旅游合同数据中提取费用因子;计算所述旅游合同数据中的人均价;比较所述市场价的低价阈值和所述旅游合同数据中的人均价,识别旅游合同数据中的人均价是否属于不合理的低价游,低价游判定结果输出。本发明专利技术基于全周期旅游大数据信息,并通过电子合同相关信息对低价游的“低价”进行新的方法估算,能够结合全周期的历史价格数据和主要的旅游费用因子准确地识别旅游合同数据中的人均价是否属于不合理的低价游,未来应用前景广阔。未来应用前景广阔。未来应用前景广阔。

【技术实现步骤摘要】
一种全周期数据碰撞低价游判断方法及系统


[0001]本专利技术涉及旅游大数据处理领域,尤其涉及一种全周期数据碰撞低价游判断方法及系统。

技术介绍

[0002]专利CN201910162037.7公开了一种旅游信息查询系统,该系统包括了人机交互模块、旅游线路基本要求输入模块、旅游线路规划模块、旅游线路修订模块、旅游费用查询模块和自动推荐模块。其中旅行费用查询模块,用于通过网络爬虫模块根据旅游路线修订模块输出的旅游路线所对应的出发地、目的地、景点、酒店、餐厅在各旅游资源网络基站上进行相对应的交通花费、住宿花费、门票花费、餐饮花费价格的挖掘,并将挖掘的结果以花费条目、价钱及其对应的网址链接以表格形式一一对应后,发送到显示屏进行显示。该专利虽然利用网络爬虫对旅行中的费用进行查询,可以提前对旅游的花费进行预算,但是并没有具体的对价格是否合理进行评估,有些旅行社会以低价格招揽客户,因此会产生一些不合理低价游。
[0003]不合理低价游,是指背离价值规律,以低于经营成本的价格招揽客户,以不正常竞争扰乱市场的行为。原国家旅游局发布关于打击组织“不合理低价游”的意见中认定5种行为属于“不合理低价游”,包括:(1)凡是旅行社旅游产品价格低于当地旅游部门或旅游行业协会公布的诚信旅游指导价30%以上的;(2)组团社将业务委托给地接社履行,不向地接社支付费用或支付的费用低于接待和服务成本的;(3)地接社接待不支付接待和服务费用或者支付的费用低于接待和服务成本的旅游团队的;(4)旅行社安排导游领队为团队旅游提供服务,要求导游领队垫付或向导游领队收取费用的;(5)法律、法规规定的旅行社损害旅游者合法权益的其他“不合理低价”行为。
[0004]上述意见中给出了五种可以认定为不合理低价游的情况,但在实际应用中不够具体明确,欠缺实用性和可操作性。因此,设计出一种全周期数据碰撞低价游判断方法及系统,成为了一种新的技术需求。

技术实现思路

[0005]本专利技术实施例提供了一种全周期数据碰撞低价游判断方法及系统,准确地识别旅游合同数据中的人均价是否属于不合理的低价游。
[0006]第一方面,本专利技术实施例提供了一种全周期数据碰撞低价游判断方法,所述方法包括:S101:获取全周期历史价格数据,计算不同时间段的人均价的市场价;S102:分别计算得到不同的旅游天数分不同目的地相应的人均价的市场价;S103:确定所述市场价的低价阈值;S104:从旅游合同数据中提取费用因子;S105:计算所述旅游合同数据中的人均价;S106:比较所述市场价的低价阈值和所述旅游合同数据中的人均价,识别所述旅游合同数据中的人均价是否属于不合理的低价游;S107:低价游判定结果输出。
[0007]可选地,在所述计算不同时间段的人均价的市场价之前,所述方法还包括:对时间
段的人均价的数据进行正态分布检验;对所述时间段的人均价的数据进行缩尾处理,得到趋近正态性状的数据分布。
[0008]可选地,所述方法还包括:对不同的旅游天数分不同目的地绘制出相应的人均价的概率密度曲线或者核密度曲线;
[0009]所述概率密度曲线的函数为:
[0010][0011]其中,p为不同的旅游天数分不同目的地相应的人均价,μ、σ分别为概率分布的均值和标准差,EXP代表以e为底的指数函数。
[0012]可选地,所述方法还包括:在所述概率密度曲线上截取概率最高点处区间的人均价分布;计算所述区间内人均价均值,分别得到所述不同的旅游天数分不同目的地相应的人均价的市场价。
[0013]可选地,所述费用因子包括:旅游人数、旅游天数、出发地、目的地、出行时间、旅游总价格、大交通费用。
[0014]可选地,所述计算所述旅游合同数据中的人均价包括:计算所述旅游合同数据中在目的地的旅游天数的人均价格;
[0015]所述在目的地e的旅游天数d的人均价格的计算公式为:
[0016]其中,N为旅游人数,d为旅游天数,TP为旅游总价格,TC为大交通费用。
[0017]第二方面,本专利技术实施例提供了一种全周期数据碰撞低价游判断系统,所述系统包括:获取单元,用于获取全周期历史价格数据,计算不同时间段的人均价的市场价;处理单元,用于分别计算得到不同的旅游天数分不同目的地相应的人均价的市场价;确定单元,用于确定所述市场价的低价阈值;提取单元,用于从旅游合同数据中提取费用因子;计算单元,用于计算所述旅游合同数据中的人均价;识别单元,用于比较所述市场价的低价阈值和所述旅游合同数据中的人均价,识别所述旅游合同数据中的人均价是否属于不合理的低价游;所述确定单元,还用于低价游判定结果输出。
[0018]可选地,所述系统还包括:检验单元,用于对时间段的人均价的数据进行正态分布检验;对所述时间段的人均价的数据进行缩尾处理,得到趋近正态性状的数据分布。
[0019]可选地,所述系统还包括:绘制单元,用于对不同的旅游天数分不同目的地绘制出相应的人均价的概率密度曲线或者核密度曲线;
[0020]所述概率密度曲线的函数为:
[0021][0022]其中,p为不同的旅游天数分不同目的地相应的人均价,μ、σ分别为概率分布的均值和标准差,EXP代表以e为底的指数函数。
[0023]可选地,所述绘制单元,还用于:在所述概率密度曲线上截取概率最高点处区间的人均价分布;计算所述区间内人均价均值,分别得到所述不同的旅游天数分不同目的地相
test(中文:夏皮罗

威尔克检验,简称:S

W)或者Kolmogorov

Smirnov D(中文:柯尔莫可洛夫

斯米洛夫检验,简称:K

S)等方法进行正态分布检验。在此过程,如遇到异常值影响,可能导致数据结构呈现拖尾分布,很有必要再对数据进行缩尾或其他方法处理,尽可能趋近正态性状。
[0038]S102,分别计算得到不同的旅游天数分不同目的地相应的人均价的市场价。
[0039]可选地,对不同的旅游天数分不同目的地绘制出相应的人均价的概率密度曲线或者核密度曲线。
[0040]可选地,在概率密度曲线上截取概率最高点处区间的人均价分布,计算区间内人均价均值,分别得到不同的旅游天数分不同目的地相应的人均价的市场价。
[0041]参考表1的旅游市场“公允”价格对照表,针对不同旅游天数(d),分不同目的地(e),绘制出相应的人均价格的概率密度曲线或者核密度曲线,截取概率最高点附近小范围区间所对应的人均价格分布[Pmode

ΔP,Pmode+ΔP],并求取区间内人均价格均值。根据在目的地e的旅游天数d的人均价格的计算公式:得到不同出行天数不同目的地所对应旅游市场“公允”价格或者旅游市场交易价格。
[0042]表1
[0043][0044]S103,确定市场价的低价阈值。
[0045]可选地,“不合理低价”标准阈值可以确定为旅游市场价的70%,当旅游合同数据中的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种全周期数据碰撞低价游判断方法,其特征在于,所述方法包括:S101:获取全周期历史价格数据,计算不同时间段的人均价的市场价;S102:分别计算得到不同的旅游天数分不同目的地相应的人均价的市场价;S103:确定所述市场价的低价阈值;S104:从旅游合同数据中提取费用因子;S105:计算所述旅游合同数据中的人均价;S106:比较所述市场价的低价阈值和所述旅游合同数据中的人均价,识别所述旅游合同数据中的人均价是否属于不合理的低价游;S107:低价游判定结果输出。2.根据权利要求1所述方法,其特征在于,在所述计算不同时间段的人均价的市场价之前,所述方法还包括:对时间段的人均价的数据进行正态分布检验;对所述时间段的人均价的数据进行缩尾处理,得到趋近正态性状的数据分布。3.根据权利要求1所述方法,其特征在于,所述方法还包括:对不同的旅游天数分不同目的地绘制出相应的人均价的概率密度曲线或者核密度曲线;所述概率密度曲线的函数为:其中,p为不同的旅游天数分不同目的地相应的人均价,μ、σ分别为概率分布的均值和标准差,EXP代表以e为底的指数函数。4.根据权利要求3所述方法,其特征在于,所述方法还包括:在所述概率密度曲线上截取概率最高点处区间的人均价分布;计算所述区间内人均价均值,分别得到所述不同的旅游天数分不同目的地相应的人均价的市场价。5.根据权利要求1所述方法,其特征在于,所述费用因子包括:旅游人数、旅游天数、出发地、目的地、出行时间、旅游总价格、大交通费用。6.根据权利要求1所述方法,其特征在于,所述计算所述旅游合同数据中的人均价包括:计算所述旅...

【专利技术属性】
技术研发人员:张军贺洁琼宋佳维
申请(专利权)人:江苏唱游数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1