【技术实现步骤摘要】
一种大数据旅游资源数据补偿方法
[0001]本专利技术涉及数据补偿
,具体为一种大数据旅游资源数据补偿方法。
技术介绍
[0002]旅游产业在国民经济中占有越来越重要的地位,随着旅游发展和现代科技进步,关于旅游数据资源采集的方法也日益增多,目前旅游资源数据来源有自有涉文旅资源信息,应用于涉文旅单位数据上报,通过数据交换工具,实现外部数据接入等,不管是旅游规划还是旅游研究,旅游资源的调查分析,都是非常重要的一环;
[0003]旅游资源统计是指搜集整理旅游时间内旅游活动情况的统计,旅游统计的基本内容是搜集整理旅游的国外人数和国内旅游的人数,搜集、整理和分析旅游者的国别,职业、年龄等构成情况,搜集整理旅游外汇收入,旅游事业的经营效果等情况,并逐步开展分析研究工作,以便掌握国内旅游经济活动的发展变化情况及其规律性;
[0004]但是,由于各数据源平台相对独立,资源数据可能因为各种故障,而出现数据不合理和连续性不一致的情况,对真实数据的校验较为麻烦,对缺失及不合理异常数据难以进行补救,故障原因也难以找寻。 >
技术实现思路
...
【技术保护点】
【技术特征摘要】
1.一种大数据旅游资源数据补偿方法,其特征在于,包括以下步骤:Step1:构建数据库,对关联的历史资源数据进行整合;Step2:对整合的数据进行分析,配置适配的格式;Step3:对数据进行拟合算法,将算法转化搭建为对应的数据模型;Step4:采集与数据模型相关联的真实资源数据;Step5:将真实资源数据区分批次后,导入数据模型内,进行运算训练;Step6:采集异常数据部分,并进行标记;Step7:根据异常数据属性,分析数据异常原因,并生产问题报告,递交管理端;Step8:提取异常数据的关联数据,并导入数据模型内,进行运算训练;Step9:将异常数据与关联数据的模拟运算结果进行比对,实施数据连续性和合理性的补偿。2.根据权利要求1所述的一种大数据旅游资源数据补偿方法,其特征在于,所述步骤Step3中的拟合算法,通过观察散点图目测拟合函数的形式,采用最小二乘法计算待估参数;在拟合前对数据进行预处理,处理过程包括对响应数据进行变换以及剔除Infs、NaNs,以及有明显错误的区域。3.根据权利要求1所述的一种大数据旅游资源数据补偿方法,其特征在于,所述步骤Step3拟合算法的拟合优度的表达公式为:表达式:其中:R2为拟合优度;SST=SSR+SSE;SST为总平方和;SSR为回归平方和;SSE为残差平方和;拟合优度越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高,观察点在回归直线附近越密集。4.根据权利要求1所述的一种大数据旅游资源数据补偿方法,其特征在于,所述步骤Step4中的与数据模型相关联的真实数据的保存于数据库内,与数据模型所用基础参数数据...
【专利技术属性】
技术研发人员:林彬彬,陈海江,
申请(专利权)人:浙江力石科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。