一种宏观经济多源混频大数据建模方法技术

技术编号：21453920 阅读：41 留言：0更新日期：2019-06-26 04:46

本发明专利技术公开了一种宏观经济多源混频大数据建模方法，涉及人工智能技术领域。本发明专利技术包括如下步骤：扩充响应变量，为高频解释变量加入建模提供建模基础；对获取的多源混频大数据进行特征处理，排除了变量间的共线性性和冗余变量对模型的干扰；根据解释变量的更新滞后时长和响应变量的频率确定解释变量前推的时间长度和跨越的历史时长，得到样本；使用回归器对数据进行训练和预测，得到分析结果。本发明专利技术通过对响应变量进行扩充，以及引入更多更高频的解释变量，得到细粒度更高的建模结果；引入了多源混频大数据构造训练样本训练模型，使得建模结果更客观，具有更好的可解释性。

全部详细技术资料下载

【技术实现步骤摘要】
一种宏观经济多源混频大数据建模方法
本专利技术属于人工智能
，特别是涉及一种宏观经济多源混频大数据建模方法，该方法构建了一种细粒度更高的优于传统宏观经济指标建模方法的新型模型。
技术介绍
宏观经济指标衡量了一个国家的经济发展水平，反映了一个国家的经济发展状况。宏观经济指标的建模结果对该区域未来的经济发展规划起到了一定的影响作用。但是目前，宏观经济指标由国家或地区统计局发布，受限于传统的指标计算方法，存在着发布维度较少、频率较低、时滞严重等问题。因此，这些指标难以及时准确地反映现实宏观经济发展的真实情况。而使用宏观经济多源混频大数据建模方法，能够更准确、更及时的反映当前区域经济的发展态势。为经济发展规划和监测经济发展过程中的突发性问题提供了有力的佐证，协助决策者更好的发展区域经济。宏观经济多源混频大数据建模方法面临如下问题：(1)如何更好地使用多源混频大数据构造出具有宏观经济意义的解释变量用于建模分析；(2)如何挑选更优的模型对宏观经济指标进行预测；(3)如何分析模型预测出的宏观经济指标的结果，从中挖掘出值得关注的点。然而，目前框架下使用的模型仍是基于线性模型的改进模型，使得模型能够承受的解释变量的维度有一定的限制；因此，本专利技术提供了一种使用传统的建模数据和基于多源混频大数据直接的对比，宏观经济多源混频大数据建模方法在MAPE、Max-APE以及季度末的值的MAPE上都有较好的表现。
技术实现思路
本专利技术的目的在于提供一种宏观经济多源混频大数据建模方法，通过数据获取、特征分析、训练样本生成、模型训练、结果分析步骤设计的建模框架，解决了现有的模型解释...

【技术保护点】
1.一种宏观经济多源混频大数据建模方法，其特征在于，包括如下步骤：步骤S1、扩充响应变量：对响应变量进行扩充，获取高频的响应变量数据；步骤S2、数据获取：从多源渠道获取与宏观经济指标相关的混频大数据；步骤S3、特征分析：将获取的多源混频大数据进行特征处理，生成具备宏观经济意义的新特征变量；步骤S4、训练样本生成：根据数据更新滞后性和响应变量的频率确定解释变量数据前推时间长度和解释变量选取的历史时间长度，生成训练样本，划分成训练集和测试集；步骤S5、模型训练：选择合适的模型对训练集进行训练，并给出模型在测试集上的结果以及训练模型的参数；步骤S6、结果分析与展示：分析模型在测试集上的结果，结合训练模型参数给出解释变量的重要性排序；其中，步骤S3中，对多源混频大数据进行特征处理包括如下情况：当对单个变量时，采用缺失值填补、数据变化和数据标准化处理；当对多个变量时，采用降维、特征选择和协变量构造处理。

【技术特征摘要】
1.一种宏观经济多源混频大数据建模方法，其特征在于，包括如下步骤：步骤S1、扩充响应变量：对响应变量进行扩充，获取高频的响应变量数据；步骤S2、数据获取：从多源渠道获取与宏观经济指标相关的混频大数据；步骤S3、特征分析：将获取的多源混频大数据进行特征处理，生成具备宏观经济意义的新特征变量；步骤S4、训练样本生成：根据数据更新滞后性和响应变量的频率确定解释变量数据前推时间长度和解释变量选取的历史时间长度，生成训练样本，划分成训练集和测试集；步骤S5、模型训练：选择合适的模型对训练集进行训练，并给出模型在测试集上的结果以及训练模型的参数；步骤S6、结果分析与展示：分析模型在测试集上的结果，结合训练模型参数给出解释变量的重要性排序；其中，步骤S3中，对多源混频大数据进行特征处理包括如下情况：当对单个变量时，采用缺失值填补、数据变化和数...

【专利技术属性】
技术研发人员：宋艳枝，孔京，杨路，
申请(专利权)人：合肥黎曼信息科技有限公司，
类型：发明
国别省市：安徽,34

全部详细技术资料下载我是这个专利的主人