【技术实现步骤摘要】
一种基于相关性分析的病毒扩散与气候因素关系分析方法
[0001]本专利技术属于数据处理领域,涉及多元线性回归模型技术,具体运用多元线性回归模型分析病毒扩散与气候因素之间的关系。
技术介绍
[0002]病毒地爆发会影响到全世界人民的生活,分析病毒传播规律,支撑病毒防控措施实施具有迫切需求和重要意义。本文运用多元线性回归模型分析病毒扩散与气候因素之间的关系。基于约翰
·
霍普金斯大学系统科学与工程中心(CSSE)公布的Novel Coronavirus 2019time series data on cases数据集和天气网、中国气象数据网的天气数据进行相关性分析。
[0003]多元线性回归模型适用于多变量影响单变量的情况,能够准确地计量各个变量之间的相关程度与回归拟合程度,提升预测模型效果。在本研究中气象因素从多方面对病毒扩散具有影响,需要分析多种气象因素与病毒扩散之间的相关程度,因此本研究选取多元线性回归模型进行分析。
[0004]目前针对病毒扩散与气候因素已经有了一部分研究,如Zhu等人通过 ...
【技术保护点】
【技术特征摘要】
1.一种基于相关性分析的病毒扩散与气候因素关系分析方法,其特征在于:包括:步骤1、数据来源及实验对象:病毒相关数据来源于公开数据集以及气象数据网搜集的全球各地气象站每日记录数据;步骤2、数据收集及预处理:采集的病毒数据是各国家每日累计确诊人数,通过各国家每日与前一日累计确诊人数相减得到各国新增确诊新冠人数;选取各国家月平均高温、月平均低温、海平面压力、海拔、风速、降雨量、露点温度和相对湿度为各项气候因素数据;对于缺失的某日气候因素数据,采用前后两天数据取均值进行填充;连续日期缺失的气候因素数据用0填充,防止影响实验结果;将数据按照7:3的比例划分为训练集和测试集;步骤3、构建多元线性回归模型:以新增确诊人数New作为因变量y,各项气候因素包括:平均高温t_max、月平均低温t_min、海平面压力S_P、风速W_S、海拔EI、降雨量RF、露点温度DP和相对湿度Humidity分别为自变量x1、x2、x3、x4、x5、x6、x7、x8;β0、β1、β2、β3、β4、β5、β6、β7、β8为对应自变量的未知参数;ε称为误差项;多元线性回归模型公式如式1所示:y=β0+β1x1+β2x2+β3x3+β4x4+β5x5+β6x6+β7x7+β8x8+ε
ꢀꢀꢀꢀ
(1)式1表示新增确诊人数为各气候因素的加权和,后续通过线性回归方法对各气候因素权重进行估计;步骤4、训练多元线性回归模型:选取70%的观测数据作为训练集,每日新增确诊人数与八类气候因素数据为训练数据;将训练集输入到编写好的程序...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。