基于多元线性回归处理非线性数据的方法和装置制造方法及图纸

技术编号:21224814 阅读:43 留言:0更新日期:2019-05-29 05:33
本申请涉及一种基于多元线性回归处理非线性数据的方法和装置,其中方法包括:获取包含多个解释变量的数据模型;采用预设函数分别对多个解释变量进行转换以得到多个转换后的解释变量;根据数据模型对多个转换后的解释变量进行组合以得到多个候选线性回归公式,根据线性回归分析以确定目标回归公式。本申请通过获取包含多个相互独立的解释变量的数据模型,采用预设函数分别对多个解释变量进行转换以得到多个转换后的解释变量,然后根据数据模型对多个转换后的解释变量进行组合以得到多个候选线性回归公式,并通过线性回归分析以确定目标回归公式,从而将多元非线性回归分析转换成多个多元线性回归分析,以对非线性数据进行处理。

A Method and Device for Processing Nonlinear Data Based on Multivariate Linear Regression

This application relates to a method and device for processing non-linear data based on multiple linear regression. The methods include: obtaining a data model containing multiple interpreting variables; transforming multiple interpreting variables by presupposition functions to obtain multiple interpreting variables; combining multiple transformed interpreting variables according to data model to obtain multiple candidate linear returns. The regression formula is determined by linear regression analysis. This application obtains a data model containing multiple independent explanatory variables, uses presupposition functions to transform multiple explanatory variables to obtain multiple transformed explanatory variables, then combines multiple transformed explanatory variables according to the data model to obtain multiple candidate linear regression formulas, and determines the objective regression formulas through linear regression analysis. Multivariate non-linear regression analysis is transformed into multiple multiple linear regression analysis to process the non-linear data.

【技术实现步骤摘要】
基于多元线性回归处理非线性数据的方法和装置
本申请涉及数据处理
,特别是涉及一种基于多元线性回归处理非线性数据的方法、装置、计算机设备和存储介质。
技术介绍
一般在工程设计或科学实验中所得到的数据往往是一张关于离散数据点的表,没有解析式来描述x-y的关系。通常根据所给定的这些离散数据点绘制的曲线,称为不规则曲线,一般用非线性回归的方法解决这类问题。所谓非线性回归方法是由给定的离散数据点,建立数据关系(数学模型),求出一系列微小的直线段,然后把这些插值点连接成曲线,只要插值点的间隔选择得当,就可以形成一条光滑的曲线。目前主流的非线性回归方法主要有R语言的nls(nonlinearleastsquares非线性最小二乘法)函数、lm函数和Matlab(矩阵实验室)的curvefit(曲线拟合)函数等,但是此类方法需要预先设置数据遵循的函数公式和公式的预估参数。因此,此类方法受限于数据的复杂性和未知性,对使用者的数学、统计学等知识有较高的要求。
技术实现思路
基于此,有必要针对上述采用非线性回归方法处理离散数据,对使用者的数学、统计学等知识有较高要求的技术问题,提供一种易于实现的基于多元线性回归处理非线性数据的方法、装置、计算机设备和存储介质。为了实现上述目的,一方面,本申请实施例提供了一种基于多元线性回归处理非线性数据的方法,包括:获取包含多个解释变量的数据模型,其中,多个解释变量相互独立;采用预设函数分别对多个解释变量进行转换以得到多个转换后的解释变量;根据数据模型对多个转换后的解释变量进行组合以得到多个候选线性回归公式;对多个候选线性回归公式分别进行线性回归分析以确定目标回归公式。在其中一个实施例中,对多个候选线性回归公式分别进行线性回归分析以确定目标回归公式,包括:采用R语言的线性回归函数对多个候选线性回归公式分别进行线性回归分析以确定目标回归公式。在其中一个实施例中,候选线性回归公式包括多个回归项;则采用R语言的线性回归函数对多个候选线性回归公式分别进行线性回归分析以确定目标回归公式,包括:采用R语言的线性回归函数估算多个候选线性回归公式中的每一个回归项对应的系数;根据估算结果采用T检验以确定目标回归公式。在其中一个实施例中,根据估算结果采用T检验以确定目标回归公式,包括:根据估算结果对多个候选线性回归公式进行T检验以获取T检验结果;剔除多个候选线性回归公式中T检验结果P值大于0.01的回归项;计算每一个候选线性回归公式中剩余回归项T检验结果中T的均值;将对应T的均值最大的估算结果通过进行拟合以得到目标回归公式。在其中一个实施例中,R语言的线性回归函数包括R语言的lm函数和glm函数中的任一种。在其中一个实施例中,预设函数包括预设的初等函数和预设的自定义函数。另一方面,本申请实施例提供了一种基于多元线性回归处理非线性数据的装置,包括:获取模块,用于获取包含多个解释变量的数据模型,其中,多个解释变量相互独立;转换模块,用于采用预设函数分别对多个解释变量进行转换以得到多个转换后的解释变量;组合模块,用于根据数据模型对多个转换后的解释变量进行组合以得到多个候选线性回归公式;确定模块,用于对多个候选线性回归公式分别进行线性回归分析以确定目标回归公式。在其中一个实施例中,确定模块包括:估算单元,用于采用R语言的线性回归函数估算多个候选线性回归公式中的每一个回归项对应的系数;目标回归公式确定单元,用于根据估算结果采用T检验以确定目标回归公式。在其中一个实施例中,目标回归公式确定单元包括:T检验子单元,用于根据估算结果对多个候选线性回归公式进行T检验以获取T检验结果;剔除子单元,用于剔除多个候选线性回归公式中T检验结果P值大于0.01的回归项;计算子单元,用于计算每一个候选线性回归公式中剩余回归项T检验结果中T的均值;拟合子单元,用于将对应T的均值最大的估算结果进行拟合以得到目标回归公式。第三方面,本申请实施例提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以上方法所述的步骤。第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以上方法所述的步骤。上述基于多元线性回归处理非线性数据的方法、装置、计算机设备和存储介质,通过获取包含多个相互独立的解释变量的数据模型,采用预设函数分别对多个解释变量进行转换以得到多个转换后的解释变量,然后根据数据模型对多个转换后的解释变量进行组合以得到多个候选线性回归公式,并通过线性回归分析以确定目标回归公式,从而将多元非线性回归分析转换成多个多元线性回归分析,以对非线性数据进行处理。附图说明图1为一个实施例中基于多元线性回归处理非线性数据的方法的应用环境图;图2为一个实施例中基于多元线性回归处理非线性数据的方法的流程示意图;图3为一个实施例中对多个候选线性回归公式分别进行线性回归分析以确定目标回归公式的步骤的流程示意图;图4为一个实施例中根据估算结果采用T检验以及lm函数确定目标回归公式的步骤的流程示意图;图5为一个实施例中基于多元线性回归处理非线性数据的装置的结构框图;图6为图5中确定模块的结构框图;图7为图6中目标回归公式确定单元的结构框图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。由于采用非线性回归方法处理离散数据,对使用者的数学、统计学等知识有较高要求,而线性回归的方法因工程设计或科学实验数据的复杂和多样性,通常需要将数据进行线性变换。然而实验数据同样存在未知性,其变换方式多种多样,通常需要耗费大量时间来探索其中的规律。但是,如果存在两个或两个以上的自变量,在回归分析中就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。基于此,本申请提供了一种基于多元线性回归处理非线性数据的方法,可以应用于如图1所示的计算机设备,该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端设备通过网络连接通信。该计算机程序被处理器执行时以实现一种基于多元线性回归处理非线性数据的方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备可以是增白织物的处理系统的输入装置,其可以与增白织物的处理系统通信连接。另外,该计算机设备的输入装置可以是显示屏上覆盖的触摸层、计算机设备外壳上设置的按键、轨迹球、触控板、外接的键盘、触控板和/或鼠标等。可选的,该计算机设备可以是服务器,可以是PC,还可以是个人数字助理,也可以是其他的终端设备,例如PAD、手机等等,还可以是云端或者远程服务器,本申请实施例对计算机设备的具体形式并不做限定。本领域技术人员可以理解,图1中示本文档来自技高网...

【技术保护点】
1.一种基于多元线性回归处理非线性数据的方法,其特征在于,包括:获取包含多个解释变量的数据模型,所述多个解释变量相互独立;采用预设函数分别对多个所述解释变量进行转换以得到多个转换后的解释变量;根据所述数据模型对多个转换后的解释变量进行组合以得到多个候选线性回归公式;对多个所述候选线性回归公式分别进行线性回归分析以确定目标回归公式。

【技术特征摘要】
1.一种基于多元线性回归处理非线性数据的方法,其特征在于,包括:获取包含多个解释变量的数据模型,所述多个解释变量相互独立;采用预设函数分别对多个所述解释变量进行转换以得到多个转换后的解释变量;根据所述数据模型对多个转换后的解释变量进行组合以得到多个候选线性回归公式;对多个所述候选线性回归公式分别进行线性回归分析以确定目标回归公式。2.根据权利要求1所述的基于多元线性回归处理非线性数据的方法,其特征在于,所述对多个所述候选线性回归公式分别进行线性回归分析以确定目标回归公式,包括:采用R语言的线性回归函数对多个所述候选线性回归公式分别进行线性回归分析以确定目标回归公式。3.根据权利要求2所述的基于多元线性回归处理非线性数据的方法,其特征在于,所述候选线性回归公式包括多个回归项;所述采用R语言的线性回归函数对多个所述候选线性回归公式分别进行线性回归分析以确定目标回归公式,包括:采用R语言的线性回归函数估算多个所述候选线性回归公式中的每一个回归项对应的系数;根据估算结果采用T检验以确定目标回归公式。4.根据权利要求3所述的基于多元线性回归处理非线性数据的方法,其特征在于,所述根据估算结果采用T检验以确定目标回归公式,包括:根据估算结果对多个所述候选线性回归公式进行T检验以获取T检验结果;剔除多个所述候选线性回归公式中T检验结果P值大于0.01的回归项;计算每一个所述候选线性回归公式中剩余回归项T检验结果中T的均值;将对应T的均值最大的估算结果进行拟合以得到目标回归公式。5.根据权利要求2~4任一项所述的基于多元线性回归处理非线性数据的方法,其特征在于,所述R语言的线性回归函数包...

【专利技术属性】
技术研发人员:贾瑞凯郭森肖芳叶桦贾延凯廖国娟
申请(专利权)人:苏州金唯智生物科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1