基于分段采样的段域神经网络回归方法、系统及存储介质技术方案

技术编号:32435853 阅读:37 留言:0更新日期:2022-02-24 19:10
本发明专利技术公开了一种基于分段采样的段域神经网络回归方法、系统及存储介质,包括:获取样本数据集,对样本数据进行特征选择;将完成特征挑选后的数据集划分为训练集和测试集,根据训练集进行k

【技术实现步骤摘要】
基于分段采样的段域神经网络回归方法、系统及存储介质


[0001]本专利技术涉及数据分析
,更具体的,涉及一种基于分段采样的段域神经网络回归方法、系统及存储介质。

技术介绍

[0002]当今时代是信息时代,每天都会出现大量的数据,利用好这些数据能对我们的生活带来很大的影响,利用大数据回归分析出准确的模型的问题,有很大的价值。利用大数据回归分析,就可以根据当前和过去的信息来预测未来情况。比如利用大数据回归分析公司未来几年的发展情况,在哪些方面需要加大投入决定了一个公司的走向,根据大数据回归分析顾客的喜好,给顾客推送相应的服务,让顾客得到更好的服务,提高了生活质量。人们在日常工作中会碰到从分类归纳的数据中找变量与变量之间的关系,这时利用大数据回归分析就可以通过图表清楚明了的展示出自变量与因变量之间的关系从而提高了工作效率。同时,回归分析还可以运用于医疗健康设备中,比如佩戴健康监测手表,给人们提供实时的健康状况告警或分析出复杂的医疗数据,所以大数据回归分析在当代生活中有广泛的应用。
[0003]当前的主流的回归分析算法有BP神经网络回归方本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于分段采样的段域神经网络回归方法,其特征在于,包括如下步骤:获取样本数据集,采用包装特征选择方法对样本数据集进行特征选择,利用随机森林算法测试前向搜索特征选择结果与后向搜索特征选择结果的重要性;判断前向搜索特征选择结果与后向搜索特征选择结果的重要性大小,通过重要性较大的特征选择结果生成特征挑选后的数据集;将完成特征挑选后的数据集划分为训练集和测试集,根据训练集进行k

fold交叉验证,生成初级回归模型和初级回归模型的第一输出信息;根据所述第一输出信息生成新数据集,对所述新数据集进行连续分段采样得到不同段域的子集合;基于梯度下降对不同段域子集合进行训练得到次级回归模型,同时得到不同段域的权值矩阵及偏差矩阵;将所述测试集输入所述初级回归模型中生成第二输出信息,将第二输出信息输入所述次级回归模型,得到最终段域神经网络回归模型的预测结果。2.根据权利要求1所述的一种基于分段采样的段域神经网络回归方法,其特征在于,所述的根据训练集进行k

fold交叉验证,生成初级回归模型和初级回归模型的第一输出信息,具体为:将完成特征挑选后的数据集划分为训练集和测试集,将所述训练集随机划分成k份大小相似的子数据集;通过k份子数据集进行k

fold交叉验证,得到k个初级回归模型和k个对应初级回归模型的第一输出信息,通过k个第一输出信息生成新数据集。3.根据权利要求1所述的一种基于分段采样的段域神经网络回归方法,其特征在于,所述基于梯度下降对不同段域子集合进行训练得到次级回归模型,同时得到不同段域的权值矩阵及偏差矩阵,具体为:对所述新数据集通过预设段域采样函数进行连续分段采样,生成不同段域的样本点集合,所述预设段域采样函数为:其中,其中,为超参数,满足,为采样区间,即具体地可表示为:通过梯度下降的方法对不同段域的样本点集合里的数据进行第二次回归模型训练,得到次级回归模型。4.根据权利要求3所述的一种基于分段采样的段域神经网络回归方法,其特征在于,所述次级回归模型的训练过程为:令次级回归模型为,表示次级回归表达式,表示段域偏差信
息,表示段域权值信息,表示误差项;由梯度下降算法计算相应参数和的线性回归,定义次级回归模型的损失函数,对分别做和的偏导数,进行迭代训练直至导数收敛,生成相应段域的权值信息和偏差信息;所述损失函数为:其中,表示损失函数,表示训练数据中的数据总数,表示数据项数,表示段域偏差信息,表示段域权值信息,表示次级回归表达式;将所有段域的权值信息组成权值向量,同时将对应的偏差信息组成偏差向量,根据所述权值向量及偏差向量输出训练后的次级回归模型,同时生成权值矩阵与偏差矩阵。5.根据权利要求1所述的一种基于分段采样的段域神经网络回归方法,其特征在于,所述的将所述测试集输入所述初级回归模型中生成第二输出信息,...

【专利技术属性】
技术研发人员:丘梓杰黄潮源凌永权刘庆陈丹妮韦怡婷
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1