当前位置: 首页 > 专利查询>厦门大学专利>正文

神经网络模型输入参量降维方法及计算机可读存储介质技术

技术编号:26846519 阅读:28 留言:0更新日期:2020-12-25 13:09
本发明专利技术公开了一种神经网络模型输入参量降维方法及计算机可读存储介质,方法包括:获取样本数据;根据预设的比例,将样本数据划分为训练数据和测试数据;随机产生预设数量的初始串结构数据,得到初始的种群,初始串结构数据中的每个位分别与样本数据中的各变量一一对应,且每个位的取值为第一字符或第二字符;分别计算最新的种群中各串结构数据对应的Heidke技巧评分,并作为各串结构数据的适应度;若存在适应度大于或等于预设目标值的串结构数据,则将该串结构数据中取值为第一字符的位对应的变量作为最终建模变量;若不存在,则根据遗传算法,生成新的串结构数据,得到新的种群,继续计算适应度。本发明专利技术可提高神经网络模型的精度和效率。

【技术实现步骤摘要】
神经网络模型输入参量降维方法及计算机可读存储介质
本专利技术涉及神经网络
,尤其涉及一种神经网络模型输入参量降维方法及计算机可读存储介质。
技术介绍
在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。例如,在研究赤潮预测模型时可能需要收集气象数据、水文数据、水质数据、营养盐数据和潮汐数据等,可能会包含几十个参量,其中部分变量之间存在着一定的相关关系,变量所反应的赤潮信息存在着一定的重复。对收集的变量进行一定的分析,寻找影响课题主要的参量,在不影响模型结果的基础上,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息,方便找到影响课题的关键因子。另外,在现实生活中,实际很难用线性模型进行描述。神经网络的出现大大降低了模型建立的难度和工作量。只需将神经网络看成是一个黑箱子,根据输入与输出数据,神经网络依据相关的学习规则,便可以建立相应的数学模型。但是,当模型的输入参量很多、输入参量之间不是相互独立时,利用神经网络容易出现过拟合现象,从而导致所建立的模型精度低、建模时间长等问题。因此,在建立模型之前,有必要对输入自变量进行优化选择,将冗余的一些自变量去掉,选择最能反映输入与输出关系的自变量参与建模。
技术实现思路
本专利技术所要解决的技术问题是:提供一种神经网络模型输入参量降维方法及计算机可读存储介质,可提高神经网络模型的精度和效率。为了解决上述技术问题,本专利技术采用的技术方案为:一种神经网络模型输入变量降维方法,包括:获取样本数据,所述样本数据包括正样本数据和负样本数据,每个样本数据由多个变量数据构成;根据预设的比例,将所述样本数据划分为训练数据和测试数据;随机产生预设数量的初始串结构数据,得到初始的种群,所述初始串结构数据中的每个位分别与样本数据中的各变量一一对应,且每个位的取值为第一字符或第二字符;分别计算最新的种群中各串结构数据对应的Heidke技巧评分,并分别将各串结构数据对应的Heidke技巧评分作为各串结构数据的适应度;判断最新的种群中是否存在适应度大于或等于预设目标值的串结构数据;若是,则将适应度大于或等于预设目标值的串结构数据中取值为第一字符的位对应的变量作为最终建模变量;若否,则根据遗传算法,生成新的串结构数据,得到新的种群;继续执行所述分别计算最新的种群中各串结构数据对应的Heidke技巧评分,并分别将各串结构数据对应的Heidke技巧评分作为各串结构数据的适应度的步骤。本专利技术还提出一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上所述的方法的步骤。本专利技术的有益效果在于:通过将二元模型综合评估的海德克评估(HSS)作为遗传算法的适应度函数,并通过遗传算法对神经网络的输入变量进行降维,可提高神经网络模型的精度和效率,降低神经网络模型的过拟合现象出现几率,减少模型收敛时长。附图说明图1为本专利技术实施例一的一种神经网络模型输入参量降维方法的流程图;图2为本专利技术实施例二中的遗传算法交叉操作的交叉算子原理示意图;图3为本专利技术实施例二中的遗传算法变异操作的变异算子原理示意图。具体实施方式为详细说明本专利技术的
技术实现思路
、所实现目的及效果,以下结合实施方式并配合附图详予说明。请参阅图1,一种神经网络模型输入变量降维方法,包括:获取样本数据,所述样本数据包括正样本数据和负样本数据,每个样本数据由多个变量数据构成;根据预设的比例,将所述样本数据划分为训练数据和测试数据;随机产生预设数量的初始串结构数据,得到初始的种群,所述初始串结构数据中的每个位分别与样本数据中的各变量一一对应,且每个位的取值为第一字符或第二字符;分别计算最新的种群中各串结构数据对应的Heidke技巧评分,并分别将各串结构数据对应的Heidke技巧评分作为各串结构数据的适应度;判断最新的种群中是否存在适应度大于或等于预设目标值的串结构数据;若是,则将适应度大于或等于预设目标值的串结构数据中取值为第一字符的位对应的变量作为最终建模变量;若否,则根据遗传算法,生成新的串结构数据,得到新的种群;继续执行所述分别计算最新的种群中各串结构数据对应的Heidke技巧评分,并分别将各串结构数据对应的Heidke技巧评分作为各串结构数据的适应度的步骤。从上述描述可知,本专利技术的有益效果在于:可提高神经网络模型的精度和效率。进一步地,所述获取样本数据之后,进一步包括:分别对所述样本数据中的各变量数据进行归一化处理。由上述描述可知,可减少不同变量之间量级差异带来的干扰。进一步地,所述分别计算最新的种群中各串结构数据对应的Heidke技巧评分具体为:根据一串结构数据中取值为第一字符的位对应的变量,确定建模变量;构建所述一串结构数据对应的人工神经网络,所述人工神经网络的输入层神经元的个数与所述建模变量的个数一致,输出层神经元的个数为2;根据所述训练数据中的建模变量,对所述人工神经网络进行训练;将所述测试数据中的建模变量输入训练后的人工神经网络,得到预报结果,所述预报结果为正样本结果或负样本结果;分别统计所述测试数据中预报结果为正样本结果的正样本数据的数量和负样本数据的数量,以及预报结果为负样本结果的正样本数据的数量和负样本数据的数量,得到所述一串结构数据对应的预报结果参数;根据所述预报结果参数以及测试数据的总数量,计算所述一串结构数据对应的Heidke技巧评分。由上述描述可知,利用专门应对二元模型评估的HSS来作为适应度函数,相比传统的以均方差作为适应度函数,可提高二元模型的降维效果。进一步地,所述预报结果参数包括第一值、第二值、第三值和第四值,所述第一值表示测试数据中预报结果为正样本结果的正样本数据的数量,所述第二值表示测试数据中预报结果为负样本结果的正样本数据的数量,所述第三值表示测试数据中预报结果为正样本结果的负样本数据的数量,所述第四值表示测试数据中预报结果为负样本结果的负样本数据的数量;所述分别统计所述测试数据中预报结果为正样本结果的正样本数据的数量和负样本数据的数量,以及预报结果为负样本结果的正样本数据的数量和负样本数据的数量,得到所述一串结构数据对应的预报结果参数具体为:若测试数据中的一正样本数据对应的预报结果为正样本结果,则令第一值加一,所述第一值的初始值为0;若测试数据中的一正样本数据对应的预报结果为负样本结果,则令第二值加一,所述第二值的初始值为0;若测试数据中的一负样本数据对应的预报结果为正样本结果,则令第三值加一,所述第三值的初始值为0;若测试数据本文档来自技高网
...

【技术保护点】
1.一种神经网络模型输入变量降维方法,其特征在于,包括:/n获取样本数据,所述样本数据包括正样本数据和负样本数据,每个样本数据由多个变量数据构成;/n根据预设的比例,将所述样本数据划分为训练数据和测试数据;/n随机产生预设数量的初始串结构数据,得到初始的种群,所述初始串结构数据中的每个位分别与样本数据中的各变量一一对应,且每个位的取值为第一字符或第二字符;/n分别计算最新的种群中各串结构数据对应的Heidke技巧评分,并分别将各串结构数据对应的Heidke技巧评分作为各串结构数据的适应度;/n判断最新的种群中是否存在适应度大于或等于预设目标值的串结构数据;/n若是,则将适应度大于或等于预设目标值的串结构数据中取值为第一字符的位对应的变量作为最终建模变量;/n若否,则根据遗传算法,生成新的串结构数据,得到新的种群;/n继续执行所述分别计算最新的种群中各串结构数据对应的Heidke技巧评分,并分别将各串结构数据对应的Heidke技巧评分作为各串结构数据的适应度的步骤。/n

【技术特征摘要】
1.一种神经网络模型输入变量降维方法,其特征在于,包括:
获取样本数据,所述样本数据包括正样本数据和负样本数据,每个样本数据由多个变量数据构成;
根据预设的比例,将所述样本数据划分为训练数据和测试数据;
随机产生预设数量的初始串结构数据,得到初始的种群,所述初始串结构数据中的每个位分别与样本数据中的各变量一一对应,且每个位的取值为第一字符或第二字符;
分别计算最新的种群中各串结构数据对应的Heidke技巧评分,并分别将各串结构数据对应的Heidke技巧评分作为各串结构数据的适应度;
判断最新的种群中是否存在适应度大于或等于预设目标值的串结构数据;
若是,则将适应度大于或等于预设目标值的串结构数据中取值为第一字符的位对应的变量作为最终建模变量;
若否,则根据遗传算法,生成新的串结构数据,得到新的种群;
继续执行所述分别计算最新的种群中各串结构数据对应的Heidke技巧评分,并分别将各串结构数据对应的Heidke技巧评分作为各串结构数据的适应度的步骤。


2.根据权利要求1所述的神经网络模型输入变量降维方法,其特征在于,所述获取样本数据之后,进一步包括:
分别对所述样本数据中的各变量数据进行归一化处理。


3.根据权利要求1所述的神经网络模型输入变量降维方法,其特征在于,所述分别计算最新的种群中各串结构数据对应的Heidke技巧评分具体为:
根据一串结构数据中取值为第一字符的位对应的变量,确定建模变量;
构建所述一串结构数据对应的人工神经网络,所述人工神经网络的输入层神经元的个数与所述建模变量的个数一致,输出层神经元的个数为2;
根据所述训练数据中的建模变量,对所述人工神经网络进行训练;
将所述测试数据中的建模变量输入训练后的人工神经网络,得到预报结果,所述预报结果为正样本结果或负样本结果;
分别统计所述测试数据中预报结果为正样本结果的正样本数据的数量和负样本数据的数量,以及预报结果为负样本结果的正样本数据的数量和负样本数据的数量,得到所述一串结构数据对应的预报结果参数;
根据所述预报结果参数以及测试数据的总数量,计算所述一串结构数据对应的Heidke技巧评分。


4.根据权利要求3所述的神经网络模型输入变量降维方法,其特征在于,所述预报结果参数包括第一值、第二值、第三值和第四值,所述第一值表示测试数据中预报结果为正样本结果的正样本数据的数量,所述第二值表示测试数据中预报结果为负样本结...

【专利技术属性】
技术研发人员:张彩云丁文祥李雪丁张友权李星郑祥靖郭民权丁萍陈金瑞朱本璐任在常
申请(专利权)人:厦门大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1