System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于神经网络的油莎豆含油率近红外分析模型及特征波长提取方法技术_技高网

一种基于神经网络的油莎豆含油率近红外分析模型及特征波长提取方法技术

技术编号:40930049 阅读:7 留言:0更新日期:2024-04-18 14:51
本发明专利技术涉及一种预测油莎豆含油率的近红外模型建立方法及特征波长提取方法,属于近红外光谱分析领域。本发明专利技术通过将MLP神经网络与PLS交叉验证相结合,提取油莎豆近红外光谱中与含油率相关的特征波长,使用筛选后的含油率相关特征近红外信息与含油率进行拟合,所得近红外模型精确度更好,预测能力大大提升,同时特征波长数更少。利用本发明专利技术所建立的近红外分析模型,只需测定油莎豆的近红外光谱信息,就能实现对油莎豆含油率的预测,实现快速、无损、准确的测定。

【技术实现步骤摘要】


技术介绍

0、技术背景

1、油莎豆是一种原产于非洲和地中海沿岸的高能作物,耐盐碱、干旱。其收获地下块茎部分,块茎形似椭圆形或类球形,成熟时含油量在20%~36%之间,亩产油量非常可观。并且油莎豆油脂中主要是脂肪酸和不饱和脂肪酸,富含维生素e和维生素c,品质上较大豆油花生油等食用油更好,更健康。作为新型油料作物,有着极高的发展潜力。在《全国种植业结构调整规划(2016—2020年)》中,被作为我国重点推荐种植的油料作物之一。油莎豆耐盐碱、干旱,抗逆性较强,最适宜在沙壤土中种植,作为进口大豆重要的替代性原料,对提高我国食用油自给自足率起着重要作用。油莎豆作为油料作物,含油率是其重要的品质性状,也是育种改良工作中重要的目标性状。实验室通常使用索氏提取法,测定样品中粗脂肪含量,这也是我国粮油分析首选的标准方法。但该方法实际操作时耗时较长,需要消耗大量试剂,在较大规模分析检测中不便操作,难以应用于早代育种材料的大规模分析,因此急需建立一种快速无损的油莎豆含油率检测方法以提高油莎豆种质资源开发利用效率。近红外光谱分析技术是一种高效快速的现代分析技术,是融合了光谱技术、信息学、化学计量学和计算机技术的一门交叉学科。近红外光谱波长在780-2526nm之间,与有机分子中含氢基团(如o-h、c-h、n-h等)震动吸收频率对应,能够提供不同分子特征的光谱信息。目前在油莎豆育种工作和品质分析中,还鲜有关于近红外分析技术的相关研究。

2、神经网络拥有强大的特征提取能力,但其算法常常被认为是黑箱,一般认为神经网络模型训练过程缺乏可解释性,以至无法充分利用神经网络超强的特征提取能力。多层感知器(mlp)人工神经网络模型是一种利用误差反向传播的前馈结构的神经网络,在多层感知机神经网络中,第一层连接权重参数显示了输入层隐含层之间的连接强度,可以用来衡量输入特征对隐含层神经元的贡献程度,理论上根据第一层权重参数可以筛选出对模型预测能力影响较大的变量,实现对特征变量筛选。


技术实现思路

1、为克服传统化学法测定油莎豆块茎含油率时费时、损伤育种材料的不足,针对现有技术存在的不足,本专利技术提供一种快速无损检测油莎豆块茎中含油率方法,通过将mlp神经网络模型的权重参数与交叉验证相结合提取近红外光谱的特征波长,提高了模型预测精度并简化模型。本专利技术通过以下技术方案得以实现:

2、1.收集不同产地不同品种的油莎豆样本,并采集波长范围950nm~1650nm的近红外光谱信息,导出光谱数据时分辨率设置为1nm。

3、2.通过化学方法(索氏提取法)测定油莎豆块茎中含油率的化学值。

4、3.采用基于蒙特卡洛交叉验证的方法剔除数据集中的异常样本。

5、4.将化学值与光谱数据一一对应,通过spxy算法以3:1的比例将数据集划分为校正集与验证集。

6、5.对原始光谱进行一阶导、二阶导、标准正态变换、多元散射校正、sg平滑及其他混合方法的预处理,筛选最佳预处理方法。

7、6.优选步骤5中效果最好的光谱预处理方法,将其作为mlp神经网络模型的输入进行训练,模型迭代后保存最优模型的参数。

8、7.以步骤6中最优模型链接权重参数计算个输入变量重要性的评价指标w

9、wi,j=(|xi,j|-|xi,j|min)/(|xi,j|max-|xi,j|min)

10、

11、xi,j为连接权重参数矩阵中的初始值,wi,j为归一化后的值。wi表示第i个输入变量的评价指标。i的范围为输入变量的个数,j为所设定隐含层神经元的个数。

12、8.设定阈值筛选出不同的变量子集,阈值取值范围00~max(w),并设定阈值采样间隔,以筛选出的子集建立plsr模型,通过交叉验证评价不同子集建模效果,筛选出最优变量子集,实现特征光谱提取。

13、9.未知油莎豆样品含油量的快速测定:将未知油莎豆样品经过预处理后,采集近红外光谱,代入步骤(8)筛选的的模型中,经过模型运算,即可获得油莎豆的含油量。

14、本专利技术有益效果

15、本专利技术初步建立了油莎豆含油率的近红外定量分析模型,并提出一种通过mlp人工神经网络模型进行波长选择的方法,该方法能够有效降低光谱信息重叠,滤除光谱中的无关信息,达到简化模型的目的。近红外模型能够准确预测油莎豆块茎含油率,为提高油莎豆育种材料早代选择效率提供有效可行的方法,为油莎豆品质无损检测提供参考方法。

本文档来自技高网...

【技术保护点】

1.一种油莎豆块茎含油率近红外光谱预测模型的建立方法,其特征在于,包括以下步骤:

2.如权利要求1所述的方法,其特征在于,步骤(1)所述,收集油莎豆材料100份以上,材料来自不同产地不同品种,按粒形分类为大圆粒、小圆粒、大长粒、小长粒;扫描光谱范围950~1650nm,最大分辨率0.5nm,每个样品扫描期间重装样1次,每次装保存平均光谱,导出光谱数据时设定分辨率为1nm。

3.如权利要求1所述的方法,其特征在于,步骤(2)所述,油莎豆含油率为13.82%~30.88%。

4.如权利要求1所述的方法,其特征在于,步骤(3)所述,通过SPXY算法按照3:1的比例将数据集划分为校正集与验证集。

5.如权利要求1所述的方法,其特征在于,步骤(4)所述,通过一阶导、二阶导、标准状态变换、多元散射校正、SG平滑以及混合方法对原始光谱进行预处理,并建立PLS模型,筛选出预测效果最好的预处理方法。

6.如权利要求1所述的方法,其特征在于,步骤(5)所述,通过tensorflow深度学习框架训练了一个3层结构的MLP神经网络模型,将预处理后的光谱作为神经网络的输入,相邻层之间为全连接,隐含层激活函数为relu;模型损失函数设置为mse,优化器及学习率设置为rmsprop(0.02);模型循环迭代次数设置为20000次,批量大小(batch_size)设置为7。

7.如权利要求1所述的方法,其特征在于,步骤(6)所述,模型第一层连接权重矩阵参数的正负,先将其分为正连接参数与负连接参数,然后分别统计计算他们的绝对值并作归一化处理,以消除量纲差异,将其记为w;式中xi,j为连接权重参数矩阵中的初始值,wi,j为归一化后的值;

8.如权利要求1所述的方法,其特征在于,步骤(7)所述,编写R语言程序以实现以下操作:通过设定不同的阈值来筛选出不同的变量子集,然后分别对每个变量子集进行PLSR建模,使用k折交叉验证计算不同变量子集建模结果,以RMSECV值作为评价标准,实现对最优变量子集的筛选。

9.采用权利要求1~8所述的方法建立的模型进行油莎豆含油量的检测方法,其特征在于,将未知油莎豆样品经过预处理后,采集近红外光谱,代入步骤(8)筛选的的模型中,经过模型运算,即可获得油莎豆的含油量。

...

【技术特征摘要】

1.一种油莎豆块茎含油率近红外光谱预测模型的建立方法,其特征在于,包括以下步骤:

2.如权利要求1所述的方法,其特征在于,步骤(1)所述,收集油莎豆材料100份以上,材料来自不同产地不同品种,按粒形分类为大圆粒、小圆粒、大长粒、小长粒;扫描光谱范围950~1650nm,最大分辨率0.5nm,每个样品扫描期间重装样1次,每次装保存平均光谱,导出光谱数据时设定分辨率为1nm。

3.如权利要求1所述的方法,其特征在于,步骤(2)所述,油莎豆含油率为13.82%~30.88%。

4.如权利要求1所述的方法,其特征在于,步骤(3)所述,通过spxy算法按照3:1的比例将数据集划分为校正集与验证集。

5.如权利要求1所述的方法,其特征在于,步骤(4)所述,通过一阶导、二阶导、标准状态变换、多元散射校正、sg平滑以及混合方法对原始光谱进行预处理,并建立pls模型,筛选出预测效果最好的预处理方法。

6.如权利要求1所述的方法,其特征在于,步骤(5)所述,通过tensorflow深度学习框架训练了一个3层结构的mlp神经网络模型,将预处理...

【专利技术属性】
技术研发人员:张斌魏海峰党锡强时学双米玛顿珠李长杰赤列措姆赵江涛达瓦卓玛拉姆赵倩王颖高文伟
申请(专利权)人:山东省农业科学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1