当前位置: 首页 > 专利查询>吉林大学专利>正文

一种药用真菌近红外光谱分析方法技术

技术编号:21375302 阅读:83 留言:0更新日期:2019-06-15 12:35
本发明专利技术提供一种药用真菌近红外光谱分析方法,针对原始光谱数据进行完全自主的光谱预处理和特征波段提取的近红外光谱分析(ABRN),通过Attention模块实现对原始光谱进行增强特征波段,减弱噪声波段的自动预处理,然后使用残差神经网络对经Attention模块处理后的光谱数据进行特征提取和最终的含量预测。解决了在原始近红外光谱数据中大量噪声波段影响对特征波段选取准确性的问题,以及需要依赖专家经验进行人为的特征预处理而造成的一些微小特征的丢失,本发明专利技术针对原始近红外光谱无需人为干预,实现对原始近红外光谱中特征波段的自动提取以及活性成分含量的预测。

【技术实现步骤摘要】
一种药用真菌近红外光谱分析方法
本专利技术提供一种药用真菌近红外光谱分析方法,用于中药材的有效成分的快速检测,属于中药材活性成分分析

技术介绍
药用真菌,如冬虫夏草,牛樟芝和松茸等,具有增强人体免疫力,抗肿瘤和抗癌的功效,药用真菌中的活性成分可用于广泛的临床治疗,并且这些成分可通过近红外光谱快速检测,近红外光谱(NIRS)是一种方便,快速,无侵入性的分析方法,已应用于药用真菌数据的定量分析。通过扫描样品的近红外光谱,可以记录分子中单个化学键的频率信息,由于NIRS的优势,研究人员可以快速准确地分析药用真菌中各种活性成分的含量,当前已有很多近红外光谱分析方法,如偏最小二乘法(PLS)和径向基函数神经网络(RBFNN)等,均显示出良好的预测精度和性能。如MengQF等人使用PLS方法通过采用最佳波长建立令人满意的NIRS校准模型;KimG等人使用最大归一化预处理技术消除光谱中无关噪声;LuJH等人使用基于小波变换预处理的RBFNN分析近红外光谱,同时移动窗口方法被用作为原始光谱数据输入RBFNN模型前的一个预处理步骤,通过使用度近似作为标准来选择特征波长变量;JintaoX等人使用人工神经网络(ANN)通过进行提取主要成分的预处理,对比了PLS和ANN,验证了ANN具有更优的非线性拟合性能;LiuT等人深度自动编码器(DAE),可以通过将高维数据转换为具有线性和非线性组合特征的低维码来从近红外光谱数据中提取有效特征。目前面临的问题是由于近红外光谱数据维度高信息复杂的特点,在原始近红外光谱数据中存在大量的噪声波段,这会影响对特征波段选取的准确性,因此,当前近红外光谱方法需要对原始近红外光谱进行人为的特征选取预处理,这些预处理方法需要依赖专家的经验,这样会由于认为的因素而丢失原始光谱中一些微小但重要的特征峰。
技术实现思路
本专利技术提供了一种药用真菌近红外光谱分析方法,针对原始光谱数据进行完全自主的光谱预处理和特征波段提取的近红外光谱分析(ABRN),通过Attention模块实现对原始光谱进行增强特征波段,减弱噪声波段的自动预处理,然后使用残差神经网络对经Attention模块处理后的光谱数据进行特征提取和最终的含量预测。解决了在原始近红外光谱数据中大量噪声波段影响对特征波段选取准确性的问题,以及需要依赖专家经验进行人为的特征预处理而造成的一些微小特征的丢失,本专利技术针对原始近红外光谱无需人为干预,实现对原始近红外光谱中特征波段的自动提取以及活性成分含量的预测。本专利技术公开的一种药用真菌近红外光谱分析方法,其技术解决方案如下:1)数据源采集、存储药用真菌的近红外光谱图,记录药用真菌内活性成分的含量值,并保存为excel表格形式作为实验数据集。2)构建ABRNABRN主体分为两个部分,即Attention模块和残差网络,在传统残差网络的输入层之前,加入Attention模块进行对原始光谱数据的自动预处理,得到预处理后的数据直接作为残差网络的新输入。a.Attention模块Attention模块作为特征权重重新分配的自动预处理,由输入层,特征分布比例重分配层,相似度计算层以及矩阵变维层构成。原始长序列光谱输入向量(XSD)定义为(1)式中:XSD表示原始输入向量;num表示样本的数量;k表示样本序号;将原始输入向量先输入至Attention模块的输入层中,然后通过特征分布比例重分配层中的softmax函数重新计算原始输入向量中各个特征所占比重,softmax函数如下所示:(2)式中:i表示向量维度序号;softmax表示归一化指数函数;表示XSD经过softmax函数计算得到的输出。将特征分布比例重分配层的输出与原始输入向量共同输入至相似度计算层,通过如下函数计算二者的相似度:(3)式中:表示特征权重方阵;i,j均表示向量维度序号;n表示向量总维度;exp表示以自然常数e为底的指数函数。将特征权重方阵与XSD进行矩阵乘法操作,计算与XSD的每个维度相对应的特征权重重分配向量,如下所示:(4)式中:表示重新分配权重后向量的第j维。将Attention模块的自动预处理之后的特征增强噪声减弱的新向量,通过矩阵变维层将一维光谱向量转换为二维光谱矩阵,该矩阵作为Attention模块最终的输出。b.残差网络Attention模块的输出向量直接作为第二部分残差网络输入层的输入向量,残差网络主要由两种残差块组成,即identity块和convolution块。残差网络共分为五个不同的阶段,每个阶段的输入均为前一阶段的输出,阶段1的输入即为Attention模块的输出:阶段1是标准卷积层;阶段2是一个convolution块后添加两个identity块;阶段3是一个convolution块后添加三个identity块;阶段4是一个convolution块后添加五个identity块;阶段5与阶段2相同;最后将阶段5的输出矩阵经过均值池化操作后,展开为一维向量输入至最后的全连接网络,进行最终的非线性预测,最终输出对药用真菌中活性成分的预测值。本专利技术的积极效果在于:本专利技术相对于现有技术,优势在于无需依赖专家经验对原始光谱数据进行人为的特征选取以及去除噪声的预处理,实现了完全自主的特征波段强化,噪声波段减弱的预处理,解决了由于经验不足等人为因素所导致的误差对原始近红外光谱特征提取以及活性成分含量预测的准确性。附图说明:图1为本专利技术整体结构流程图;图2为本专利技术Attention模块结构图;图3为本专利技术残差网络中identity块和convolution块的结构图;图4为本专利技术牛樟芝样本(A)和松茸样本(B)的近红外光谱图。具体实施方式:通过以下实施例进一步举例描述本专利技术,并不以任何方式限制本专利技术,在不背离本专利技术的技术解决方案的前提下,对本专利技术所作的本领域普通技术人员容易实现的任何改动或改变都将落入本专利技术的权利要求范围之内。实施例11)采集、存储165个牛樟芝样本和200个松茸样本的近红外光谱图,如图4所示,使用日本岛津UV-3150型紫外可见近红外分光光度计和日本岛津ISR-3100积分球附件对牛樟芝样本和松茸样本进行扫描,扫描波长范围为800-2500nm,光谱带密度为12nm,以硫酸钡对照品作为空白对照,光谱采样间隔为1nm,每个样品进行3次光谱扫描,最终取平均值最为样品的光谱数据,并使用化学试剂通过侵入式方法分别测量牛樟芝样本中多糖与三萜以及松茸样本中多糖与麦角固醇共4种活性成分的含量,并将这4组数据记录为excel表格形式作为实验数据集,对这4组数据集进行划分,每组数据集中随机选取该组总数量的80%作为训练集,剩余20%作为验证集。2)构建ABRN,如图1所示,分别构建ABRN中Attention模块和残差网络,将Attention模块的输出结果直接输入至残差网络中进行特征波段提取,以及最终的活性成分含量预测,具体步骤如下:a.Attention模块定义165个牛樟芝样本的原始光谱输入向量和200个松茸样本的原始光谱输入向量为:其中i表示向量维度序号,k表示样本序号。将定义好的原始光谱输入向量矩阵输入至Attention模块的输入层中,如图2所示,先经过特征分布比例重分配层中的softmax函数重新计算原始输入向量本文档来自技高网
...

【技术保护点】
1.一种药用真菌近红外光谱分析方法,包括以下步骤:1)数据源采集、存储药用真菌的近红外光谱图,记录药用真菌内活性成分的含量值,并保存为excel表格形式作为实验数据集;2)构建ABRNABRN主体分为两个部分,即Attention模块和残差网络,在传统残差网络的输入层之前,加入Attention模块进行对原始光谱数据的自动预处理,得到预处理后的数据直接作为残差网络的新输入:a.Attention模块Attention模块作为特征权重重新分配的自动预处理,由输入层,特征分布比例重分配层,相似度计算层以及矩阵变维层构成;原始长序列光谱输入向量(XSD)定义为:

【技术特征摘要】
1.一种药用真菌近红外光谱分析方法,包括以下步骤:1)数据源采集、存储药用真菌的近红外光谱图,记录药用真菌内活性成分的含量值,并保存为excel表格形式作为实验数据集;2)构建ABRNABRN主体分为两个部分,即Attention模块和残差网络,在传统残差网络的输入层之前,加入Attention模块进行对原始光谱数据的自动预处理,得到预处理后的数据直接作为残差网络的新输入:a.Attention模块Attention模块作为特征权重重新分配的自动预处理,由输入层,特征分布比例重分配层,相似度计算层以及矩阵变维层构成;原始长序列光谱输入向量(XSD)定义为:(1)式中:XSD表示原始输入向量;num表示样本的数量;k表示样本序号;将原始输入向量先输入至Attention模块的输入层中,然后通过特征分布比例重分配层中的softmax函数重新计算原始输入向量中各个特征所占比重,softmax函数如下所示:(2)式中:i表示向量维度序号;softmax表示归一化指数函数;表示XSD经过softmax函数计算得到的输出;将特征分布比例重分配层的输出与原始输入向量共同输入至相似度计算层,通过如下函数计算二者的相似度:(3)式中:表示特征权重...

【专利技术属性】
技术研发人员:白天郭书宇姚刚罗晓腾乐生张梦芮黄岚
申请(专利权)人:吉林大学
类型:发明
国别省市:吉林,22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1