The invention discloses a near infrared material content indexing method based on similarity discriminant method, which comprises the following steps: the construction of the instrument features information through the following steps: acquiring portrait instrument portrait, and the feature information into a plurality of tag labels, obtain the weight of each label; content indexing steps: create content index table by key value distributed storage method, predictive value and content according to the content index table and the corresponding tag weights through similarity discriminant method to get the ingredients in the product; gradient prediction steps: according to the content of the predictive value of a gradient prediction value to users. The invention also discloses an electronic device for carrying out the above method and a computer-readable storage medium storing the above method. The method uses similarity discrimination instead of regression analysis to effectively solve the problem of inter station difference, and realizes the model sharing between the same instruments without using model transfer.
【技术实现步骤摘要】
基于相似度判别法的近红外光谱物质含量索引方法、设备及介质
本专利技术涉及近红外光谱中的定量分析
,具体涉及基于大数据分析技术,使用基于相似度判别法的近红外光谱物质含量索引方法(即不通过传统化学计量学建立回归模型的方法)来预测物质含量信息,从而解决仪器之间的台间差问题。
技术介绍
近红外光(NIR)是介于紫外-可见光(UV-Vis)和中红外(MIR)之间的电磁波,其波长范围为700~2500nm。近红外光能反映含氢基团X—H(如C—H、N—H、O—H等)振动的倍频和合频吸收,不同基团(如甲基、亚甲基、苯环等)或同一基团在不同化学环境中的近红外光吸收波长与强度都有明显差别。因此,近红外光非常适用于含氢有机物质的物化参数测量。基于现代化学计量学方法,近红外光谱既可以用于定量分析也可以用于定性分析。其中,针对定量分析,该技术应用实施过程中需要前期进行一些必要的准备工作,包括:(1)具有广泛代表性的定标和预测样品集的收集和成份理化定量分析;(2)定标和预测样品集的近红外光谱采集和光谱解析;(3)将物质待测理化成份的与(2)中所采光谱建立回归模型(定标模型);(4)使用 ...
【技术保护点】
一种基于相似度判别法的近红外光谱物质含量索引方法,其特征在于包括以下步骤:构建仪器画像步骤:通过仪器画像获取特征信息,并将所述特征信息划分多个标签,获取每个标签的标签权重;含量索引步骤:通过key‑value分布式存储方法创建含量索引表,并根据所述含量索引表以及对应的标签权重通过相似度判别法得到产品成分含量的含量预测值;梯度预测步骤:根据所述含量预测值建立梯度预测值,推送给用户。
【技术特征摘要】
1.一种基于相似度判别法的近红外光谱物质含量索引方法,其特征在于包括以下步骤:构建仪器画像步骤:通过仪器画像获取特征信息,并将所述特征信息划分多个标签,获取每个标签的标签权重;含量索引步骤:通过key-value分布式存储方法创建含量索引表,并根据所述含量索引表以及对应的标签权重通过相似度判别法得到产品成分含量的含量预测值;梯度预测步骤:根据所述含量预测值建立梯度预测值,推送给用户。2.如权利要求1所述基于相似度判别法的近红外光谱物质含量索引方法,其特征在于:所述构建仪器画像步骤包括以下步骤:步骤11、针对样品中某一种成分的含量,从样品中选取n个样本,并选取m台仪器;步骤12、通过理化检测获取所述n个样本中该种样品的成分含量,分别记作:y1、y2、…、yn;步骤13、使用每台仪器对每个样本进行光谱扫描,得到t个标签,每个标签包括n*m个值;步骤14、对于第1个标签,将扫描每个样本时的特征值作为因变量,将成分含量作为自变量,通过随机方式对数据进行训练集和测试集的划分;步骤15、基于训练集,使用最小二乘法建立回归模型,使用所述回归模型对测试集中的特征值进行计算得到预测的成分含量值;步骤16、将测试集中的预测的成分含量值与对应的真实成分含量进行比较,求出预测标准偏差SEP;步骤17、重复步骤14-16,直至所有的标签对应的预测标准偏差都计算完毕,计算得到的预测标准偏差SEP分别记作s1、s2、…、st;步骤18、通过步骤12计算得到该种样品的成分含量均值y0=(y1+y2+…+yn)/n;步骤19、结合步骤17和步骤18得到每个标签的标签权重,每个标签的标签权重分别记作w1、w2、…、wt,其中:步骤110、根据所述标签权重生成该种成本含量的权重向量(w1,w2,…,wt)。3.如权利要求2所述基于相似度判别法的近红外光谱物质含量索引方法,其特征在于:所述含量索引步骤包括以下步骤:步骤21、依据样品的不同条件将样品分为不同类别;所述样品的不同条件包括样品的品种、生长环境、产地、收集时间、供应商、处理方式;步骤22、对步骤21中所分的第一类别,以仪器画像中的t个标签作为用于含量索引的一系列属性值(a1,a2,…,an),以样品的成分含量作为索引结果的记录值,即所述记录值为y1、y2、…、yn;步骤23、以每个系列属性值为key,以其对应的记录值为value,即构成n个key与其对应value的数据对,将每个数据对均直接存入数据库中;步骤24、重复步骤22-23,直至所有类别中的数据对均存入数据库中,所述数据库构成含量索引表;步骤25、通过含量索引表中的系列属性值集合(a1,a2,…,an)*t与对应的t组标签进行相似度判别分析;对系列属性值集合(a1,a2,…,an)*t进行定义,定义第一个标签对应的系列属性值为(a11,a12,…,a1n),第i个标签(ai1,ai2,…,ain),1≤i≤t,则针对第i个标签,其与对应的第i个系列属性值(ai1,ai2,…,ain)进行相似度判别分析,得到第i个标签对应的相似度(zi1,zi2,…,zin);步骤26、从标签权重向量(w1,w2,…,wt)选取第i个标签对应的标签权重wi,求第i个标签对应的加权后的相似度集(zi1*wi,zi2*wi,…,zin*wi);步骤27、将所有标签对应的加权后的相似度集组合在一起,构成完整的加权相似度矩阵Zw:步骤28、对加权相似度矩阵Zw进行列相加,得到含量索引表中key对应的加权相似度组合(zw1,zw2,…,zwn),即第一个key对应zw1,第二个key对应zw2,第n个key类型对应zwn;其中,zw1=z11*w1+z21*w2+…+zt1*wt;zw1=z12*w1+z22*w2+…+zt2*wt;zwn=z1n*w1+z2n*w2+…+ztn*wt;步骤29、将加权相似度组合(zw1,zw2,…,zwn)由大到小排序,并得到将由大到小排序的加权相似度组合(zw1,zw2,…,zwn)对应的属性值key的由大至小排序得到属性值key的排序组合Kzw=[k1,k2,…,kn].sort(reverse=True),最好的属性值Kbest=max[k1,k2,…,kn],其中,属性值key中的k1对应加权相似度组合中的zw1,属性值key中的kn对应加权相似度组合中的zwn;步骤210、按有序的Kzw从含量索引表中依次查出每个属性值key对应的记录值,得到一组由由优至劣的含量预测值Ypredict=[y1,y2,…,yn].sort(reverse=True)其中,含量预测值Ypredict中的y1与排序组合Kzw中的k1对应,含量预测值Ypredict中的yn与排序组合Kzw中的kn对应。4.如权利要求3所述基于相似度判别法的近红外光谱物质含量索引方法,其特征在于:所述梯度预测步骤为:从所述含量预测值Ypredict选取前x个值建立梯度预测值Yx推送给用户,所述x为用户接收推荐值数量,Yx=(y1',y2',…,yx'),其中,y1'为含量预测值Ypredict的最大值;y2'为含量预测值Ypredict中除y1'外的最大值。5.如权利要求4所述基于相似度判别法的近红外光谱物质含量索引方法,其特征在于:所述方法还包括索引优化步骤:依据用户从梯度预测值中选择的特定预测值,对所述含量索引表进行更新;所述索引优化步骤包括以下步骤:步骤41、以y0'为记录值,以用户检测时的仪器画像作为系列属性值(a1,a2,…,an),所述y0'为用户从Yx=(y1',y2',…,yx')中选择的任意一个;步骤42、将y0'和系列属性值(a1,a2,…,an)加入到该类别样品的该种成分的记录值和属性值中,即y0'已被加入含量索引表中,完成该类别样品的该种成分的仪器画像、含量索引表和记录值的更新,更新后可被用于样品成分含量的预测。6.一种电子设备,其特征在于包括:一个或多个处理器;存储器;以及...
【专利技术属性】
技术研发人员:刘彤,潘涛,曾永平,肖青青,沈鸿平,凌亚东,
申请(专利权)人:广州讯动网络科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。