System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及配方维护方法,特别涉及一种基于近红外光谱的产品配方维护方法。
技术介绍
1、产品配方维护是企业的重要环节,主要体现在对原材料的深入研究和分析,以调整成分比例、替代原材料,改进生产工艺,从而提高产品的性能、质量、可持续性和降低成本。例如,实际生产中由于原材料的生产量有限,供应量和实际需求量存在差距,当某产品配方中一种或几种原料出现库存短缺或价格、质量方面的波动时,需要用另一种品质特征近似的原料来替换。因此寻找与这些原料在品质特征上最能接近的替代原料,而使整个产品的质量不受影响,保持该品牌产品质量的相对稳定性就成了研究的关键问题。
2、目前配方维护,一是依靠领域专家经验完成,对配方的预评价与修正亦由人工完成。这不仅对生产实施者要求甚高,而且易受生理因素、阅历、个人喜好等人为因素的影响,整个过程需要不断的反复,消耗大量人力物力。二是借助近红外光谱技术的快速分析方法,通过获得关于样品中含有的多种成分、浓度、结构等方面的详尽信息,并对光谱数据进行分析,实现产品的配方维护。但现在的研究基本都是在数值数据的背景下进行的,然而大多数真实世界的数据集同时包含分类属性和数值属性。例如,农产品易受产地、年份的影响,提取的光谱特征参数也有所变化,当待测样本的产地或年份发生改变时,模型的预测精度将会下降。因此大部分算法只能处理数值型数据,而无法考虑到混合属性的影响。因此急需一个能根据不同属性特点有效区分样本数据的配方维护方法。
技术实现思路
1、本专利技术的目的在于提供一种基于近红
2、本专利技术是通过如下措施实现的:一种基于近红外光谱的产品配方维护方法,其特征在于,包括:
3、采集原料样品的近红外光谱数据和与之对应的属性数据;
4、对每个样本构建数值型数据距离度量矩阵和属性距离度量矩阵,并结合构建混合型数据距离度量矩阵;
5、将得到的混合型数据距离度量矩阵构建高维空间中表示相似性的条件概率;
6、构建低维空间数据点对应高维空间的条件概率;
7、计算高维空间和低维空间两个概率分布之间的相似程度,利用熵正则化来加速传输距离的计算方法降低解的稀疏性得到转移计划矩阵,从而更新低维度空间的特征矩阵;
8、基于特征矩阵y进行相似原料的查找替换。
9、采集原料样品的近红外光谱数据和与之对应的属性数据,具体为:
10、数据x={x1,x2,...,xn}对于每一个xi(1≤i≤n),xi代表m(m=mn+mc)个属性其中表示mn个数值型数据,表示mc个分类型数据;
11、表示数值部分的第k个属性,表示分类部分的第k个属性;第k列分类属性的定义域表示为其中,t表示分类属性的个数。
12、对每个样本构建数值型数据距离度量矩阵和属性距离度量矩阵,并结合构建混合型数据距离度量矩阵,包括:
13、对于数值型数据,采用欧式距离计算和之间的距离公式如下:
14、
15、将计算得到的构建成一个反应数值型数据点之间的距离矩阵d(n),如下:
16、
17、其中,d(n)是一个n×n(n=n)的矩阵,对角线元素全是0,表示数据点自身与自身的距离,表示和之间的距离,
18、对于分类型数据,为每个属性分配权重k,用信息熵来计算各属性的权重;对于分类型数据,为考虑不同属性之间贡献度的差异,为每个属性分配权重k,因此距离度量矩阵可以写为:
19、
20、显然ωk是分类属性的权重,它表示对分类属性距离计算时的贡献程度。这里0≤ωk≤1,然后我们用信息熵来计算各属性的权重:对于给定分类型数据集的定义域中种类越多,分布越不均匀,则的信息熵越大,对距离的计算贡献程度越高,权重越大。因此的信息熵可以表示为:
21、
22、基于信息熵得到分类属性数据的距离基于信息熵得到分类属性数据的距离计算公式,如下:
23、
24、将计算得到的构建成一个反应分类型数据点之间距离的矩阵d(c),如下;
25、
26、d(c)是一个n的矩阵,对角线上元素全是0,表示数据点自身与自身的距离,表示和之间的距离,
27、将数值型距离度量矩阵与分类型距离度量矩阵相结合,计算得到混合属性的数据点之间的距离dij(xi,xj),公式如下:
28、
29、由于和的取值范围都在0~1之间,为保证两式相加后的结果也在0~1之间,采用上式的加权方式。
30、将计算得到的dij(xi,xj)构建成混合型数据距离度量矩阵。
31、将得到的混合型数据距离度量矩阵构建高维空间中表示相似性的条件概率,包括,采用t分布随机邻居嵌入在高维空间构建近红外光谱的概率分布的过程,具体如下:
32、假设在高维欧氏空间rd中有n个d维数据集x={x1,x2,x3,...,xn},xi∈rd,(i=1,2,3,...n),计算数据点xi与xj之间的概率分布pj|i,以高斯概率分布表示样本的位置信息,公式如下:
33、
34、其中,为以数据点xi为中心的高斯均方差。对于高维数据点xi、xj映射到低维空间的yi、yj,同样采用高斯分布重构局部邻域信息,计算yi和yj之间的概率分布qj|i。
35、构建低维空间数据点对应高维空间的条件概率,包括,在低维空间中,对于低维特征矩阵y={y1,y2,y3,...,yn}使用更重长尾分布的t分布来表达低维空间内两点之间的相似度,在t分布下第i个样本分布在样本j周围的概率qj|i,计算如下:
36、
37、引入sinkhorn距离计算高维空间和低维空间两个概率分布之间的相似程度d(p,q):利用熵正则化来加速传输距离的计算方法降低解的稀疏性得到转移计划矩阵t从而更新低维度空间的特征矩阵y。
38、基于特征矩阵y进行相似原料的查找替换,包括,通过特征矩阵y,计算产品原料之间的距离,根据距离最小值找出和目标原料相似度最高、品质特征最接近的代替原料。
39、本实施例中提供了一种存储介质,存储有计算机程序,其特征在于,该计算机程序被处理执行时,实现所述的基于近红外光谱的产品配方维护方法。
40、本实施例中提供了一种基于近红外光谱的产品配方维护方法的应用,其特征在于,应用产品为卷烟产品,其中属性数据一般包括烟草的产地、烟草的部位和烟草的档次。
41、本专利技术实施例提供的技术方案带来的有益效果是:以往的配方维护依赖人工处理和数据输入容易出现错误,可能导致不正确的配方更新,从而影响产品质量和合规性。传统近红外光谱数据通常又具有高维度、高冗余、非线性的特性,而且大部分数据往往涵盖了多种属性特征。这多属性特征的存在会对样本之间的相似性度量结果产生影响,降低了准确性。本专利技术基于sinkhorn距离联合多属性的t分布随机近邻嵌入方本文档来自技高网...
【技术保护点】
1.一种基于近红外光谱的产品配方维护方法,其特征在于,包括:
2.根据权利要求1所述的基于近红外光谱的产品配方维护方法,其特征在于,采集原料样品的近红外光谱数据和与之对应的属性数据,具体为:
3.根据权利要求1所述的基于近红外光谱的产品配方维护方法,其特征在于,对每个样本构建数值型数据距离度量矩阵和属性距离度量矩阵,并结合构建混合型数据距离度量矩阵,包括:
4.根据权利要求1所述的基于近红外光谱的产品配方维护方法,其特征在于,将得到的混合型数据距离度量矩阵构建高维空间中表示相似性的条件概率,包括,采用t分布随机邻居嵌入在高维空间构建近红外光谱的概率分布的过程,具体如下:
5.根据权利要求1所述的基于近红外光谱的产品配方维护方法,其特征在于,构建低维空间数据点对应高维空间的条件概率,包括,在低维空间中,对于低维特征矩阵Y={y1,y2,y3,...,yn}使用更重长尾分布的t分布来表达低维空间内两点之间的相似度,在t分布下第i个样本分布在样本j周围的概率qj|i。
6.根据权利要求1所述的基于近红外光谱的产品配方维护方法,
7.一种权利要求1-6任一项所述的基于近红外光谱的产品配方维护方法的应用,其特征在于,应用产品为卷烟产品。
8.根据权利要求7所述的应用,其特征在于,属性数据包括烟草的产地、烟草的部位和烟草的档次。
...【技术特征摘要】
1.一种基于近红外光谱的产品配方维护方法,其特征在于,包括:
2.根据权利要求1所述的基于近红外光谱的产品配方维护方法,其特征在于,采集原料样品的近红外光谱数据和与之对应的属性数据,具体为:
3.根据权利要求1所述的基于近红外光谱的产品配方维护方法,其特征在于,对每个样本构建数值型数据距离度量矩阵和属性距离度量矩阵,并结合构建混合型数据距离度量矩阵,包括:
4.根据权利要求1所述的基于近红外光谱的产品配方维护方法,其特征在于,将得到的混合型数据距离度量矩阵构建高维空间中表示相似性的条件概率,包括,采用t分布随机邻居嵌入在高维空间构建近红外光谱的概率分布的过程,具体如下:
5.根据权利要求1所述的基于近红外光谱的产品配方维护方法,其特征...
【专利技术属性】
技术研发人员:秦玉华,张金凤,张炜,田荣坤,张皓,
申请(专利权)人:青岛科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。