一种傅里叶近红外干涉信号虚拟生成评价方法及系统技术方案

技术编号:39782635 阅读:13 留言:0更新日期:2023-12-22 02:25
本发明专利技术提供了一种傅里叶近红外干涉信号虚拟生成评价方法及系统,所述方法包括获取实验样本,采集实验样本的干涉信号;对初始样本数据进行平滑处理,以得到样本真实数据;将样本真实数据输入预设虚拟生成模型中进行数据扩充,将数据扩充得到的数据作为样本虚拟数据;基于预设评价算法对样本虚拟数据进行数据评价,以得到样本虚拟数据的评价值,基于评价值对样本虚拟数据进行筛选,以得到可用虚拟数据,本发明专利技术通过改进传统的预设虚拟生成模型扩充了真实样本的数量,丰富了样本的特征信息,填补了样本之间的信息间隙,同时针对真实数据与虚拟数据从相似性

【技术实现步骤摘要】
一种傅里叶近红外干涉信号虚拟生成评价方法及系统


[0001]本专利技术属于信号生成与评价的
,具体地涉及一种傅里叶近红外干涉信号虚拟生成评价方法及系统


技术介绍

[0002]近红外光谱因其无损

分析速度快

环境友好等优点,近年来被广泛应用于各领域,它主要反映了含氢基团
(C

H、N

H、O

H

)
振动的合频和倍频在不同化学环境中的吸收特性

一般情况下,
NIR
技术需要跟化学计量学方法结合,通过构建稳健的多元模型,对有机化合物的组成与性质进行测量,是一种便捷的测量技术,通常情况下,一个好的模型要求模型训练时包含足够多且具有代表性的样本,所以,样本的数量对模型的稳健性和精度影响很大,但在实际生活中,面临着稀缺数据难以获取,反例样本较少的情况,导致被采集的数据不能完整且准确地表达样本的特征空间,无法满足数据驱动建模的精度和适用性,因此为了增加模型的稳健性,需要开展虚拟样本的构建

[0003]生成对抗网络方法通常用于图像的生成,但在近红外光谱数据的生成方面,面临着一些独特的挑战,近红外光谱是一种用于分析物质成分的工具,其谱峰信息对于确定物质的特性至关重要,然而,与图像不同,近红外光谱的特征不是视觉特征,而是关于波长和吸收强度的数据,生成近红外光谱难度较大的原因之一是可见特征不足

通常情况下,近红外光谱的特征谱峰信息较少,这使得生成模型需要克服信息的匮乏

由于光谱数据的高维性和复杂性,
GAN
模型需要能够捕获并合成适当的波长特性,以生成有意义的光谱数据,为了克服这些挑战,可以通过近红外光谱信息变换和改进生成模型的架构和训练方法来解决这一难题,并且通过选择合理的生成评价标准以确保生成的虚拟样本与真实样本相匹配

[0004]而在现有技术中,存在以下缺点:
1、
虚拟样本生成方法要求真实样本具有较高的维数

虚拟样本生成方法通常针对高维数据,如图像,进行开发和优化

对于一维光谱信号生成来说,确实存在一些挑战和限制,(1)信息量有限

一维光谱信号通常包含的信息相对较少,因为它们只涉及光的吸收或反射数据点,相比之下,二维图像包含了丰富的空间信息,这种信息的有限性会导致生成模型难以捕获和合成复杂的特征;(2)约束条件不足

光谱信号的生成通常受到的约束条件有限

在图像生成中,可以使用丰富的视觉特征来指导生成模型

但在光谱信号中,约束条件较少,这使得模型难以获得足够的参考信息来生成高质量的虚拟信号;(3)慢收敛速度

由于信息的有限性和约束条件的不足,一维光谱信号生成模型可能需要更长的时间才能收敛到合适的结果

这可能需要更多的训练迭代和更复杂的模型架构;(4)生成质量低

由于以上挑战,一维光谱信号生成模型可能会生成质量较低的虚拟信号,其中可能存在噪音

不连续性或不合理的特征

[0005]2、
传统的
GAN
在生成虚拟样本方面存在诸多不足

在处理图像生成任务时,传统
GAN
方法的不足之处包括:(1)训练不稳定性

传统
GAN
在训练过程中往往更容易出现训练不稳定的问题,例如模式坍塌
(
生成器只生成相似的样本
)
或梯度消失
/
梯度爆炸问题

这导致
生成器
(G)
和判别器
(D)
难以收敛到合适的状态

(2)缺乏结构化特征

传统
GAN
在没有明确的结构约束的情况下生成图像,因此生成的样本可能缺乏高级语义结构和特定的视觉特征

(3)处理复杂数据的困难

对于处理复杂的高维数据
(
如高分辨率图像或多通道数据
)
来说,传统
GAN
往往表现不佳,因为它们没有专门的结构来处理这些情况

这可能导致生成的样本质量下降

(4)需要更多的训练数据

传统
GAN
通常需要更多的训练数据才能获得良好的生成性能

这对于一些应用来说可能是一个不足之处,因为获取大规模训练数据可能是困难和昂贵的

(5)对超参数敏感

传统
GAN
的性能对于超参数的选择非常敏感,包括学习率

模型复杂度

正则化参数等

因此,需要花费更多的时间和精力来调整这些超参数

[0006]3、
生成的虚拟样本与真实样本匹配度的评价指标单一

对生成样本质量的评价标准相对单一

通常情况下,生成的样本质量主要通过以下标准进行评估:(1)视觉评估

这是最直观的评估方法,人们通过观察生成的图像来判断其质量

高质量的生成图像通常具有真实性

清晰度

细节和多样性

但这种评估方式主观性较强,不容易量化

(2)固定统计指标

这些指标用于量化生成图像的质量,包括像素级别的指标如均方误差
(MSE)
和结构相似性指数
(SSIM)
,以及基于深度学习的指标如
Inception Score

FID。
然而,这些指标通常只能捕捉到生成图像的一些方面,而不是全面评估其质量

(3)人工评估

通过在真实人类评审者中获取反馈,可以更全面地评估生成图像的真实性

多样性和语义合理性

但这种方法耗时

成本较高且不准确


技术实现思路

[0007]为了解决上述技术问题,本专利技术提供了一种傅里叶近红外干涉信号虚拟生成评价方法及系统,用于解决现有技术中的技术问题

[0008]一方面,该专利技术提供以下技术方案,一种傅里叶近红外干涉信号虚拟生成评价方法,包括:获取实验样本,并使用
FT

NIR
光谱仪采集所述实验样本的干涉信号,将所述实验样本的干涉信号进行导出,以得到初始样本数据;采用多项式平滑算法对所述初始样本数据进行平滑处理,将平滑后的数据作为样本真实数据;将所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种傅里叶近红外干涉信号虚拟生成评价方法,其特征在于,包括:获取实验样本,并使用
FT

NIR
光谱仪采集所述实验样本的干涉信号,将所述实验样本的干涉信号进行导出,以得到初始样本数据;采用多项式平滑算法对所述初始样本数据进行平滑处理,将平滑后的数据作为样本真实数据;将所述样本真实数据输入预设虚拟生成模型中进行数据扩充,将数据扩充得到的数据作为样本虚拟数据;基于预设评价算法对所述样本虚拟数据进行数据评价,以得到所述样本虚拟数据的评价值,基于所述评价值对所述样本虚拟数据进行筛选,以得到可用虚拟数据,将所述可用虚拟数据添加到所述样本真实数据中;所述采用多项式平滑算法对所述初始样本数据进行平滑处理,将平滑后的数据作为样本真实数据的步骤具体为:采用预设平滑公式对所述初始样本数据在移动窗口内的数据进行多项式分解并使用最小二乘法对移动窗口内的数据进行数据拟合,以得到样本真实数据,其中,所述预设平滑公式为:,;式中,为样本真实数据,为归一化因子,为中点波长点左右两侧的窗口数量,为波长点的观测值,为平滑系数
。2.
根据权利要求1所述的傅里叶近红外干涉信号虚拟生成评价方法,其特征在于,在所述将所述样本真实数据输入预设虚拟生成模型中进行数据扩充,将数据扩充得到的数据作为样本虚拟数据的步骤中,预设虚拟模型为:;式中,为鉴别器,为生成器,为数学期望,为样本真实数据,表示的分布,表示来源于真实数据的分布,表示生成器生成的虚拟数据,表示的分布,表示输入的随机噪声信号,表示虚拟数据属于真实数据的概率
。3.
根据权利要求1所述的傅里叶近红外干涉信号虚拟生成评价方法,其特征在于,所述基于预设评价算法对所述样本虚拟数据进行数据评价,以得到所述样本虚拟数据的评价值,基于所述评价值对所述样本虚拟数据进行筛选,以得到可用虚拟数据的步骤包括:采用
PCCs
算法计算所述样本虚拟数据中数据的第一评价值,并基于所述第一评价值对所述样本虚拟数据中的数据进行第一次筛选,以得到第一筛选虚拟数据;通过
t

SNE
算法将所述第一筛选虚拟数据与所述样本真实数据投影至二维空间中,并分别确定所述第一筛选虚拟数据的第一置信区间与所述样本真实数据的第二置信区间,基于所述第一置信区间与所述第二置信区间对所述第一筛选虚拟数据进行第二次筛选,以得到第二筛选虚拟数据;将所述第二筛选虚拟数据与所述样本真实数据输入预设识别模型中进行第三次筛选,
以得到可用虚拟数据
。4.
根据权利要求3所述的傅里叶近红外干涉信号虚拟生成评价方法,其特征在于,所述采用
PCCs
算法计算所述样本虚拟数据中数据的第一评价值,并基于所述第一评价值对所述样本虚拟数据中的数据进行第一次筛选,以得到第一筛选虚拟数据的步骤包括:通过
PCCs
计算公式计算所述样本虚拟数据中的数据的第一评价值:;式中,为第一评价值,为样本真实数据对应的点观测值,为样本虚拟数据对应的点观测值,为样本数量,为样本真实数据的平均值,为样本虚拟数据的平均值;将第一评价值小于评价阈值的数据从所述样本虚拟数据中剔除,以得到第一筛选虚拟数据
。5.
根据权利要求4所述的傅里叶近红外干涉信号虚拟生成评价方法,其特征在于,所述通过
t

SNE
...

【专利技术属性】
技术研发人员:郝勇李西艳张承祥吴智勇
申请(专利权)人:华东交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1