一种基于太赫兹光谱定性识别氨基酸混合物的方法技术

技术编号:33542054 阅读:32 留言:0更新日期:2022-05-21 09:52
本发明专利技术公开了一种基于太赫兹光谱定性识别氨基酸混合物的方法,首先通过分量空间模式分析CSP分析得到每个采样点某种化合物出现的概率化学图,然后通过卷积神经网络识别CSP分析的结果来确定混合物中是否存在特定成分。所提出的方法将使我们能够在单次测量中定性地检测未知混合物中的成分,并将用于现实生活中的生物分子检测。的生物分子检测。的生物分子检测。

【技术实现步骤摘要】
一种基于太赫兹光谱定性识别氨基酸混合物的方法


[0001]本专利技术属于太赫兹光谱和成像
,具体涉及一种基于太赫兹光谱定性识别氨基酸混合物的方法。

技术介绍

[0002]太赫兹波是一种波长介于红外线和微波之间的电磁波,由于处于光子学到电子学的过渡区域,其具有很多独特的属性,如指纹光谱性、低能性、特殊穿透性等。太赫兹波与性材料作用会产生独特的吸收谱

指纹谱。极性分子,如水分子,非极性分子,如二氧化碳分子,对太赫兹波的吸收有着非常明显的区别,因此太赫兹吸收谱对检验分子特性也有着重要价值。时域太赫兹光谱扫描技术利用高精度延时线将飞秒脉冲的采样时间延长至几十皮秒,并通过硬件预处理来降低噪声。由其产生的时域信号经傅里叶变换得到被检测物质的特征吸收谱,其谱宽可达5THz以上,动态范围可达70dB以上。这种频谱性能可满足绝大多数化合物的检测需求,从而为太赫兹时域光谱扫描提供了大量的应用场景。
[0003]鉴于太赫兹吸收光谱的指纹特性,对于物质识别分类具有重要应用。目前许多方法可以定性或定量地识别混合物的光谱,比如偏最小二乘法(PLS)、支持向量回归(SVR)等,然而,这些方法侧重于一维太赫兹光谱,往往受到振动峰的加宽和重叠性质的影响,并且仅在某些诱导和低湿度下才可行,因此在实际环境中使用起来很麻烦。因此,本专利技术基于分量空间模式分析和卷积神经网络提出一种从吸收光谱库中识别混合物质成分的方法

技术实现思路

[0004]为了解决上述问题,本专利技术旨在提供一种从吸收光谱库中识别混合物质成分的方法,首先通过分量空间模式分析CSP分析得到每个采样点某种化合物出现的概率化学图,然后通过卷积神经网络识别CSP分析的结果来确定混合物中是否存在特定成分。所提出的方法将使我们能够在单次测量中定性地检测未知混合物中的成分,并将用于现实生活中的生物分子检测。
[0005]为了实现上述目的,本专利技术涉及的一种基于太赫兹光谱定性识别氨基酸混合物的方法,具备包括以下步骤:
[0006]步骤1:采用透射式太赫兹时域系统对样品进行逐点扫描,得到氨基酸混合物样品采样点对应的太赫兹时域光谱数据;
[0007]步骤2:通过傅里叶变换将时域光谱数据转换成频谱数据,采用公式(1)

(2)计算吸收率,得到待测氨基酸混合样品采样点的吸收光谱图;
[0008][0009][0010]式中,n(ω)表示折射率,ω是角频率,φ(ω)表示在样品中传播引起的相位改变,c是真空中的光速,d是样品厚度,α(ω)表示吸收率,ρ(ω)表示样品和参考信号的幅值比;
[0011]步骤3:构建氨基酸混合物样品的太赫兹光谱数据矩阵F
N
×
L
,采用公式(4)计算得到矩阵P
M
×
L
,即氨基酸混合物样品的化学图;
[0012][P
M
×
L
]=([S
N
×
M
]t
[S
N
×
M
])
‑1[S
N
×
M
]t
[
FN
×
L], (4)
[0013]式中,L表示氨基酸混合物样品上的像素点,即采样点(事先将样品上的采样点的二维坐标转变为一维坐标,与L对应),N表示每一个像素点对应的N个太赫兹光谱数据频率分量,即F
N
×
L
为氨基酸混合物样品中L个采样点的太赫兹吸收光谱的N个频率分量组成的矩阵,S
N
×
M
表示已知的M种氨基酸的太赫兹光谱矩阵,每种氨基酸的太赫兹吸收光谱数据都有N个频率分量,即S
N
×
M
为已知的M种氨基酸的太赫兹吸收光谱的N个频率分量组成的矩阵,P
M
×
L
表示每个像素点出现某种氨基酸的概率,也被描述为化学图;
[0014]步骤4:采用公式(5)对P
M
×
L
中的每一个数据自适应阈值去除背景,高于该阈值像素值设置为1,否则为0,得到处理后的化学图;
[0015]C1=min(P)+C0[max(P)

min(P)] (5)
[0016]式中,C1表示阈值0;max(P)是矩阵P
M
×
L
中元素的最大值,min(P)是矩阵P
M
×
L
中元素的最小值;C0是[max(P)

min(P)]值范围的权重,设置为0.6;
[0017]步骤5:基于LeNet

5构建了一个卷积神经网络,对卷积神经网络进行训练;
[0018]步骤6:将按照步骤1到4得到的待测氨基酸混合物样品的化学图输入到训练好卷积神经网络中,输出样品中含有的氨基酸种类。
[0019]所述卷积神经网络包括依次相连的第一卷积

池化层、第二卷积

池化层、第一全连通层、第二全连通层和平面层,其中,6个卷积核组成第一卷积

池化层,16个卷积核组成的第二卷积

池化层,第一全连通层大小为120、第二全连通层的大小为大小为84,卷积滤波器的核大小为5,步进为1;两个全连通层将第二卷积

池化层的输出转换为平面层的线性输入,全连通层使用sigmoid激活函数进行二进分类,网络选择Adam训练策略,并使用二元交叉熵损失函数计算预测结果和数据标记之间的距离,训练的最大迭代次数为50,并在精度停止增长10个迭代期之后,提前终止训练。
[0020]本专利技术与现有技术相比具有以下有益效果:能够在室温和潮湿空气中从混合物中识别出不同成分的氨基酸,可达到100%的准确率。该方法克服了颗粒中高湿度和粒度分布不均等干旱条件的影响,具有在海关和机场等现实生活场景中定性检测生物分子的潜力。
附图说明:
[0021]图1为本专利技术采用的透射式太赫兹时域系统的实验装置图。
[0022]图2a为氨基酸混合物样品中某一个采样点的太赫兹时域光谱图。
[0023]图2b为氨基酸混合物样品中某一个采样点的太赫兹频谱图。
[0024]图2c为L亮氨酸的吸收光谱图。
[0025]图2d为L酪氨酸的吸收光谱图。
[0026]图2e为L亮氨酸和L酪氨酸1:1混合物的吸收光谱图。
[0027]图3a为纯L亮氨酸的化学图。
[0028]图3b为纯L酪氨酸的化学图。
[0029]图3c为L亮氨酸、L酪氨酸和peek的1:1:1混合物的化学图。红点代表L酪氨酸,绿点代表L亮氨酸,黄点代表两者共存。
[0030]图4a为6种氨基酸1:1二元混合物压片照片,从左上到右下依次为L亮氨酸和L缬氨酸、L亮氨酸和DL酪氨酸、L缬氨酸本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于太赫兹光谱定性识别氨基酸混合物的方法,其特征在于,具备包括以下步骤:步骤1:采用透射式太赫兹时域系统对样品进行逐点扫描,得到氨基酸混合物样品采样点对应的太赫兹时域光谱数据;步骤2:通过傅里叶变换将时域光谱数据转换成频谱数据,采用公式(1)

(2)计算吸收率,得到待测氨基酸混合样品采样点的吸收光谱图;率,得到待测氨基酸混合样品采样点的吸收光谱图;式中,n(ω)表示折射率,ω是角频率,φ(ω)表示在样品中传播引起的相位改变,c是真空中的光速,d是样品厚度,α(ω)表示吸收率,ρ(ω)表示样品和参考信号的幅值比;步骤3:构建氨基酸混合物样品的太赫兹光谱数据矩阵F
N
×
L
,采用公式(4)计算得到矩阵P
M
×
L
,即氨基酸混合物样品的化学图;[P
M
×
L
]=([S
N
×
M
]
t
[S
N
×
M
])
‑1[S
N
×
M
]
t
[F
N
×
L
],
ꢀꢀꢀ
(4)式中,L表示氨基酸混合物样品上的像素点,即采样点(事先将样品上的采样点的二维坐标转变为一维坐标,与L对应),N表示每一个像素点对应的N个太赫兹光谱数据频率分量,即F
N
×
L
为氨基酸混合物样品中L个采样点的太赫兹吸收光谱的N个频率分量组成的矩阵,S
N
×
M
表示已知的M种氨基酸的太赫兹光谱矩阵,每种氨基酸的太赫兹吸收光谱数据都有N个频率分量,即S
N
×
M
为已知的M种氨基...

【专利技术属性】
技术研发人员:王博朱新勇秦晓玲刘永利王玉建张朝惠
申请(专利权)人:青岛青源峰达太赫兹科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1