基于凸组合核函数主成分分析的太赫兹光谱特征提取方法技术

技术编号:12783640 阅读:99 留言:0更新日期:2016-01-28 03:32
本发明专利技术公开基于凸组合核函数主成分分析的太赫兹光谱特征提取方法,属光谱分析及物质种类检测技术领域。本发明专利技术所述方法首先获取时域观测信号,经过离散傅立叶变换得到的太赫兹频谱曲线,将噪声信息滤除,然后对频谱曲线进行三次样条差值,截取可比的相同频率范围内数据进行重采样,完成数据归一化处理;对预处理完成的样本进行凸组合核函数映射,对映射后的基函数矩阵进行降维,最终实现太赫兹光谱特征提取,并对降维后数据的簇内、簇间关系进行分析。本发明专利技术所述方法不要求光谱样本的数量和高分辨率,并可以充分降低干扰信号对特征提取的影响,在物质种类和数量未知的情况下,实现太赫兹频域光谱的特征提取和低维表示,具有明显的聚类效果。

【技术实现步骤摘要】

本专利技术设及,属光谱分 析及物质种类检测

技术介绍
在光谱物质检测领域,从19世纪末即开始有学者从事红外和拉曼光谱的研究工 作,经过几十年发展历程,使得基于红外吸收和散射谱及其峰值特征的物质鉴别技术发展 较为完备。然而,红外频段的常用光区,中红外频段,对应着分子中小基团的振动和转动跃 迁,如Ξ原子、二原子基团,且此类小基团在此频段的振动频率与大分子中其他的次级结构 没有明显相关性。在振动过程中,红外吸收对应着偶极矩变化,拉曼散射对应着极化率变 化,两者在信息上的互补性使得他们在有机功能团的研究方面成为最广泛使用的方法。 相对的,在更低频率区域的"远红外频段",在红外与微波之间的频率,则被称为 "太赫兹空隙",此频段长时间未得到充分的研究和利用。随着超快激光技术的发展,太赫兹 波发射源技术瓶颈得W突破,太赫兹波与物质相互作用的独特性质渐渐成为了近十年来的 研究热点。在红外振动频率W下的非局域振动模型,如分子内振动、骨架震动、分子间弱相 互作用等都对应于太赫兹频段。且由于太赫兹波的能量相较于X射线和红外光都低几个数 量级,且对于非极性物质具有良好的穿透性,所W该技术在安全检测、生物医学、物质识别 方面都有着重要的应用。 由于太赫兹时域光谱技术相对于红外光谱及X射线技术具有更高的信噪比(最高 可达1〇1°),并且太赫兹时域光谱经过FFT变换后,频域波形具有"指纹性"特征,所W特定 物质的波形特征可作为物质识别的可靠依据。然而使用传统方法对频域光谱进行特征提取 时,通常采用人工峰值标定和初级特征匹配算法,没有对光谱曲线上的各数据点进行有效 性判断。人工判断时大多简单地利用吸收峰对光谱进行标注,而初级特征提取算法没有考 虑不同光谱样本与算法的结合度。运些缺点都会带来特征区分度不明显、特征向量维数过 低的问题,所W传统方法对光谱数据的特征提取存在不确定性,会大大提高物质光谱分类 的误差。
技术实现思路
针对W上存在问题,提出了一种基于凸组合核函数主成分分析的太赫兹光谱特征 提取方法;该方法不要求光谱样本的数量和高分辨率,并可W充分降低干扰信号对特征提 取的影响,在物质种类和数量未知的情况下,实现太赫兹频域光谱的特征提取和低维表示, 具有明显的聚类效果。 本专利技术是运样实现的: 首先搭建太赫兹时域光谱透射式探测平台,通过光电取样晶体和光电采样电路获得太赫兹 时域波形;通过离散傅里叶变换将时域波形转换到频域,并利用Savitzky-Golay滤波器去 除高频噪声,平滑原数据序列;对不同的数据样本进行等分辨率处理,统一进行Ξ次样条差 值并重采样;构造归一化的样本矩阵并设计凸组合核函数进行特征空间映射;利用主成分 分析法对映射后样本降维,提取其中Ξ个维度作为每个样本光谱的特征,在3维空间表示 各个样本之间的关系,最终实现各物质所对应光谱的特征提取及分类。 所述的,具体步骤如 下: (1) 首先通过太赫兹时域光谱系统测得物质样本的时域光谱数据,检测的物质种类不 少于两类,统一谱线纵坐标为透射率,横坐标为频率,获取数据序列A,数据不少于两组,每 个样本的时域光谱数据序列A通过离散傅里叶变换,得到信号. 其中,i表示第i个样本,m表示转换后频谱数据序列的维数; (2) 对每个样本的太赫兹频域光谱数据-做Savitzky-Golay滤波,得到滤波后光谱 ik:; (3) 将步骤(2)中得到的滤波数据麥趣进行Ξ次样条插值,使每组光谱数据序列的维数 m增加到5000W上; (4) 统一截取各组光谱数据中太赫兹吸收特征较为明显且可比的频段,并进行等分辨 率重采样,使每组光谱数据序列的维数m达到500W上,至此得到统一分辨率、频段的多组 太赫兹频谱数据; (5) 所有样本除去横坐标,将纵坐标处理为列向量并合并为一个??矩阵&m为样本 维数,η为样本数,然后使用极大似然估计法对矩阵的本征维数a进行估计; (6) 利用凸组合核函数鹿,寒接繫为运 里采用的3种核函数,分别为:利用核差异评价方法,在归一化后的样本矩阵5'上构造最优凸组合函数的非线性规划 问题:其中为最优凸组合核差异,%为单一核函数核差异,解=蕉盛瑕#"如:,:於为 样本所属物质类别的标签组成的向量;约束条件为:其中,矩阵&和分别对应于核函数笔:的核矩阵,核矩阵的内积表示为:对此非线性规划问题求解,得到最优组合的1,解出最优凸组合核函数CCK; (7) 通过凸核函数将归一化的光谱样本矩阵映射至特征空间療W,k为此特征空间的维 数,η为样本个数,藻驾議; (8) 使用主成分分析法将每个样本的a个主要特征提取出来,并根据需要取其中Ξ个 维度数据于Ξ维空间中表示出来。 优选的,本专利技术步骤(8)中所述主成分分析法,具体包括W下步骤: ① 构造最优凸组合函数的非线性规划方程嚷難争讓致*:餐駭本幾摄,其中;:超,痕,1为运 里采用的3种核函数。对个系数进行迭代寻优,迭代过程可选择粒子群算法或人 工蜂群算法执行; ② 当迭代结束,求得的近似全局最优值时,在样本集S上得到最优凸组合核 矩阵化同时也是样本矩阵经过最优核函数映射后得到的特征空间向量组成的矩阵,其中 雜,诘歌転場:滤; ③ 矩阵巧寺征中屯、化处理:每个元素分别减去其所在行、列的均值并加上矩阵均值; ④ 求解巧E阵的特征值和对应的特征向量; ⑥按计算得到的特征值大小,选出特征值最大的a个特征向量及其对应的特征值,其 中a是步骤(5)中估计出的样本矩阵本征维数; ⑧利用W上特征值对角逆矩阵和特征向量矩阵做线性变换,得到核矩阵《、的a个嵌入 主维度和数据拓扑结构,达到降维和特征提取目的。 本专利技术的有益效果是: (1) 本专利技术提出的特征提取算法相比传统的特征提取算法具有更高的特征区分度,且 自动提取的特征有效性更高,不受噪声影响,在核函数确定后速度更快; (2) 本专利技术所述方法在无需得知源光谱样本个数和种类的情况下,能够提取每个样本 最关键的a个主要特征; (3) 本专利技术所述方法不要求信号充分满足分辨率要求,可W自动插值并重采样,并实现 在Ξ维或2为空间中的点簇表示,便于聚类分析。【附图说明】 图1为本专利技术中太赫兹时域光谱系统实验台及传感器位置图; 图2为本专利技术所述方法的流程图; 图3为本专利技术实施例1太赫兹时域光谱传感器拾取信号的频域变换波形图; 图4为本专利技术实施例1采用最大似然估计法提取样本本征维度后进行特征提取的结 果; 图5为本专利技术实施例1采用测地最小生成树法提取2个本征维度后进行特征提取的结 果。【具体实施方式】 下面结合具体实施例对本专利技术作进一步详细说明,但本专利技术的保护范围并不限于 所述内容。[001引 实施例1 如图1所示,,首先启动太 赫兹小型时域光谱透射式探测平台(zomega公司的小型频域光谱探测平台),获取各类物质 相同分辨率的频域吸收谱,或者W现有的太赫兹频谱数据为基础,分别获取氧化亚铜、硫化 儒、巧挫、扑風灵、联苯菊醋、蔥(一种炭氨化合物)、乙酷胆碱漠化物、ATP共8种物质的频谱 吸收数据,每种样本120组数据,共960组光谱数据;利用Savitzky-Golay滤波算法去除高 频噪声,平滑数据序列;对各频谱样当前第1页1 2 本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/CN105279379.html" title="基于凸组合核函数主成分分析的太赫兹光谱特征提取方法原文来自X技术">基于凸组合核函数主成分分析的太赫兹光谱特征提取方法</a>

【技术保护点】
基于凸组合核函数主成分分析的太赫兹光谱特征提取方法,其特征在于,具体包括以下步骤:(1)首先通过太赫兹时域光谱系统测得物质样本的时域光谱数据,检测的物质种类不少于两类,统一谱线纵坐标为透射率,横坐标为频率,获取数据序列,数据不少于两组,每个样本的时域光谱数据序列通过离散傅里叶变换,得到信号;其中,i表示第i个样本,m表示转换后频谱数据序列的维数;(2)对每个样本的太赫兹频域光谱数据做Savitzky‑Golay滤波,得到滤波后光谱;(3)将步骤(2)中得到的滤波数据进行三次样条插值,使每组光谱数据序列的维数m增加到5000以上;(4)统一截取各组光谱数据中太赫兹吸收特征较为明显且可比的频段,并进行等分辨率重采样,使每组光谱数据序列的维数m达到500以上,至此得到统一分辨率、频段的多组太赫兹频谱数据;(5)所有样本除去横坐标,将纵坐标处理为列向量并合并为一个矩阵S,m为样本维数,n为样本数,然后使用极大似然估计法对矩阵的本征维数a进行估计;(6)利用凸组合核函数,其中称为凸组合系数,;为这里采用的3种核函数,分别为:线性核函数,多项式核函数,高斯核函数;利用核差异评价方法,在归一化后的样本矩阵S上构造最优凸组合函数的非线性规划问题:其中为最优凸组合核差异,为单一核函数核差异,为样本所属物质类别的标签组成的向量;约束条件为:其中,矩阵和分别对应于核函数的核矩阵,核矩阵的内积表示为:对此非线性规划问题求解,得到最优组合的,解出最优凸组合核函数CCK;(7)通过凸核函数将归一化的光谱样本矩阵映射至特征空间,k为此特征空间的维数,n为样本个数,;(8)使用主成分分析法将每个样本的a个主要特征提取出来,并根据需要取其中三个维度数据于三维空间中表示出来。...

【技术特征摘要】

【专利技术属性】
技术研发人员:沈韬钟毅伟王瑞琦
申请(专利权)人:昆明理工大学
类型:发明
国别省市:云南;53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1