The invention discloses a method for decomposition and analysis of mixed mass spectrometry based on the sparsity hypothesis. The method assumes that the mixed mass spectrometry contains a few pure mass spectrometries and gives several reference mass spectrometries. First, the measured mixed spectrum is sparsely decomposed under different sparsity conditions, and several decomposition results are obtained. Then, the decomposition results are classified according to the sparsity conditions. Several sparse configurations are generated according to the classification results, and each sparse configuration is taken as qualitative or analytical results. This method can not only effectively avoid the over-fitting problem of the traditional non-negative least squares decomposition algorithm, but also provide a variety of sparse configurations, fully mine the hidden information in the data, which is conducive to the relevant scientific and technical personnel to insight into the qualitative analysis results.
【技术实现步骤摘要】
一种基于稀疏性假设分解与解析混合质谱的方法
本专利技术涉及一种气相色谱-质谱联用技术,特别涉及一种色谱共流出峰解析及混合质谱解析技术,属于检测分析
技术介绍
气相色谱-质谱(GC-MS)联用技术是复杂样品定性定量分析中应用最广泛的技术之一,随着美国国家标准局推出的NIST质谱库容量的不断增大,GC-MS已经成为复杂样品的挥发性和半挥发性小分子有机化合物的首选分析技术。然而,实际的色谱指纹图谱往往难以将色谱峰完全分离开来,色谱共流出峰非常普遍,主要是受限于气相色谱硬件本身分离能力的限制,其次是实验条件的限制。当前技术,如渐进因子分析法,固定尺寸移动窗口因子分析法,局部正交投影方法等(参见《复杂体系仪器分析--白、灰、黑分析体系及其多变量解析方法》,梁逸曾、许青松等著)对部分色谱共流出峰有一定的分离效果,但对色谱峰形有较强依赖,且对完全重叠峰尚无一般性的分离方案,无法满足某些特殊领域的应用需求。基于标准质谱数据库对色谱图中任意保留时间点的混合质谱进行分析是解析色谱共流出峰的一个重要思路。基于混合质谱进行GC-MS数据解析的一个重要环节是将混合质谱关于若干已知纯质谱进行分解。基于传统的非负最小二乘分解方法容易导致过拟合现象,亦即,为了拟合出最优解,许多实际上并非混合质谱组分的纯质谱也将参与拟合,导致分解系数的平均化,主要成分不突出或被淹没,给最终定性决策带来较强的干扰。另一方面,非负最小二乘等方法一般只能给出一种分解结果,有时单一配置并不能全面地抓取或体现数据背后的本质,且一旦结果失效,无法对可能的其他结果进行关联性推荐,降低了系统的灵活性。专利技术内 ...
【技术保护点】
1.一种基于稀疏性假设分解与解析混合质谱的方法,其特征在于:在假设混合质谱中包含少数种类纯质谱,并给定若干参考质谱的前提下,先在不同稀疏性条件下对待测混合谱进行稀疏分解,得到若干分解结果,再根据稀疏性条件对各个分解结果进行分类,并依据分类结果生成若干种稀疏性配置,以各个稀疏性配置作为定性或解析结果。
【技术特征摘要】
1.一种基于稀疏性假设分解与解析混合质谱的方法,其特征在于:在假设混合质谱中包含少数种类纯质谱,并给定若干参考质谱的前提下,先在不同稀疏性条件下对待测混合谱进行稀疏分解,得到若干分解结果,再根据稀疏性条件对各个分解结果进行分类,并依据分类结果生成若干种稀疏性配置,以各个稀疏性配置作为定性或解析结果。2.根据权利要求1所述的基于稀疏性假设分解与解析混合质谱的方法,其特征在于:所述参考质谱根据以下方法筛除得到:混合质谱先采用最右端质量数符合准则和基峰符合准则进行粗选,剔除不合格纯质谱,再通过加权出峰比率准则、强峰高概率出峰准则和耐挤压性准则进行细选,剔除不合格纯质谱,得到候选质谱列表。3.根据权利要求2所述的基于稀疏性假设分解与解析混合质谱的方法,其特征在于:所述最右端质量数准则为:若在质谱数据库中任意物质的纯质谱中的最右端峰或最右端峰簇中丰度最大峰所对应的质量数在混合质谱中出峰,则相应质谱保留在候选质谱列表中,否则剔除。4.根据权利要求2所述的基于稀疏性假设分解与解析混合质谱的方法,其特征在于:所述基峰准则为:若在质谱数据库中任意物质的纯质谱中的基峰所对应的质量数在混合质谱中出峰,则相应质谱保留在候选质谱列表中,否则剔除。5.根据权利要求2所述的基于稀疏性假设分解与解析混合质谱的方法,其特征在于:所述粗选过程中先用最右端质量数准则剔除不合格纯质谱,再用基峰准则剔除不合格纯质谱。6.根据权利要求5所述的基于稀疏性假设分解与解析混合质谱的方法,其特征在于:所述最右端质量数准则在运用过程中预先建立最右端质量数索引结构;所述最右端质量数索引结构用于查询纯质谱最右端质量数,判断所述纯质谱最右端质量数与混合质谱中某一峰对应的质量数是否一致,如果一致则相应的纯质谱列入候选质谱列表中,否则剔除。7.根据权利要求5所述的基于稀疏性假设分解与解析混合质谱的方法,其特征在于:所述基峰准则在运行过程中预先建立基峰索引结构;所述基峰索引结构用于查询纯质谱基峰,判断所述纯质谱基峰在混合质谱中是否出峰,且混合质谱中相应峰相对丰度大于阈值T,则所述纯质谱列入候选质谱中,否则剔除;所述阈值T为20%~30%。8.根据权利要求3所述的基于稀疏性假设分解与解析...
【专利技术属性】
技术研发人员:伍毅子,杨华武,魏维伟,孔波,李燕春,庹苏行,钟科军,陈增萍,尹双凤,
申请(专利权)人:湖南中烟工业有限责任公司,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。