System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种烟草料液天然香原料溯源方法技术_技高网

一种烟草料液天然香原料溯源方法技术

技术编号:41262695 阅读:2 留言:0更新日期:2024-05-11 09:20
本发明专利技术公开了一种烟草料液天然香原料溯源方法,本发明专利技术基于原始天然香原料数据库,利用多重备份特征归集算法来构建新的特征空间。然后将每个原始天然香原料数据投影到所构建的特征空间,获得相应的特征向量,将所有这样的特征向量收集起来,构成特征映射数据库;对待测烟草料液香基,也使用相同的投影方法投影到特征空间,获得其特征向量。最后,使用加权独特性指数匹配算法将料液香基特征向量与特征映射数据库中的每个特征向量进行逐一匹配,匹配完成后进行匹配度排序。

【技术实现步骤摘要】

本专利技术涉及烟草制造领域,特别涉及一种烟草料液天然香原料溯源方法


技术介绍

1、烟草料液溯源是烟草数字化技术中一个非常重要又颇具挑战性的问题。料液香基中一般包含多种天然香原料和合成香原料,料液溯源的主要目标是确定料液香基中包含哪些天然或合成香原料。其中合成香原料主要成分是单个化合物,一般可直接利用经典数据库(如质谱数据库)进行检索识别即可完成溯源,但是天然香原料的溯源则存在较大的技术困难,主要有以下原因:

2、首先,天然香原料本身是一个复杂的混合体系,天然香原料之间既有共同成分,也有差别成分,大多数天然香原料往往难以直接判断其区别于其他天然香原料的数据特征,多种天然香原料与多种合成香原料混合之后形成的料液香基成分更为复杂。在仅给定料液香基数据和天然香原料数据库的假设下,现有的相关匹配算法都只能在香原料具有明显特征,即不同香原料彼此之间区别较为明显的情况下才能够较好的发挥作用,而并不适合对于天然香原料这种成分复杂的混合体系进行溯源分析。

3、其次,虽然目前也有对于表香香基中天然香原料的溯源方法,但是料液香基与表香香基有显著不同,因为表香香基中所用天然香原料中主要包含挥发性和半挥发性成分,容易由仪器检出,而在料液香基中存在大量非挥发性物质,常用化学仪器往往难以检出,给料液香基剖析进一步增加了技术难度。

4、此外,由于混合形成香基时,加上溶剂的稀释,各天然香原料浓度大幅降低,许多天然香原料中本身含有且单独检测时可检出的成分,在混合香基中则无法检出,进一步增加了料液香基剖析的不确定性。

r/>

技术实现思路

1、为了解决目前烟草料液天然香原料溯源技术难度大的技术问题,本专利技术提供一种能够有效准确的实现烟草料液天然香原料的溯源方法。

2、为了实现上述技术目的,本专利技术的技术方案是:

3、一种烟草料液天然香原料溯源方法,包括以下步骤:

4、步骤一,建立一个用于保存特征的特征空间,其中特征中保存的是色谱峰的信息。然后遍历原始天然香原料数据库中的每个天然香原料的数据,并根据数据中的每个色谱峰的信息,在特征空间中寻找具有相似信息的特征。如果未寻找到,则将数据中色谱峰的信息作为特征空间中的新特征保存。如果能够寻找到,则根据数据中色谱峰的信息来调整相似特征。

5、步骤二,设置一个向量长度为特征空间中的特征个数的特征向量,并将特征向量的所有分量初始化为0。然后遍历原始天然香原料数据库内其中一个天然香原料的所有色谱峰的信息,来与特征空间中的每个特征比较,若相似,则将相应色谱峰的相对丰度赋予到当前特征的索引位置,否则跳过当前特征,从而得到由一个天然香原料投影变换而成的原始特征向量。再重复步骤二直至遍历整个原始天然香原料数据库中每一个天然香原料,最终得到由所有原始特征向量所组成的特征映射数据库。

6、步骤三,再设置一个向量长度为特征空间中的特征个数的特征向量,并将特征向量的所有分量初始化为0。然后遍历待测的天然香原料数据中所有色谱峰的信息,来与特征空间中的每个特征比较,若相似,则将相应色谱峰的相对丰度赋予到当前特征的索引位置。否则跳过当前特征。最终得到由待测的天然香原料数据投影变换而成的待测特征向量。

7、步骤四,计算特征映射数据库中的每个原始特征向量和待测特征向量之间的匹配度,匹配完成后进行匹配度排序,作为待测的天然香原料数据的溯源参考结果。

8、所述的方法,所述的步骤一中,原始天然香原料数据库是对所有可能用于烟草料液中的天然香原料进行气相色谱-质谱联用仪分析,并将分析获得的数据统一存储所形成的。

9、所述的方法,所述的步骤一中,色谱峰的信息包括质谱和保留时间,其中特征空间中每个特征中均保存有一个质谱集m、一个保留时间上限值t0和一个保留时间下限值t1。

10、所述的方法,所述的步骤一中,在特征空间中寻找具有相似信息的特征,是首先基于原始天然香原料数据库中的每个数据文件来获取所有色谱峰,并给定每个色谱峰的质谱n和保留时间t。然后先基于t来与特征空间中每个特征的t0和t1比较,若满足t0-t0<t<t1+t0,则再计算n与m的质谱相似度是否大于预设的相似度阈值,若大于则认为相似,否则认为不相似。其中t0为保留时间控制阈值。

11、所述的方法,所述的步骤一中,根据数据中色谱峰的信息来调整相似特征,是将n加入至m中,且修改保留时间的上限值为t和t1中的较大者,修改保留时间下限值为t与t0中的较小者。

12、所述的方法,所述的步骤二和步骤三中,将所有色谱峰的信息来与特征空间中的每个特征比较,是获取天然香原料中每个色谱峰的质谱n和保留时间t,然后与特征空间中的每个特征先进行保留时间的比较,若满足t0-t1<t<t1+t1,则继续比较质谱相似度,计算n与特征中的质谱之间的相似度,若大于预设阈值,则认为相似,否则认为不相似。其中t1为保留时间控制阈值。

13、所述的方法,所述的步骤四中,计算原始特征向量和待测特征向量之间的匹配度,是首先根据下式基于特征映射数据库来建立独特性指数μ:

14、

15、其中μj为特征空间中第j个特征的独特性指数,δ()为示性函数,ekj表示特征映射数据库所形成的矩阵中第k行第j列个元素,j=(1,2,...,l),l为特征空间中的特征数量。

16、然后根据下式计算加权独特性指数匹配度σ(ei,m):

17、

18、其中ei为原始天然香原料数据库在特征空间上投影得到的特征向量,ei=(ei1,ei2,...,eil)。m为待测的天然香原料数据在特征空间上投影得到的待测特征向量,m=(m1,m2,...,ml),eij表示ei在特征空间中第j个特征上投影所获得的响应值,α和β为超参数。

19、本专利技术的技术效果在于:

20、1.本专利技术所提烟草料液溯源方案首先从原始香原料数据库进行特征归集,构建确定的特征空间,将香原料和香基均投影到特征空间,获得尺寸一致的特征向量。相对直接比较原始数据的方法,该方法获得的特征向量特征已经过对齐,且考虑的特征数量一致,匹配度计算更具公平性。

21、2.本专利技术所提多重备份特征归集算法,每个特征包含一个质谱集,而非单个质谱。这种冗余性可以一定程度上刻画仪器检测的检出分布,降低漏检率。

22、3.本专利技术所提加权独特性指数匹配算法,定义了独特性指数,匹配时充分考虑了香原料的独特性,在不确定性较高的情形下,仍有望通过独特性优势提高实际存在的香原料的匹配度。超参数α控制相对丰度对匹配度计算的贡献,反映整体匹配度;超参数β控制香原料特征的独特性对匹配度计算的贡献,提高具有独特特征且实际检出香原料的匹配度。通过调节以上两个超参数可在具体计算时为用户提供较大的灵活性。

本文档来自技高网...

【技术保护点】

1.一种烟草料液天然香原料溯源方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述的步骤一中,原始天然香原料数据库是对所有可能用于烟草料液中的天然香原料进行气相色谱-质谱联用仪分析,并将分析获得的数据统一存储所形成的。

3.根据权利要求1所述的方法,其特征在于,所述的步骤一中,色谱峰的信息包括质谱和保留时间,其中特征空间中每个特征中均保存有一个质谱集M、一个保留时间上限值t0和一个保留时间下限值t1。

4.根据权利要求3所述的方法,其特征在于,所述的步骤一中,在特征空间中寻找具有相似信息的特征,是首先基于原始天然香原料数据库中的每个数据文件来获取所有色谱峰,并给定每个色谱峰的质谱n和保留时间t;然后先基于t来与特征空间中每个特征的t0和t1比较,若满足t0-T0<t<t1+T0,则再计算n与M的质谱相似度是否大于预设的相似度阈值,若大于则认为相似,否则认为不相似;其中T0为保留时间控制阈值。

5.根据权利要求4所述的方法,其特征在于,所述的步骤一中,根据数据中色谱峰的信息来调整相似特征,是将n加入至M中,且修改保留时间的上限值为t和t1中的较大者,修改保留时间下限值为t与t0中的较小者。

6.根据权利要求4所述的方法,其特征在于,所述的步骤二和步骤三中,将所有色谱峰的信息来与特征空间中的每个特征比较,是获取天然香原料中每个色谱峰的质谱n和保留时间t,然后与特征空间中的每个特征先进行保留时间的比较,若满足t0-T1<t<t1+T1,则继续比较质谱相似度,计算n与特征中的质谱之间的相似度,若大于预设阈值,则认为相似,否则认为不相似;其中T1为保留时间控制阈值。

7.根据权利要求4所述的方法,其特征在于,所述的步骤四中,计算原始特征向量和待测特征向量之间的匹配度,是首先根据下式基于特征映射数据库来建立独特性指数μ:

...

【技术特征摘要】

1.一种烟草料液天然香原料溯源方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述的步骤一中,原始天然香原料数据库是对所有可能用于烟草料液中的天然香原料进行气相色谱-质谱联用仪分析,并将分析获得的数据统一存储所形成的。

3.根据权利要求1所述的方法,其特征在于,所述的步骤一中,色谱峰的信息包括质谱和保留时间,其中特征空间中每个特征中均保存有一个质谱集m、一个保留时间上限值t0和一个保留时间下限值t1。

4.根据权利要求3所述的方法,其特征在于,所述的步骤一中,在特征空间中寻找具有相似信息的特征,是首先基于原始天然香原料数据库中的每个数据文件来获取所有色谱峰,并给定每个色谱峰的质谱n和保留时间t;然后先基于t来与特征空间中每个特征的t0和t1比较,若满足t0-t0<t<t1+t0,则再计算n与m的质谱相似度是否大于预设的相似度阈值,若大于则认为相...

【专利技术属性】
技术研发人员:伍毅子孔波庹苏行崔雨琪蔡佳校李燕春卢红兵钟科军
申请(专利权)人:湖南中烟工业有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1