当前位置: 首页 > 专利查询>湖南大学专利>正文

一种藻源嗅味特征识别方法技术

技术编号:38344785 阅读:4 留言:0更新日期:2023-08-02 09:24
本发明专利技术公开了一种藻源嗅味特征识别方法,包括以下步骤:获取藻源致嗅有机物数据及质谱图数据;获取藻源致嗅有机物数据对应的MACCS有机物分子指纹和质谱图数据对应的MACCS分子指纹;采用藻源致嗅有机物嗅味类别数据中训练集对应的MACCS有机物分子指纹分别对不同机器学习模型进行训练,获得最优嗅味分类模型;采用嗅味阈值数据中训练集对应的MACCS有机物分子指纹分别对不同机器学习模型进行训练,获得最优嗅味阈值预测模型;将待测藻源致嗅有机物数据输入模型中,即可输出藻源致嗅有机物嗅味识别结果。本发明专利技术具有成本低廉、简便而快速、节省大量人力、物力和财力等特点。物力和财力等特点。物力和财力等特点。

【技术实现步骤摘要】
一种藻源嗅味特征识别方法


[0001]本专利技术属于污染源识别检测领域,特别涉及一种藻源嗅味特征识别方法。

技术介绍

[0002]藻源致嗅有机物识别的重要性在于:确定污染源,进而采取相应的控制和治理措施,避免环境污染的进一步扩散和加重。通过监测致嗅有机物浓度的变化实现环境预警与保护。目前,常见的嗅味识别检测方法主要有以下三种:(1)人类感官评估检测:为最常见的嗅味识别方法之一,使用受试者进行感官评估。这些评估可以是定性的(即“好闻”或“不好闻”)或定量的(即使用数值评分来描述气味的强度、品质和持久性等)。该方法适用于许多领域,例如食品、香水、清洁剂、化妆品等,但是受试者的主观感受和个体差异会影响评估结果的准确性。
[0003](2)电子鼻识别检测:电子鼻是一种基于化学传感器的嗅味检测技术,其工作原理类似于人类嗅觉系统。电子鼻由多个化学传感器和模式识别算法组成,当气味分子与传感器表面接触时,会引起传感器阻抗的变化。模式识别算法会对传感器阵列产生的信号进行分析和处理,从而识别气味分子的种类和浓度。该方法具有响应速度快、样品处理简单、具有较好的重现性和稳定性、可同时检测多个气味成分等优点,但同时也存在检测灵敏度较低、选择性和准确性受限、不能确定具体的化学成分等缺点。该方法适用于食品、药品、环境等领域中常见的气味成分的检测,如咖啡、奶酪、动物粪便等。
[0004](3)气相色谱

质谱联用(GC

MS)识别检测:气相色谱

质谱联用是一种基于化学分离和检测的技术,它通过将样品挥发成气体,并利用气相色谱将混合物中的化学物质分离开来,再利用质谱对分离后的化学物质进行鉴定和定量分析。GC

MS能够对复杂的化学成分进行快速、精确的分析和鉴定,具有高灵敏度和高选择性、能够确定气味物质的化学成分、定量精度高等优点。因此在嗅味物质识别中具有很高的应用价值,但同时也存在分析过程复杂、需要样品处理、响应速度较慢、设备昂贵等缺点。该方法适用于各种嗅味物质的检测和鉴定,包括水、空气、土壤中的有机物质、化工产品等。
[0005]尽管现有的嗅味识别方法在某些方面已经取得了长足的进展,但仍然存在一些问题和挑战:例如,人类感官评估检测方法中,感观分析法依赖专业人员进行闻测,主观性强,重复性差,且容易产生嗅觉疲劳;电子鼻识别检测的化学分析法中,实验条件严苛,处理过程复杂,大多数现有技术都需要对样品进行处理或分离,需要一定的时间,无法实现实时监测,且水体中包含多种有机物,难以检测;气相色谱

质谱联用(GC

MS)识别检测中,使用的某些嗅味识别技术的设备成本较高,不适用于大规模的应用场景,并且难以确定复杂水体中嗅味来源等。
[0006]对于真实水体,难以确定其中的嗅味有机物。非靶向分析技术可以用于分析水中的复杂有机物,通过质谱数据(MS1和MS2光谱),可以获得数千个分子特征。其中,MS1光谱可以提供有关分子的亲水性和元素组成的信息,而MS2光谱可以用于识别和标记许多已知的气味剂的分子片段。
[0007]鉴于此,本专利技术提供了一种藻源嗅味特征识别方法以解决上述技术问题。

技术实现思路

[0008]针对上述现有技术存在的问题,本专利技术的目的在于提供了一种藻源嗅味特征识别方法,该方法具有成本低廉、简便而快速、可节省大量的人力、物力和财力等特点。
[0009]为了实现上述目的,本专利技术采用了如下技术方案:一种藻源嗅味特征识别方法,包括以下步骤:S1、获取藻源致嗅有机物数据以及质谱图数据,其中,所述藻源致嗅有机物数据包括藻源致嗅有机物嗅味类别数据和嗅味阈值数据,并分别将藻源致嗅有机物嗅味类别数据和嗅味阈值数据各自划分为测试集和训练集;S2、获取藻源致嗅有机物数据对应的MACCS有机物分子指纹和质谱图数据对应的MACCS分子指纹,并将质谱图数据对应的MACCS分子指纹作为隐藏测试集;S3、以嗅味类别作为标签,以精确度、召回率作为评价指标,采用藻源致嗅有机物嗅味类别数据中训练集对应的MACCS有机物分子指纹分别对若干个机器学习模型进行训练,并使用隐藏测试集进行模型验证,获得最优嗅味分类模型;S4、以嗅味阈值作为标签,以R2、RMSE得分作为评价指标,采用嗅味阈值数据中训练集对应的MACCS有机物分子指纹分别对若干个机器学习模型进行训练,并使用隐藏测试集进行模型验证,获得最优嗅味阈值预测模型;S5、将待测藻源致嗅有机物数据输入最优嗅味分类模型和最优嗅味阈值预测模型中,即可输出藻源致嗅有机物嗅味识别结果。
[0010]优选地,所述获取藻源致嗅有机物数据对应的MACCS有机物分子指纹,具体步骤为:通过藻源致嗅有机物的结构获得藻源致嗅有机物数据对应的SMILES,然后将SMILES转化为MACCS有机物分子指纹。
[0011]优选地,所述获取质谱图数据对应的MACCS分子指纹,具体步骤为:利用Sirius将质谱图数据转化为MACCS分子指纹,并将质谱图对应的MACCS分子指纹作为隐藏测试集。
[0012]优选地,所述步骤S3和S4中,若干个机器学习模型包括随机森林模型(RF)、神经网络模型(NN)和支持向量机模型(SVM)。
[0013]优选地,所述嗅味类别包括霉味、氨味、药味、樟脑味、柑橘味、硫磺味、脂肪味。
[0014]优选地,还包括S4'、基于SHAP分析方法对最佳嗅味分类预测模型进行解释,得到有机物特征与嗅味类别及嗅味阈值的影响关系,再进行AD分析,确定最佳嗅味分类预测模型和最优嗅味阈值预测模型的适用范围。
[0015]与现有技术相比,本专利技术具备以下有益效果:(1)本专利技术中,通过有机物结构直接获取SMILES,基于SMILES得到该物质对应的MACCS指纹,以MACCS指纹作为嗅味类别预测模型和嗅味阈值预测模型的输入特征,能够实现对藻源致嗅有机物的嗅味类别及嗅味阈值的预测;通过Sirius软件将质谱图数据转化为MACCS分子指纹,同样以MACCS分子指纹作为嗅味类别预测模型和嗅味阈值预测模型的输入特征,这里将质谱图转化为分子指纹表示,不仅利用指纹特征同时表达了多种有机物特征,还可以作为模型的标准输入特征,通过直接输入训练好的模型即最优嗅味类别模型和最优嗅味阈值预测模型,实现了对藻源致嗅有机物的嗅味类别及嗅味阈值的预测,适用于非靶
向识别过程;且最优模型既有统计意义又有化学意义,能说明有机物分子结构与嗅味之间的相关性,利于嗅味物质的溯源。
[0016](2)本专利技术具有成本低廉、简便而快速、节省大量的人力、物力和财力等特点。
附图说明
[0017]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018]图1为藻源致嗅有机物嗅味分类及嗅味阈值预测流程图;图2为基于随机森本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种藻源嗅味特征识别方法,其特征在于,包括以下步骤:S1、获取藻源致嗅有机物数据集以及质谱图数据集,其中,所述藻源致嗅有机物数据集包括藻源致嗅有机物嗅味类别数据和嗅味阈值数据,并分别将藻源致嗅有机物嗅味类别数据和嗅味阈值数据各自划分为测试集和训练集;S2、获取藻源致嗅有机物数据对应的MACCS有机物分子指纹和质谱图数据对应的MACCS分子指纹,并将质谱图数据对应的MACCS分子指纹作为隐藏测试集;S3、以嗅味类别作为标签,以精确度、召回率作为评价指标,采用藻源致嗅有机物嗅味类别数据中训练集对应的MACCS有机物分子指纹分别对若干个机器学习模型进行训练,并使用隐藏测试集进行模型验证,获得最优嗅味分类模型;S4、以嗅味阈值作为标签,以R2、RMSE得分作为评价指标,采用嗅味阈值数据中训练集对应的MACCS有机物分子指纹分别对若干个机器学习模型进行训练,并使用隐藏测试集进行模型验证,获得最优嗅味阈值预测模型;S5、将待测藻源致嗅有机物数据输入最优嗅味分类模型和最优嗅味阈值预测模型中,即可输出藻源致嗅有机物嗅味识别结果。2.根据权利要求1所述的一种藻源嗅味特...

【专利技术属性】
技术研发人员:周石庆黄苑曦罗金明陈圆卜令君陈蕃张伟李磊
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1