The invention provides a training method for Raman spectrum recognition model of foodborne pathogenic bacteria based on PCA Stacking. The Raman integrated classification algorithm based on PCA Stacking is proposed to solve the problem that the recognition accuracy of two food-borne pathogenic bacteria with similar Raman peaks, Escherichia coli 0157:H7 and Brucella S2 strains, is insufficient, and a mathematical statistical model and calculation method with better robustness are found. To solve the problems of burrs and baseline drift in Raman spectra, Savitzky Golay filter and asymmetric least squares are used to realize spectral preprocessing. The parameters of grid search model prove that Stacking ensemble algorithm has higher classification accuracy than K-nearest neighbor, logistic regression and single algorithm model of support vector machine.
【技术实现步骤摘要】
基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法
本专利技术涉及一种基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法。
技术介绍
目前,用于检测食源性致病菌的方法有:形态学鉴定、免疫学检测及聚合酶链式反应等。但是,这些方法操作步骤复杂,周期长,不能有效地起到监测、预防作用。拉曼光谱是基于光和材料内化学键的相互作用而产生的,通过对食源性致病菌拉曼光谱信号的分析,可快速实现对致病菌的辨识。由于原始拉曼光谱存在许多噪声,并且不同物质可能在相同波长处有类似的峰形,这些因素降低了目前人工识峰的准确度,导致食源性致病菌的错误判别。
技术实现思路
本专利技术的目的在于提供一种基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法。为解决上述问题,本专利技术提供一种基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法,包括:对原始大肠杆菌O157:H7、布鲁氏菌S2株的拉曼光谱进行归一化处理,对所述拉曼光谱去噪并扣除荧光背景;对去噪并扣除荧光背景后的拉曼光谱提取主成分;对提取主成分后的数据集进行X∶Y比例的划分,其中,X+Y=100,X%作为测试集,Y%作为训练集;基于所述训练集训练多个基础层次模型,基于每个基础层次模型的输出训练各个对应的元模型,将各个元模型聚合为Stacking模型;采所述测试集验证所述Stacking模型的准确率。进一步的,在上述方法中,使用Savitzky-Golay滤波器和非对称最小二乘对所述拉曼光谱去噪。进一步的,在上述方法中,对去噪并扣除荧光背景后的拉曼光谱提取 ...
【技术保护点】
1.一种基于PCA‑Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法,其特征在于,包括:对原始大肠杆菌O157:H7、布鲁氏菌S2株的拉曼光谱进行归一化处理,对所述拉曼光谱去噪并扣除荧光背景;对去噪并扣除荧光背景后的拉曼光谱提取主成分;对提取主成分后的数据集进行X:Y比例的划分,其中,x+Y=100,X%作为测试集,Y%作为训练集;基于所述训练集训练多个基础层次模型,基于每个基础层次模型的输出训练各个对应的元模型,将各个元模型聚合为Stacking模型;采所述测试集验证所述Stacking模型的准确率。
【技术特征摘要】
1.一种基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法,其特征在于,包括:对原始大肠杆菌O157:H7、布鲁氏菌S2株的拉曼光谱进行归一化处理,对所述拉曼光谱去噪并扣除荧光背景;对去噪并扣除荧光背景后的拉曼光谱提取主成分;对提取主成分后的数据集进行X:Y比例的划分,其中,x+Y=100,X%作为测试集,Y%作为训练集;基于所述训练集训练多个基础层次模型,基于每个基础层次模型的输出训练各个对应的元模型,将各个元模型聚合为Stacking模型;采所述测试集验证所述Stacking模型的准确率。2.如权利要求1所述的基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法,其特征在于,使用Savitzky-Golay滤波器和非对称最小二乘对所述拉曼光谱去噪。3.如权利要求1所述的基于PCA-Stacking建立的食源性...
【专利技术属性】
技术研发人员:史如晋,夏钒曾,夏志平,曾万聃,曲晗,李乾学,杨瑞君,
申请(专利权)人:上海应用技术大学,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。