基于随机森林的食源性致病菌的分类模型训练方法技术

技术编号:24458662 阅读:50 留言:0更新日期:2020-06-10 16:19
本发明专利技术提供了一种基于随机森林的食源性致病菌的分类模型训练方法,本发明专利技术对于两种不同致病菌的拉曼光谱数据进行多步数据预处理,包括利用多项式拟合进行基线校正、PCA进行数据降维、Savitzky‑Golay卷积平滑算法降低噪声干扰,平滑光谱等步骤。本发明专利技术集成多棵决策树模型,有效地提高了分类模型的泛化能力,使得食源性致病菌检测的准确性得到提升。

Training method of classification model of foodborne pathogens based on random forest

【技术实现步骤摘要】
基于随机森林的食源性致病菌的分类模型训练方法
本专利技术涉及一种基于随机森林的食源性致病菌的分类模型训练方法。
技术介绍
当前用于食源性致病菌检测的方法主要包括:直接接种分离法、增菌培养分离法、直接实时荧光定量聚合酶链式反应(PCR)和增光后实时PCR法。但是这些传统的检测技术存在很多问题,比如说耗时长、效率低、操作繁琐等。
技术实现思路
本专利技术的目的在于提供一种基于随机森林的食源性致病菌的分类模型训练方法。为解决上述问题,本专利技术提供一种基于随机森林的食源性致病菌的分类模型训练方法,包括:从食源性致病菌拉曼光谱数据流中,随机抽取n个新的自助样本集,并由此构建n棵分类回归树,每次未被抽到的样本组成n个袋外数据,其中,n为正整数;对每一棵树,通过计算每一棵树的每个特征蕴含的信息量,选择一个最具有分类能力的特征进行节点分裂,且每棵树最大限度地生长,不做任何剪枝;将生成的多棵树组成随机森林分类模型,用随机森林分类模型对新的数据进行分类,得到分类结果;对食源性致病菌拉曼光谱数据流进行预处本文档来自技高网...

【技术保护点】
1.一种基于随机森林的食源性致病菌的分类模型训练方法,其特征在于,包括:/n从食源性致病菌拉曼光谱数据流中,随机抽取n个新的自助样本集,并由此构建n棵分类回归树,每次未被抽到的样本组成n个袋外数据,其中,n为正整数;/n对每一棵树,通过计算每一棵树的每个特征蕴含的信息量,选择一个最具有分类能力的特征进行节点分裂,且每棵树最大限度地生长,不做任何剪枝;/n将生成的多棵树组成随机森林分类模型,用随机森林分类模型对新的数据进行分类,得到分类结果;/n对食源性致病菌拉曼光谱数据流进行预处理;/n将经过预处理的食源性致病菌拉曼光谱数据流按照3∶7的比例进行划分,其中,30%的食源性致病菌拉曼光谱数据流作...

【技术特征摘要】
1.一种基于随机森林的食源性致病菌的分类模型训练方法,其特征在于,包括:
从食源性致病菌拉曼光谱数据流中,随机抽取n个新的自助样本集,并由此构建n棵分类回归树,每次未被抽到的样本组成n个袋外数据,其中,n为正整数;
对每一棵树,通过计算每一棵树的每个特征蕴含的信息量,选择一个最具有分类能力的特征进行节点分裂,且每棵树最大限度地生长,不做任何剪枝;
将生成的多棵树组成随机森林分类模型,用随机森林分类模型对新的数据进行分类,得到分类结果;
对食源性致病菌拉曼光谱数据流进行预处理;
将经过预处理的食源性致病菌拉曼光谱数据流按照3∶7的比例进行划分,其中,30%的食源性致病菌拉曼光谱数据流作为测试集,70%的食源性致病菌拉曼光谱数据流作为训练集,采用所述测试集和训练集对所述随机森林分类模型进行10折交叉验证并记录对应的随机森林分类模型的性能指标。


2.如权利要求1所述的基于随机森林的食源性致病菌的分类模型训...

【专利技术属性】
技术研发人员:曾万聃王其夏志平黄杰伦
申请(专利权)人:上海应用技术大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1