【技术实现步骤摘要】
基于随机森林的食源性致病菌的分类模型训练方法
本专利技术涉及一种基于随机森林的食源性致病菌的分类模型训练方法。
技术介绍
当前用于食源性致病菌检测的方法主要包括:直接接种分离法、增菌培养分离法、直接实时荧光定量聚合酶链式反应(PCR)和增光后实时PCR法。但是这些传统的检测技术存在很多问题,比如说耗时长、效率低、操作繁琐等。
技术实现思路
本专利技术的目的在于提供一种基于随机森林的食源性致病菌的分类模型训练方法。为解决上述问题,本专利技术提供一种基于随机森林的食源性致病菌的分类模型训练方法,包括:从食源性致病菌拉曼光谱数据流中,随机抽取n个新的自助样本集,并由此构建n棵分类回归树,每次未被抽到的样本组成n个袋外数据,其中,n为正整数;对每一棵树,通过计算每一棵树的每个特征蕴含的信息量,选择一个最具有分类能力的特征进行节点分裂,且每棵树最大限度地生长,不做任何剪枝;将生成的多棵树组成随机森林分类模型,用随机森林分类模型对新的数据进行分类,得到分类结果;对食源性致病菌拉 ...
【技术保护点】
1.一种基于随机森林的食源性致病菌的分类模型训练方法,其特征在于,包括:/n从食源性致病菌拉曼光谱数据流中,随机抽取n个新的自助样本集,并由此构建n棵分类回归树,每次未被抽到的样本组成n个袋外数据,其中,n为正整数;/n对每一棵树,通过计算每一棵树的每个特征蕴含的信息量,选择一个最具有分类能力的特征进行节点分裂,且每棵树最大限度地生长,不做任何剪枝;/n将生成的多棵树组成随机森林分类模型,用随机森林分类模型对新的数据进行分类,得到分类结果;/n对食源性致病菌拉曼光谱数据流进行预处理;/n将经过预处理的食源性致病菌拉曼光谱数据流按照3∶7的比例进行划分,其中,30%的食源性致 ...
【技术特征摘要】
1.一种基于随机森林的食源性致病菌的分类模型训练方法,其特征在于,包括:
从食源性致病菌拉曼光谱数据流中,随机抽取n个新的自助样本集,并由此构建n棵分类回归树,每次未被抽到的样本组成n个袋外数据,其中,n为正整数;
对每一棵树,通过计算每一棵树的每个特征蕴含的信息量,选择一个最具有分类能力的特征进行节点分裂,且每棵树最大限度地生长,不做任何剪枝;
将生成的多棵树组成随机森林分类模型,用随机森林分类模型对新的数据进行分类,得到分类结果;
对食源性致病菌拉曼光谱数据流进行预处理;
将经过预处理的食源性致病菌拉曼光谱数据流按照3∶7的比例进行划分,其中,30%的食源性致病菌拉曼光谱数据流作为测试集,70%的食源性致病菌拉曼光谱数据流作为训练集,采用所述测试集和训练集对所述随机森林分类模型进行10折交叉验证并记录对应的随机森林分类模型的性能指标。
2.如权利要求1所述的基于随机森林的食源性致病菌的分类模型训...
【专利技术属性】
技术研发人员:曾万聃,王其,夏志平,黄杰伦,
申请(专利权)人:上海应用技术大学,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。