基于随机森林模型的训练方法、小麦识别方法和训练系统技术方案

技术编号:21201008 阅读:46 留言:0更新日期:2019-05-25 01:34
本发明专利技术提供了一种基于随机森林模型的训练方法、小麦识别方法和训练系统,涉及计算机应用技术的技术领域,包括:获取随机森林模型,其中,随机森林模型包括多颗决策树;获取多个训练样本数据,训练样本数据包括类别数据和特征样本数据;依次将多个训练样本数据输入随机森林模型,获得多个预测数据;根据多个预测数据和多个类别数据计算随机森林模型的精度;根据精度对随机森林模型进行优化,获得调优随机森林模型,缓解了利用遥感技术对地物识别效率低的技术问题。

Training method, wheat recognition method and training system based on Stochastic Forest Model

The invention provides a training method, a wheat recognition method and a training system based on random forest model, which relates to the technical field of computer application technology, including acquiring random forest model, in which random forest model includes multiple decision trees, acquiring multiple training sample data, including category data and feature sample data, and sequentially transferring multiple training samples. Sample data are input into the random forest model to obtain multiple prediction data; the accuracy of the random forest model is calculated based on multiple prediction data and multiple categories of data; the random forest model is optimized according to the accuracy, and the optimized random forest model is obtained, which alleviates the technical problem of low efficiency of land feature recognition using remote sensing technology.

【技术实现步骤摘要】
基于随机森林模型的训练方法、小麦识别方法和训练系统
本专利技术涉及计算机应用技术的
,尤其是涉及一种基于随机森林模型的训练方法、小麦识别方法和训练系统。
技术介绍
近年来,利用遥感技术对小麦提取的研究取得了很大的进步,最先出现的识别和提取技术是图像目视解译,被广泛地应用于各类地物的信息提取工作中。图像目视解译虽然应用场景较多,但该方法定位不准确,时效性差,可重复性差,且存在个人差异,难以满足日益增长的用户需求。针对利用遥感技术对地物识别效率低的问题,目前尚未提出有效的解决方案。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种基于随机森林模型的训练方法、小麦识别方法和训练系统,以缓解了利用遥感技术对地物识别效率低的技术问题。第一方面,本专利技术实施例提供了一种基于随机森林模型的训练方法,包括:获取随机森林模型,其中,随机森林模型包括多颗决策树;获取多个训练样本数据,训练样本数据包括类别数据和特征样本数据;依次将多个训练样本数据输入随机森林模型,获得多个预测数据;根据多个预测数据和多个类别数据计算随机森林模型的精度;根据精度对随机森林模型进行优化,获得调优随机森林模型。结合第一方面,本专利技术实施例提供了第一方面的第一种可能的实施方式,其中,根据多个预测数据和多个类别数据计算随机森林模型的精度的步骤,包括:计算多个预测数据的相关性和/或误差;根据相关性和/或误差得到随机森林模型的精度。结合第一方面,本专利技术实施例提供了第一方面的第二种可能的实施方式,其中,根据精度对随机森林模型进行优化,获得调优随机森林模型的步骤,包括:根据随机森林模型的精度和优化规则调整随机森林模型的模型参数,获得调优模型参数;根据调优模型参数训练随机森林模型,获得调优随机森林模型。结合第一方面,本专利技术实施例提供了第一方面的第三种可能的实施方式,其中,获取随机森林模型的步骤,包括:获取学习样本数据集;根据学习样本数据集获取多个学习样本数据子集;根据多个学习样本数据子集和分类回归方法分别生成多颗决策树,多颗决策树构成随机森林模型。结合第一方面的第三种可能的实施方式,本专利技术实施例提供了第一方面的第四种可能的实施方式,其中,根据学习样本数据集获取多个学习样本数据子集的步骤,包括重复执行以下处理:从学习样本数据集中有放回的随机获取多个样本数据,组成第l个样本数据子集。结合第一方面的第四种可能的实施方式,本专利技术实施例提供了第一方面的第五种可能的实施方式,其中,根据多个学习样本数据子集和分类回归方法分别生成多颗决策树的步骤,包括重复执行以下处理,直至样本库中的样本数据子集都被遍历:从多个识别特征中不放回的抓取多个识别特征,组成第l个识别特征组,l>0;根据第l个识别特征组和第l个学习样本数据子集,并采用分类回归方法生成第l颗决策树。结合第一方面的第五种可能的实施方式,本专利技术实施例提供了第一方面的第六种可能的实施方式,其中,包括:获取多个影像样本和多个识别特征;根据多个影像样本和多个识别特征获得多个样本数据;将多个样本数据随机分为多个学习样本数据和多个训练样本数据,多个学习样本数据组成学习样本数据集,多个训练样本数据组成训练样本数据集。结合第一方面的第六种可能的实施方式,本专利技术实施例提供了第一方面的第七种可能的实施方式,其中,根据多个影像样本和多个识别特征获得多个样本数据的步骤,包括重复执行以下处理直至多个影像样本都被遍历:根据多个识别特征对第k个影像样本进行裁剪,得到第k个影像样本对应的多个特征影像样本,k>0;对多个特征影像样本进行变换处理对应获得多个特征样本数据;根据多个特征样本数据和类别数据,获得与第k个影像样本对应的第k个样本数据。第二方面,本专利技术实施例还提供一种基于随机森林模型的小麦识别方法,包括:将样本数据输入调优随机森林模型,得到样本数据的预测数据。第三方面,本专利技术实施例还提供一种基于随机森林模型的训练系统,包括:随机森林模型获取模块,用于获取随机森林模型,其中,随机森林模型包括多颗决策树;训练样本数据获取模块,用于获取多个训练样本数据,训练样本数据包括特征样本数据和类别数据;预测模块,用于依次将多个样本数据输入随机森林模型,获得多个预测数据;精度计算模块,用于根据多个预测数据和多个类别数据计算随机森林模型的精度;优化模块,用于根据精度对随机森林模型进行优化,获得调优随机森林模型。本专利技术实施例带来了以下有益效果:本专利技术实施例提供了一种基于随机森林模型的训练方法、小麦识别方法和训练系统,包括:获取随机森林模型,其中,随机森林模型包括多颗决策树;获取多个预测样本数据,预测样本数据包括类别数据和特征样本数据;依次将多个预测样本数据输入随机森林模型,获得多个预测数据;根据多个预测数据和多个类别数据计算随机森林模型的精度;根据精度对随机森林模型进行优化,获得调优随机森林模型,缓解了利用遥感技术对地物识别效率低的技术问题。本公开的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本公开的上述技术即可得知。为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种基于随机森林模型的训练方法流程图;图2为本专利技术实施例提供了一种随机森林模型精度随决策树数量的变化图;图3为本专利技术实施例提供了一种随机森林模型精度随随机输入特征数目的变化图;图4为本专利技术实施例提供的一种基于随机森林模型的训练系统的结构框架图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的技术方案进行描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。目前利用遥感技术对地物识别效率低,基于此,本专利技术实施例提供的一种基于随机森林模型的训练方法、小麦识别方法和训练系统,可以提高利用遥感技术对地物识别效率。为便于对本实施例进行理解,首先对本专利技术实施例所公开的一种基于随机森林模型的训练方法进行详细介绍。实施例1如图1所示,为本专利技术实施例提供的一种基于随机森林模型的训练方法流程图,该方法包括步骤S101-S104,具体如下:步骤S101,获取随机森林模型,其中,随机森林模型包括多颗决策树,该随机森林(RandomForest,RF)模型是小麦的机器学习的分类识别模型,用于根据地物是否为小麦进行分类,可以分为小麦和非小麦。随机森林模型由多个决策树组建而成,多个决策树之间互相是不关联的。决策树(tree)是一个树状的构造形式,可以是非二叉树结构,也可以为二叉树结构,本专利技术实施例中的随机森林模型为二叉树结构,且每颗决策树根据分类回归(ClassificationAndRegressionTree,CART)算法生成,即决策树的每个节点的取值只有两个,可以分别为“是”和“否”,分别对应左分支和右分支,分别代表是小麦和非小麦。步骤S102,获取多个训练样本数据,本文档来自技高网...

【技术保护点】
1.一种基于随机森林模型的训练方法,其特征在于,包括:获取所述随机森林模型,其中,所述随机森林模型包括多颗决策树;获取多个训练样本数据,所述训练样本数据包括类别数据和特征样本数据;依次将多个所述训练样本数据输入所述随机森林模型,获得多个预测数据;根据多个所述预测数据和多个所述类别数据计算所述随机森林模型的精度;根据所述精度对所述随机森林模型进行优化,获得调优随机森林模型。

【技术特征摘要】
1.一种基于随机森林模型的训练方法,其特征在于,包括:获取所述随机森林模型,其中,所述随机森林模型包括多颗决策树;获取多个训练样本数据,所述训练样本数据包括类别数据和特征样本数据;依次将多个所述训练样本数据输入所述随机森林模型,获得多个预测数据;根据多个所述预测数据和多个所述类别数据计算所述随机森林模型的精度;根据所述精度对所述随机森林模型进行优化,获得调优随机森林模型。2.根据权利要求1所述的基于随机森林模型的训练方法,其特征在于,所述根据多个所述预测数据和多个所述类别数据计算所述随机森林模型的精度的步骤,包括:计算多个所述预测数据的相关性和/或误差;根据所述相关性和/或所述误差得到所述随机森林模型的所述精度。3.根据权利要求1所述的基于随机森林模型的训练方法,其特征在于,所述根据所述精度对所述随机森林模型进行优化,获得调优随机森林模型的步骤,包括:根据所述随机森林模型的所述精度和优化规则调整所述随机森林模型的模型参数,获得调优模型参数;根据所述调优模型参数训练所述随机森林模型,获得所述调优随机森林模型。4.根据权利要求1所述的基于随机森林模型的训练方法,其特征在于,所述获取所述随机森林模型的步骤,包括:获取学习样本数据集;根据所述学习样本数据集获取多个学习样本数据子集;根据多个所述学习样本数据子集和分类回归方法分别生成多颗所述决策树,多颗所述决策树构成所述随机森林模型。5.根据权利要求4所述的基于随机森林模型的训练方法,其特征在于,所述根据所述学习样本数据集获取多个学习样本数据子集的步骤,包括重复执行以下处理:从所述学习样本数据集中有放回的随机获取多个样本数据,组成第l个样本数据子集,l>0。6.根据权利要求5所述的基于随机森林模型的训练方法,其特征在于,所述根据多个所述学习样本数据子集和分类回归方法分别生成多颗所述决策树的步骤,包括重...

【专利技术属性】
技术研发人员:李旭青刘世盟金永涛李龙
申请(专利权)人:北华航天工业学院
类型:发明
国别省市:河北,13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1