基于随机森林的分类模型构建装置、方法及电子设备制造方法及图纸

技术编号:21004501 阅读:46 留言:0更新日期:2019-04-30 21:38
本发明专利技术实施例提供一种基于随机森林的分类模型构建装置、方法及电子设备,通过利用具有较少数量的树的随机森林构建分类模型,且根据该随机森林的至少一组目标种类选择特征来构成该随机森林中树的各个节点的随机特征集,因此,能够在降低分类模型的复杂度以及计算量的同时具有较好的识别精度,从而能够在利用电子设备进行模式识别的情况下,在降低电子设备能耗的同时保证识别良好的识别效果。

【技术实现步骤摘要】
基于随机森林的分类模型构建装置、方法及电子设备
本专利技术涉及信息
,尤其涉及一种基于随机森林的分类模型构建装置、方法及电子设备。
技术介绍
近年来,模式识别在各个领域应用广泛。模式识别包括人体动作识别、语音识别、指纹识别、人脸识别等。例如,人体动作识别在医疗健康、智能看护、动作捕捉等领域具有广泛的应用。人体动作识别可基于视频影像或基于集成了惯性传感单元(IMU,Inertialmeasurementunit)的可穿戴设备来进行特征提取,进一步利用分类模型进行动作类型的判别。基于随机森林的分类模型是模式识别领域常用的分类模型之一。传统的基于随机森林的分类模型中树的数量较多,一般有几百棵,其识别精度也较高。应该注意,上面对技术背景的介绍只是为了方便对本专利技术的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本专利技术的
技术介绍
部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
技术实现思路
专利技术人发现,虽然传统的基于随机森林的分类模型的识别精度较高,但是,对于利用例如可穿戴设备等电子设备进行例如人体动作识别等模式识别时,传统的基于随机森林的分类模型中树的个数及以及树的节点的数量较多,导致计算复杂度高、识别实时性差以及电子设备能耗较高等问题。本专利技术实施例提供一种基于随机森林的分类模型构建装置、方法及电子设备,利用具有较少数量的树的随机森林构建分类模型,且根据该随机森林的至少一组目标种类选择特征来构成该随机森林中树的各个节点的随机特征集,因此,能够在降低分类模型的复杂度以及计算量的同时具有较好的识别精度,从而能够在利用电子设备进行模式识别的情况下,在降低电子设备能耗的同时保证识别良好的识别效果。根据本专利技术实施例的第一方面,提供一种基于随机森林的分类模型构建装置,所述装置包括:提取单元,其用于根据采集数据提取特征,并确定特征总集合;确定单元,其用于确定树的数量小于或等于第一阈值的随机森林的至少一组目标种类,所述一组目标种类具有至少两个目标种类;第一选择单元,其用于对于每一组目标种类,分别在所述特征总集合中选择使得所述一组目标种类中的各个目标种类的区分能力最大化的至少一个特征,将对于所有组目标种类选择出的所有特征的并集作为选择特征集合;第二选择单元,其用于对于所述随机森林中的每一棵树的每个节点,从所述选择特征集合和所述特征总集合中选择出总数为预定数量的特征构成为所述节点的随机特征集;第三选择单元,其用于从每个节点的所述随机特征集中选择一个特征作为所述节点的最优切分变量,并确定所述最优切分变量的最优切分点。根据本专利技术实施例的第二方面,提供一种电子设备,包括根据本专利技术实施例的第一方面所述的装置。根据本专利技术实施例的第三方面,提供一种基于随机森林的分类模型构建方法,所述方法包括:根据采集数据提取特征,并确定特征总集合;确定树的数量小于或等于第一阈值的随机森林的至少一组目标种类,所述一组目标种类具有至少两个目标种类;对于每一组目标种类,分别在所述特征总集合中选择使得所述一组目标种类中的各个目标种类的区分能力最大化的至少一个特征,将对于所有组目标种类选择出的所有特征的并集作为选择特征集合;对于所述随机森林中的每一棵树的每个节点,从所述选择特征集合和所述特征总集合中选择出总数为预定数量的特征构成为所述节点的随机特征集;从每个节点的所述随机特征集中选择一个特征作为所述节点的最优切分变量,并确定所述最优切分变量的最优切分点。本专利技术的有益效果在于:通过利用具有较少数量的树的随机森林构建分类模型,且根据该随机森林的至少一组目标种类选择特征来构成该随机森林中树的各个节点的随机特征集,因此,能够在降低分类模型的复杂度以及计算量的同时具有较好的识别精度,从而能够在利用电子设备进行模式识别的情况下,在降低电子设备能耗的同时保证识别良好的识别效果。参照后文的说明和附图,详细公开了本专利技术的特定实施方式,指明了本专利技术的原理可以被采用的方式。应该理解,本专利技术的实施方式在范围上并不因而受到限制。在所附权利要求的精神和条款的范围内,本专利技术的实施方式包括许多改变、修改和等同。针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。应该强调,术语“包括/包含”在本文使用时指特征、整件、步骤或组件的存在,但并不排除一个或更多个其它特征、整件、步骤或组件的存在或附加。附图说明所包括的附图用来提供对本专利技术实施例的进一步的理解,其构成了说明书的一部分,用于例示本专利技术的实施方式,并与文字描述一起来阐释本专利技术的原理。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:图1是本专利技术实施例1的基于随机森林的分类模型构建装置的示意图;图2是本专利技术实施例1的确定单元102的示意图;图3是本专利技术实施例1的随机森林和参考随机森林的识别结果对比图;图4是本专利技术实施例1的第一选择单元103的示意图;图5是本专利技术实施例1的选择特征的方法示意图;图6是本专利技术实施例2的电子设备的示意图;图7是本专利技术实施例2的电子设备的系统构成的示意框图;图8是本专利技术实施例3的基于随机森林的分类模型构建方法的示意图。具体实施方式参照附图,通过下面的说明书,本专利技术的前述以及其它特征将变得明显。在说明书和附图中,具体公开了本专利技术的特定实施方式,其表明了其中可以采用本专利技术的原则的部分实施方式,应了解的是,本专利技术不限于所描述的实施方式,相反,本专利技术包括落入所附权利要求的范围内的全部修改、变型以及等同物。实施例1本实施例提供一种基于随机森林的分类模型构建装置,图1是本专利技术实施例1的基于随机森林的分类模型构建装置的示意图。如图1所示,基于随机森林的分类模型构建装置100包括:提取单元101,其用于根据采集数据提取特征,并确定特征总集合;确定单元102,其用于确定树的数量小于或等于第一阈值的随机森林的至少一组目标种类,该一组目标种类具有至少两个目标种类;第一选择单元103,其用于对于每一组目标种类,分别在该特征总集合中选择使得该一组目标种类中的各个目标种类的区分能力最大化的至少一个特征,将对于所有组目标种类选择出的所有特征的并集作为选择特征集合;第二选择单元104,其用于对于该随机森林中的每一棵树的每个节点,从该选择特征集合和该特征总集合中选择出总数为预定数量的特征构成为该节点的随机特征集;第三选择单元105,其用于从每个节点的该随机特征集中选择一个特征作为该节点的最优切分变量,并确定该最优切分变量的最优切分点。由上述实施例可知,通过利用具有较少数量的树的随机森林构建分类模型,且根据该随机森林的至少一组目标种类选择特征来构成该随机森林中树的各个节点的随机特征集,因此,能够在降低分类模型的复杂度以及计算量的同时具有较好的识别精度,从而能够在利用电子设备进行模式识别的情况下,在降低电子设备能耗的同时保证识别良好的识别效果。在本实施例中,该基于随机森林的分类模型构建装置构建出的分类模型可用于各种类型的模式识别。在本实例中,以人体动作识别为例进行示例性的说明。在本实施例中,提取单元1本文档来自技高网...

【技术保护点】
1.一种基于随机森林的分类模型构建装置,所述装置包括:提取单元,其用于根据采集数据提取特征,并确定特征总集合;确定单元,其用于确定树的数量小于或等于第一阈值的随机森林的至少一组目标种类,所述一组目标种类具有至少两个目标种类;第一选择单元,其用于对于每一组目标种类,分别在所述特征总集合中选择使得所述一组目标种类中的各个目标种类的区分能力最大化的至少一个特征,将对于所有组目标种类选择出的所有特征的并集作为选择特征集合;第二选择单元,其用于对于所述随机森林中的每一棵树的每个节点,从所述选择特征集合和所述特征总集合中选择出总数为预定数量的特征构成为所述节点的随机特征集;第三选择单元,其用于从每个节点的所述随机特征集中选择一个特征作为所述节点的最优切分变量,并确定所述最优切分变量的最优切分点。

【技术特征摘要】
1.一种基于随机森林的分类模型构建装置,所述装置包括:提取单元,其用于根据采集数据提取特征,并确定特征总集合;确定单元,其用于确定树的数量小于或等于第一阈值的随机森林的至少一组目标种类,所述一组目标种类具有至少两个目标种类;第一选择单元,其用于对于每一组目标种类,分别在所述特征总集合中选择使得所述一组目标种类中的各个目标种类的区分能力最大化的至少一个特征,将对于所有组目标种类选择出的所有特征的并集作为选择特征集合;第二选择单元,其用于对于所述随机森林中的每一棵树的每个节点,从所述选择特征集合和所述特征总集合中选择出总数为预定数量的特征构成为所述节点的随机特征集;第三选择单元,其用于从每个节点的所述随机特征集中选择一个特征作为所述节点的最优切分变量,并确定所述最优切分变量的最优切分点。2.根据权利要求1所述的装置,其中,所述确定单元包括:第一确定单元,其用于根据所述采集数据对树的数量小于或等于所述第一阈值的所述随机森林进行训练与测试,确定所述随机森林对于各个种类的识别准确率;第二确定单元,其用于根据所述采集数据对树的数量大于或等于第二阈值的参考随机森林进行训练与测试,确定所述参考随机森林对于各个种类的识别准确率,所述第二阈值大于所述第一阈值;第三确定单元,其用于比较所述随机森林对于各个种类的识别准确率和所述参考随机森林对于各个种类的识别准确率,根据比较结果确定树的数量小于所述第一阈值的所述随机森林的所述至少一组目标种类。3.根据权利要求1所述的装置,其中,所述第一选择单元包括:第四选择单元,其用于当对每一组目标种类分别在所述特征总集合中选择使得所述一组目标种类中的各个目标种类的区分能力最大化的一个特征时,根据所述特征总集合中各个特征的信息增益进行选择;第五选择单元,其用于当对每一组目标种类分别在所述特征总集合中选择使得所述一组目标种类中的各个目标种类的区分能力最大化的至少两个特征时,根据所述特征总集合中各个特征之间的互信息增益进行选择。4.根据权利要求1所述的装置,其中,所述第二选择单元对于所述随机森林中的每一棵树的每个节点,从所述选择特征集合中无重复且不放回的随机选择特征,使得对于所述随机森林中的同一颗树的所有节点,从所述选择特征集合中选择的特征相同,且对于所述随机森林的所有树,从所述选择特征集合中选择的所有特征构成整个所述选择特征集合;从所述特征总集合中去除从所述选择特征集合中选择的所述特征后的特征中随机选择特征,使得对于所述节点选择的特征总数达到所述预定数量。5.一种电子设备,包括根据权利要求1-4中的任一项所述的装置。6.一种基于...

【专利技术属性】
技术研发人员:丁根明田军赵倩谢莉莉
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1