数据处理装置及数据处理方法制造方法及图纸

技术编号：14945343 阅读：48 留言：0更新日期：2017-04-01 11:46

本申请公开了一种用于多模型系统中的模型融合的数据处理装置和数据处理方法，该数据处理装置包括：特征空间划分单元，被配置为将待测数据集的特征空间分割为多个特征空间划分，以使得该特征空间划分对于多个模型中的至少一个模型而言是优化的；融合单元，被配置为基于训练数据集获得特征空间上的至少由多个模型的子集融合得到的融合模型，其中，融合单元以特征空间划分为单位来获得新特征空间划分模式，同时针对新特征空间划分模式以及各个新特征空间划分使用的、作为多个模型的子集的模型子集两者进行优化，以获得针对整个特征空间的融合模型的整体最佳性能。

全部详细技术资料下载

【技术实现步骤摘要】

本申请的实施例涉及数据处理领域，具体地涉及用于多模型系统中的模型融合的数据处理装置和数据处理方法。
技术介绍
随着社会的进步，信息技术也在飞速发展，如何高效地处理海量的信息变得尤为重要，机器学习技术在其中起到了重要的作用。机器学习是一门多领域交叉学科，研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。而多模型融合则是机器学习中的热门研究方向，多模型融合是使用一系列模型进行学习，并使用某种规则把各个学习结果进行整合从而获得比单个模型更好的学习效果的一种机器学习方法。模型融合的方法有很多种，从模型角度分有同质模型融合和异质模型融合。同质模型融合是指被融合的多个模型都是同一类型的，比如多个神经网络的融合、多个决策树的融合。异质模型融合是指被融合的多个模型不属于同一类型，比如将神经网络、最大熵、决策树等模型进行融合。从模型的拓扑结构上看有串行和并行方式，串行的方式是多个模型以串行的方式连接，前一个模型的输出作为后一个模型的输入，由最后的模型给出系统的最终结果。并行的方式是指多个模型都使用系统的输入进行训练，各自输出结果，系统将多个模型的结果统合以后给出最终的结果。从处理方式上看有在特征上进行融合的还有在结果上进行融合。在结果上进行融合的方法只处理模型输出的结果，通过某种方式将其融合起来。而在特征上进行融合的方法则将特征空间进行细分，并针对不...

【技术保护点】
一种用于多模型系统中的模型融合的数据处理装置，包括：特征空间划分单元，被配置为将待测数据集的特征空间分割为多个特征空间划分，以使得该特征空间划分对于多个模型中的至少一个模型而言是优化的；以及融合单元，被配置为基于训练数据集获得所述特征空间上的至少由所述多个模型的子集融合得到的融合模型，其中，所述融合单元以所述特征空间划分为单位来获得新特征空间划分模式，同时针对所述新特征空间划分模式以及各个新特征空间划分使用的、作为所述多个模型的子集的模型子集两者进行优化，以获得针对整个特征空间的融合模型的整体最佳性能。

【技术特征摘要】
1.一种用于多模型系统中的模型融合的数据处理装置，包括：
特征空间划分单元，被配置为将待测数据集的特征空间分割为多个特
征空间划分，以使得该特征空间划分对于多个模型中的至少一个模型而言
是优化的；以及
融合单元，被配置为基于训练数据集获得所述特征空间上的至少由所
述多个模型的子集融合得到的融合模型，其中，所述融合单元以所述特征
空间划分为单位来获得新特征空间划分模式，同时针对所述新特征空间划
分模式以及各个新特征空间划分使用的、作为所述多个模型的子集的模型
子集两者进行优化，以获得针对整个特征空间的融合模型的整体最佳性
能。
2.根据权利要求1所述的数据处理装置，其中，所述融合单元被配
置为使用遗传算法来进行所述优化。
3.根据权利要求1或2所述的数据处理装置，其中，所述融合单元
包括：
权重设置模块，被配置为针对当前特征空间划分模式，基于各个模型
在训练数据集上的性能确定相应模型的权重；
总分值计算模块，被配置为基于所述权重，使用所述模型子集中的各
个模型对每个样本分类获得的分值来计算该样本属于某一类别的总分值；
以及
分类模块，被配置为将最大的总分值对应的类别作为使用该模型子集
对该样本处理获得的结果。
4.根据权利要求3所述的数据处理装置，其中，所述权重设置模块
还被配置为将所述性能低于一定阈值的模型的权重设置为0。
5.根据权利要求1或2所述的数据处理装置，其中，所述融合单元
将基于所述新特征空间划分模式和各个新特征空间划分使用的模型子集
对训练数据集进行处理所获得的结果的正确率作为优化目标函数。
6.根据权利要求1或2所述的数据处理装置，其中，所述特征空间
划分单元包括：
伪标签获取模块，被配置为使用所述多模型系统中不同于目标模型的

\t模型作为校准模型对待测数据集进行处理，并将处理的结果作为伪标签...

【专利技术属性】
技术研发人员：夏迎炬，孙健，侯翠琴，杨铭，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人