用于训练混合模型的方法和设备技术

技术编号:16457218 阅读:45 留言:0更新日期:2017-10-25 21:20
本公开的实施例涉及用于训练混合模型的方法和设备。该混合模型包括多个子模型。该方法包括:响应于接收到第一数据集,确定第一数据集相对于多个子模型的第一分布。该方法还包括:迭代执行以下操作至少一次,直至收敛条件被满足:基于第一分布,降低多个子模型中的第一子模型的第一子空间维度;以及基于降低后的第一子空间维度,更新第一分布。本公开的实施例能够实现自动学习用于降维的混合模型。

Method and apparatus for training hybrid models

Embodiments of the present disclosure involve methods and apparatus for training a hybrid model. The hybrid model includes multiple submodels. The method comprises the following steps: determining the first distribution of the first data set relative to the plurality of sub models in response to receiving the first data set. The method also includes the following iteration at least once, until the convergence condition is satisfied: Based on the first distribution, the first subspace dimension reduction of the first sub sub model in the model; and based on the first subspace dimensionality reduction after the update of the first distribution. The implementation of the present disclosure enables automatic learning of a hybrid model for dimensionality reduction.

【技术实现步骤摘要】
用于训练混合模型的方法和设备
本公开的实施例涉及机器学习领域,并且更具体地涉及用于训练混合模型的方法和设备。
技术介绍
混合模型是一种使用混合分布的用于密度估计的概率模型,混合模型可以包括多个子模型。混合模型的示例包括但不限于高斯混合模型、分段线性混合模型,等等。这些模型已被广泛应用于多种领域,诸如图像分类、文档分类、模糊图像分割等。数据降维(DimensionalityReduction)是指通过线性或非线性映射将高维空间中的数据映射到低维空间中,从而获得高维数据的低维表示,数据降维能够减少原始数据的冗余性。在机器学习领域中,常见的数据降维方式包括主成分分析(PrincipalComponentAnalysis,PCA)、线性判别分析(LinearDiscriminantAnalysis,LDA)、局部线性嵌入(LocallyLinearEmbedding,LLE)、拉普拉斯特征映射(LaplacianEigenmaps),等等。混合概率主成分分析(MixturesofProbabilisticPrincipleComponentAnalyzers,MPPCA)是一种适用于大规模数本文档来自技高网...
用于训练混合模型的方法和设备

【技术保护点】
一种用于训练混合模型的方法,所述混合模型包括多个子模型,所述方法包括:响应于接收到第一数据集,确定所述第一数据集相对于所述多个子模型的第一分布;以及迭代执行以下操作至少一次,直至收敛条件被满足:基于所述第一分布,降低所述多个子模型中的第一子模型的第一子空间维度;以及基于降低后的所述第一子空间维度,更新所述第一分布。

【技术特征摘要】
1.一种用于训练混合模型的方法,所述混合模型包括多个子模型,所述方法包括:响应于接收到第一数据集,确定所述第一数据集相对于所述多个子模型的第一分布;以及迭代执行以下操作至少一次,直至收敛条件被满足:基于所述第一分布,降低所述多个子模型中的第一子模型的第一子空间维度;以及基于降低后的所述第一子空间维度,更新所述第一分布。2.根据权利要求1所述的方法,其中所述收敛条件包括以下至少一个:所述迭代的次数达到预定次数,以及所述第一分布和所述第一子空间维度中至少一个的变化量低于预定阈值。3.根据权利要求1或2所述的方法,其中所述第一数据集来自流数据中,所述方法还包括:响应于接收到所述流数据中在所述第一数据集之后的第二数据集,确定所述第二数据集相对于所述多个子模型的第二分布;以及迭代执行以下操作至少一次,直至收敛条件被满足:基于所述第二分布,降低所述多个子模型中的第二子模型的第二子空间维度;以及基于降低后的所述第二子空间维度,更新所述第二分布。4.根据权利要求3所述的方法,还包括:响应于对所述混合模型的调用,确定所述混合模型中是否包含不活跃子模型,所述不活跃子模型上分布的数据量小于阈值量;响应于确定所述混合模型中包括所述不活跃子模型,通过移除所述不活跃子模型来收缩所述混合模型。5.根据权利要求1所述的方法,其中所述第一分布由所述第一数据集的隐变量的变分分布表示,并且确定所述第一分布包括:随机地初始化所述隐变量的变分分布。6.根据权利要求1所述的方法,其中所述混合模型包括主成分分析(PCA)模型、线性判别分析(LDA)模型、局部线性嵌入(LLE)模型或者拉普拉斯特征映射模型。7.一种用于训练混合模型...

【专利技术属性】
技术研发人员:刘春辰冯璐卫文娟藤卷辽平
申请(专利权)人:日本电气株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1