Embodiments of the invention relate to methods and apparatus for hybrid model selection. The method includes: training sample set to determine the candidate model based on; based on the first initialization of hidden variables and hidden variables to update the candidate model at least one of the second generation set initialization of hidden variables, the candidate model according to the first initialization of hidden variables generated, and update the hidden variables indicate sample grouping result candidate model output; and a collection of second initialization of hidden variables is determined based on the target model.
【技术实现步骤摘要】
本专利技术的实施例总体上涉及机器学习领域,并且更具体地,涉及用于混合模型选择的方法和装置。
技术介绍
混合模型(mixture model)是一种使用混合分布用于密度估计的概率模型,其可以表示一个大群体中存在子群体。混合模型可以包括多种模型,例如高斯混合模型、分段线性混合模型等,这些模型已被广泛应用于多种领域,诸如文档分类、手写识别、模糊图像分割等。在实践中,混合模型的模型选择是一个非常重要而又具有挑战性的问题。业界已经提出了一些方法来进行混合模型的模型选择,其中变分推理(variational inference)是一种比较有效的方法,其试图给出边际对数似然的解析近似。然而,变分推理对于初始化较为敏感,如果初始化不适当,则变分推理的效果可能会变得很差,从而无法准确地选择模型。因此,初始化已经成为影响变分推理的精度和效率的重要因素。目前,变分推理的初始化方法例如可以包括随机初始化、基于聚类的初始化等等。然而,随机初始化通常需要尝试大量的初始化样本来实现,处理耗时较长,从而会造成模型选择的速度较慢。另外,基于聚类的初始化对于以聚类为目标的混合模型(例如,高斯混合模型)可能是比较有效的,但是对于以回归/分类为目标的混合模型而言并不适合使用,所以基于聚类的初始化通用性较低。因此,需要一种更为通用且高效的初始化方案来实现混合模型选择。
技术实现思路
总体上,本专利技术的实施例提出一种用于混合模型选择的技术方案。在本专利技术的一个方面,提供一种用于混合模型选择的方法。所述方法包括:基于训练样本集来确定候选模型;基于候选模型的第一初始化隐变量和更新隐变量中的至少一个,生 ...
【技术保护点】
一种用于混合模型选择的方法,所述方法包括:基于训练样本集来确定候选模型;基于所述候选模型的第一初始化隐变量和更新隐变量中的至少一个,生成第二初始化隐变量的集合,其中所述候选模型根据所述第一初始化隐变量而生成,并且所述更新隐变量表示所述候选模型输出的样本分组结果;以及基于所述第二初始化隐变量的集合来确定目标模型。
【技术特征摘要】
1.一种用于混合模型选择的方法,所述方法包括:基于训练样本集来确定候选模型;基于所述候选模型的第一初始化隐变量和更新隐变量中的至少一个,生成第二初始化隐变量的集合,其中所述候选模型根据所述第一初始化隐变量而生成,并且所述更新隐变量表示所述候选模型输出的样本分组结果;以及基于所述第二初始化隐变量的集合来确定目标模型。2.根据权利要求1所述的方法,其中基于训练样本集来确定候选模型包括:基于所述训练样本集来确定第一初始化隐变量;以及根据所述第一初始化隐变量生成候选模型。3.根据权利要求1所述的方法,其中基于训练样本集来确定候选模型包括:基于所述训练样本集来确定多个第一初始化隐变量;基于所述多个第一初始化隐变量生成多个初始模型;以及根据所述多个初始模型的性能,选择所述多个初始模型中的至少一个作为候选模型。4.根据权利要求1所述的方法,其中基于所述候选模型的第一初始化隐变量和更新隐变量中的至少一个,生成第二初始化隐变量的集合包括:基于所述候选模型的第一初始化隐变量,生成第三初始化隐变量的集合;基于所述候选模型的更新隐变量,生成第四初始化隐变量的集合;以及基于所述第三初始化隐变量的集合和所述第四初始化隐变量的集合,确定所述第二初始化隐变量的集合。5.根据权利要求4所述的方法,其中基于所述候选模型的第一初始化隐变量,生成第三初始化隐变量的集合包括:通过对所述候选模型的第一初始化隐变量以及参考隐变量进行加权求和,生成所述第三初始化隐变量的集合中的第三初始化隐变量。6.根据权利要求4所述的方法,其中基于所述候选模型的更新隐变量,生成第四初始化隐变量的集合包括:从所述候选模型的更新隐变量中的多个样本组中选择一个样本组;将所选择的样本组分为多个子组;以及基于所述多个子组确定第四初始化隐变量的集合中的第四初始化隐变量。7.根据权利要求6所述的方法,其中从所述候选模型的更新隐变量中的多个样本组中选择一个样本组包括:确定所述多个样本组中的每个样本组的样本数目;以及从所述多个样本组中选择样本数目最大的一个样本组。8.根据权利要求1所述的方法,其中基于所述第二初始化隐变量的集合来确定目标模型包括:通过训练所述第二初始化隐变量的集合中的每个第二初始化隐变量来生成中间模型;以及基于所述中间模型的性能来确定所述目标模型。9.根据权利要求1所述的方法,其中基于所述第二初始化隐变量的集合来确定目标模型包括:利用预定的统计模型,基于所述第二初始化隐变量的集合来确定目标初始化隐变量的集合;通过训练所述目标初始化隐变量的集合中的每个目标初始化隐变量来生成中间模型;以及基于所述中间模型的性能来确定所述目标模型。10.根据权利要求9所述的方法,其中利用预定的统计模型,基于所述第二初始化隐变量的集合确定目标初始化隐变量的集合包括:根据所述第二初始化隐变量的集合对所述目标初始化隐变量的集合进行初始化;以及执行以下操作一次或多次:利用所述目标初始化隐变量的集合中的目标初始化隐变量以
\t及与所述目标初始化隐变量相对应的临时模型的性能来训练所述预定的统计模型;以及基于经过训练的所述预定的统计模型从所述第二初始化隐变量的集合中选择第二初始化隐变量,以更新所述目标初始化隐变量的集合。11.根据权利要求10所述的方法,其中根据所述第二初始化隐变量的集合对所述目标初始化隐变量的集合进行初始化包括:从所述第二初始化隐变量的集合中选择至少一个第二初始化隐变量,作为所述目标初始化隐变量的集合中的目标初始化隐变量。12.根据权利要求10所述的方法,其中基于经过训练的所述预定的统计模型从所述第二初始化隐变量的集合中选择第二初始化隐变量,以更新所述目标初始化隐变量的集合包括:利用经过训练的所述预定的统计模型来预测与所述第二初始化隐变量的集合中的第二初始化隐变量相对应的临时模型的性能;以及按照所预测的性能,选择所述第二初始化隐变量的集合中的至少一个第二初始化隐变量来更新所述目标初始化隐变量的集合。13.根据权利要求12所述的方法,其中利用经过训练的所述预定的统计模型来预测与所述第二初始化隐变量的集合中的第二初始化隐变量相对应的临时模型的性能包括:利用经过训练的所述预定统计模型来计算与所述第二初始化隐变量相对应的临时模型的性能的均值和方差;以及根据所述均值和所述方差来确定与所述第二初始化隐变量相对应的临时模型的性能预测值。14.根据权利要求12所述的方法,其中按照所预测的性能,选择所述第二初始化隐变量的集合中的至少一个第二初始化隐变量来更新所述目标初始化隐变量的集合包括:将所述第二初始化隐变量的集合中的与所预测的最优性能相对应的第二初始化隐变量确定为所述目标初始化隐变量的集合中的一个目标初始化隐变量;以及从所述第二初始化隐变量的集合中去除与所预测的最优性能相对
\t应的所述第二初始化隐变量。15.一种用于混合模型选择的装置,所述装置包括:候选模型确定单元,被配置为基于训练样本集来确定候选模型...
【专利技术属性】
技术研发人员:刘春辰,王虎,冯璐,藤卷辽平,
申请(专利权)人:日本电气株式会社,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。