【技术实现步骤摘要】
本专利技术的实施例总体上涉及机器学习领域,并且更具体地,涉及用于混合模型选择的方法和装置。
技术介绍
混合模型(mixture model)是一种使用混合分布用于密度估计的概率模型,其可以表示一个大群体中存在子群体。混合模型可以包括多种模型,例如高斯混合模型、分段线性混合模型等,这些模型已被广泛应用于多种领域,诸如文档分类、手写识别、模糊图像分割等。在实践中,混合模型的模型选择是一个非常重要而又具有挑战性的问题。业界已经提出了一些方法来进行混合模型的模型选择,其中变分推理(variational inference)是一种比较有效的方法,其试图给出边际对数似然的解析近似。然而,变分推理对于初始化较为敏感,如果初始化不适当,则变分推理的效果可能会变得很差,从而无法准确地选择模型。因此,初始化已经成为影响变分推理的精度和效率的重要因素。目前,变分推理的初始化方法例如可以包括随机初始化、基于聚类的初始化等等。然而,随机初始化通常需要尝试大量的初始化样本来实现,处理耗时较长,从而会造成模型选择的速度较慢。另外,基于聚类的初始化对于以聚类为目标的混合模型(例如,高斯混合模型)可能是比较有效的,但是对于以回归/分类为目标的混合模型而言并不适合使用,所以基于聚类的初始化通用性较低。因此,需要一种更为通用且高效的初始化方案来实现混合模型选择。
技术实现思路
总体上,本专利技术的实施例提出一种用于混合模型选择的技术方案。在本专利技术的一个方面,提供一种用于混合模型选择的方法。所述方法包括:基于训练样本集来确定候选初始化参数的集合;利用预定的统计模型,基于候选初始化参数的集合确 ...
【技术保护点】
一种用于混合模型选择的方法,所述方法包括:基于训练样本集来确定候选初始化参数的集合;利用预定的统计模型,基于所述候选初始化参数的集合确定目标初始化参数的集合;以及基于所述目标初始化参数的集合来确定目标模型。
【技术特征摘要】
1.一种用于混合模型选择的方法,所述方法包括:基于训练样本集来确定候选初始化参数的集合;利用预定的统计模型,基于所述候选初始化参数的集合确定目标初始化参数的集合;以及基于所述目标初始化参数的集合来确定目标模型。2.根据权利要求1所述的方法,其中利用预定的统计模型,基于所述候选初始化参数的集合确定目标初始化参数的集合包括:根据所述候选初始化参数的集合对所述目标初始化参数的集合进行初始化;以及执行以下操作一次或多次:利用所述目标初始化参数的集合中的目标初始化参数以及与所述目标初始化参数相对应的临时模型的性能来训练所述预定的统计模型;以及基于经过训练的所述预定的统计模型从所述候选初始化参数的集合中选择候选初始化参数,以更新所述目标初始化参数的集合。3.根据权利要求2所述的方法,其中根据所述候选初始化参数的集合对所述目标初始化参数的集合进行初始化包括:从所述候选初始化参数的集合中选择至少一个候选初始化参数,作为所述目标初始化参数的集合中的目标初始化参数。4.根据权利要求2所述的方法,其中基于经过训练的所述预定的统计模型从所述候选初始化参数的集合中选择候选初始化参数,以更新所述目标初始化参数的集合包括:利用经过训练的所述预定的统计模型来预测与所述候选初始化参数的集合中的候选初始化参数相对应的临时模型的性能;以及按照所预测的性能,选择所述候选初始化参数的集合中的至少一个候选初始化参数来更新所述目标初始化参数的集合。5.根据权利要求4所述的方法,其中利用经过训练的所述预定的统计模型来预测与所述候选初始化参数的集合中的候选初始化参数相
\t对应的临时模型的性能包括:利用所述统计模型来计算与所述候选初始化参数相对应的临时模型的性能的均值和方差;以及根据所述均值和所述方差来确定与所述候选初始化参数相对应的临时模型的性能预测值。6.根据权利要求4所述的方法,其中按照所预测的性能,选择所述候选初始化参数的集合中的至少一个候选初始化参数来更新所述目标初始化参数的集合包括:将所述候选初始化参数的集合中的与所预测的最优性能相对应的候选初始化参数确定为所述目标初始化参数的集合中的一个目标初始化参数;以及从所述候选初始化参数的集合中去除与所预测的最优性能相对应的所述候选初始化参数。7.根据权利要求1所述的方法,其中基于训练样本集来确定候选初始化参数的集合包括:基于所述训练样本集来确定候选模型;以及基于所述候选模型的第一初始化参数和更新初始化参数中的至少一个,生成所述候选初始化参数的集合,其中所述候选模型根据所述第一初始化参数而生成,并且所述更新初始化参数被包含在所述候选模型的输出中。8.根据权利要求1所述的方法,其中基于训练样本集来确定候选初始化参数的集合包括:基于所述训练样本集,确定所述候选初始化参数所服从的分布,其中所述候选初始化参数是候选初始化模型参数;以及对所确定的分布进行采样,以生成所述候选初始化参数的集合中的候选初始化参数。9.根据权利要求1所述的方法,其中基于训练样本集来确定候选初始化参数的集合包括:对所述训练样本集随机分组;以及基于所述分组结果,确定所述候选初始化参数的集合中的候选初
\t始化参数,其中所述候选初始化参数是候选初始化隐变量。10.根据权利要求1所述的方法,其中基于所述目标初始化参数的集合来确定目标模型包括:通过训练所述目标初始化参数的集合中的每个目标初始化参数来生成中间模型;以及基于所述中间模型的性能来确定所述目标模型。11.一种用于混合模型选择的装置,所述装置包...
【专利技术属性】
技术研发人员:刘春辰,王虎,冯璐,
申请(专利权)人:日本电气株式会社,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。