【技术实现步骤摘要】
本专利技术的实施例总体上涉及机器学习领域,并且更具体地,涉及用于混合模型选择的方法和装置。
技术介绍
混合模型(mixture model)是一种使用混合分布用于密度估计的概率模型,其可以表示一个大群体中存在子群体。混合模型可以包括多种模型,例如高斯混合模型、分段线性混合模型等,这些模型已被广泛应用于多种领域,诸如文档分类、手写识别、模糊图像分割等。在实践中,混合模型的模型选择是一个非常重要而又具有挑战性的问题。业界已经提出了一些方法来进行混合模型的模型选择,其中变分推理(variational inference)是一种比较有效的方法,其试图给出边际对数似然的解析近似。然而,变分推理对于初始化较为敏感,如果初始化不适当,则变分推理的效果可能会变得很差,从而无法准确地选择模型。因此,初始化已经成为影响变分推理的精度和效率的重要因素。目前,变分推理的初始化方法例如可以包括随机初始化、基于聚类的初始化等等。然而,随机初始化通常需要尝试大量的初始化样本来实现,处理耗时较长,从而会造成模型选择的速度较慢。另外,基于聚类的初始化对于以聚类为目标的混合模型(例如,高斯混合模型)可能是比较有效的,但是对于以回归/分类为目标的混合模型而言并不适合使用,所以基于聚类的初始化通用性较低。因此,需要一种处理速度快并且更为通用的初始化方案来实现混合模型选择。
技术实现思路
总体上,本专利技术的实施例提出一种用于混合模型选择的技术方案。在本专利技术的一个方面,提供一种用于混合模型选择的方法。所述方法包括:通过训练多个第一初始化隐变量来生成多个候选模型;基于多个候选模型确定第二初始化隐 ...
【技术保护点】
一种用于混合模型选择的方法,所述方法包括:通过训练多个第一初始化隐变量来生成多个候选模型;基于所述多个候选模型确定第二初始化隐变量;以及基于所述第二初始化隐变量来确定目标模型。
【技术特征摘要】
1.一种用于混合模型选择的方法,所述方法包括:通过训练多个第一初始化隐变量来生成多个候选模型;基于所述多个候选模型确定第二初始化隐变量;以及基于所述第二初始化隐变量来确定目标模型。2.根据权利要求1所述的方法,其中通过训练多个第一初始化隐变量来生成多个候选模型包括:基于训练样本集来确定所述多个第一初始化隐变量;以及针对所述多个第一初始化隐变量中的每个第一初始化隐变量,在训练样本集上进行学习,以生成与所述每个第一初始化隐变量相对应的候选模型。3.根据权利要求1所述的方法,其中基于所述多个候选模型确定第二初始化隐变量包括:对所述多个候选模型进行配对;以及基于配对的候选模型确定所述第二初始化隐变量。4.根据权利要求1所述的方法,其中基于所述多个候选模型确定第二初始化隐变量包括:基于所述多个候选模型的性能从所述多个候选模型中选择至少两个候选模型;对所述至少两个候选模型进行配对;以及基于配对的候选模型确定所述第二初始化隐变量。5.根据权利要求4所述的方法,其中基于所述多个候选模型的性能从所述多个候选模型中选择至少两个候选模型包括:基于所述多个候选模型中的每个候选模型的更新的隐变量变分分布、模型参数和模型结构,来确定所述每个候选模型的性能;基于所确定的性能对所述多个候选模型进行排序;以及基于所述排序从所述多个候选模型中选择至少两个候选模型。6.根据权利要求3或者4所述的方法,其中所述配对的候选模型
\t中的每对候选模型包括第一候选模型和第二候选模型,其中基于配对的候选模型确定所述第二初始化隐变量包括:基于所述每对候选模型中的第一候选模型的更新隐变量和第二候选模型的更新隐变量,来确定一个第二初始化隐变量。7.根据权利要求6所述的方法,其中基于所述每对候选模型中的第一候选模型的更新隐变量和第二候选模型的更新隐变量,来确定一个第二初始化隐变量包括:执行以下操作一次或多次:选择所述每对候选模型中的第一候选模型的更新隐变量中的一个样本组作为第一样本组;基于所述第一样本组,从所述每对候选模型中的第二候选模型的更新隐变量中的样本组确定第二样本组;确定所述第一样本组与所述第二样本组的交集;基于所述交集将所述第一样本组分割为两个子集;以及基于所述两个子集构建第二初始化隐变量。8.根据权利要求7所述的方法,其中基于所述两个子集构建所述第二初始化隐变量包括:如果所构建的第二初始化隐变量的样本组数目少于所述第一初始化隐变量的样本组数目,则执行以下操作直至所述第二初始化隐变量的样本组数目等于所述第一初始化隐变量的样本组数目:选择所述第二初始化隐变量中的一个样本组;将选择的样本组分割为两部分,以作为所述第二初始化隐变量的两个样本组;以及从所述第二初始化隐变量中删除所述选择的样本组。9.根据权利要求1所述的方法,其中基于所述多个候选模型确定第二初始化隐变量包括:执行以下操作一次或多次:通过训练所述多个第二初始化隐变量来得到多个中间模型;基于所述多个中间模型确定第三初始化隐变量;以及利用所述第三初始化隐变量更新所述第二初始化隐变量。10.根据权利要求1所述的方法,其中具有多个第二初始化隐变量,并且其中基于所述第二初始化隐变量来确定目标模型包括:通过训练所述多个第二初始化隐变量来得到多个中间模型;确定所述多个中间模型的性能;以及基于所述性能选择所述多个中间模型中之一作为所述目标模型。11.一种用于混合模型选择的装置,所述装置包括:候选模型生成单元,被配置为通过训练多个第一初始化隐变量来生成多个候选模型;第一确定单元,被配置为基于所述多个候选模型确定第二初始化隐变量...
【专利技术属性】
技术研发人员:刘春辰,王虎,冯璐,藤卷辽平,
申请(专利权)人:日本电气株式会社,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。