预测模型搭建方法、系统及计算机存储介质技术方案

技术编号:35902003 阅读:17 留言:0更新日期:2022-12-10 10:38
本申请提供一种预测模型搭建方法、装置、计算机存储介质,包括:利用训练好的特征提取模型针对每一个训练样本执行特征提取,获得每一个训练样本的样本特征;根据多个不同的特征粒度,分别针对所有样本特征执行聚类分析,获得每一个特征粒度的特征聚类结果;根据每一个特征粒度的训练标签组、每一个特征粒度的特征聚类结果,训练每一个特征粒度的分类器,获得每一个特征粒度的训练好的分类器;根据预测需求,利用训练好的各分类器中的至少一个,搭建满足预测需求的预测模型。借此,本申请提供了一种多粒度表征无监督的模型搭建方案,可降低模型搭建成本并提高模型预测精度。模型搭建成本并提高模型预测精度。模型搭建成本并提高模型预测精度。

【技术实现步骤摘要】
预测模型搭建方法、系统及计算机存储介质


[0001]本申请实施例涉及模型训练
,特别涉及一种预测模型搭建方法、装置及计算机存储介质。

技术介绍

[0002]在许多实际应用场景中,训练模型需要大量的有标签数据,这需要人工事先标注大量数据,费时费力。因此,如何摒弃标签信息,提供预测模型直接从大量的无标签图片中学习到提取特征,成为当前模型训练亟需克服的问题。
[0003]对于无标签的样本数据,目前的模型训练方法是通过对比学习,使得模型能够简单区分不同样本的能力,但是此方法所训练的模型没有区分类别和类别之间的能力。
[0004]有鉴于此,亟需一种改善的模型搭建技术,以提高训练效率并降低训练成本。

技术实现思路

[0005]鉴于上述问题,本申请提供一种预测模型搭建方法、装置及计算机存储介质,可至少部分地解决现有技术中存在的技术问题。
[0006]本申请实施例的第一方面,提供一种预测模型搭建方法,包括:利用训练好的特征提取模型,针对每一个训练样本执行特征提取,获得每一个训练样本的样本特征;根据多个不同的特征粒度,分别针对所有样本特征执行聚类分析,获得每一个特征粒度的特征聚类结果;根据每一个特征粒度的训练标签组、每一个特征粒度的特征聚类结果,训练每一个特征粒度的分类器,获得每一个特征粒度的训练好的分类器;根据预测需求,利用训练好的各分类器中的至少一个,搭建满足所述预测需求的预测模型。
[0007]本申请实施例的第二方面,提供一种预测模型搭建装置,包括:特征提取模块,用于利用训练好的特征提取模型针对每一个训练样本执行特征提取,获得每一个训练样本的样本特征;聚类模块,用于根据多个不同的特征粒度,分别针对所有样本特征执行聚类分析,获得每一个特征粒度的特征聚类结果;训练模块,用于根据每一个特征粒度的训练标签组、每一个特征粒度的特征聚类结果,训练每一个特征粒度的分类器,获得每一个特征粒度的训练好的分类器;模型搭建模块,用于根据预测需求,利用训练好的各分类器中的至少一个,搭建满足所述预测需求的预测模型。
[0008]本申请实施例的第三方面,提供一种计算机存储介质,所述计算机存储介质中存储有用于执行上述第一方面所述的方法中各步骤的各指令。
[0009]综上所述,本申请各方面提供的预测模型搭建方案,通过多粒度表征无监督学习方法执行分类器训练,不仅可节省样本标注的人工成本和时间成本,且可提供较高的模型预测精度。此外,还可基于实际的预测需求,任意组合训练好的各个分类器,搭建满足实际预测需求的预测模型,可灵活满足不同的预测场景。
附图说明
[0010]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
[0011]图1为本申请示例性实施例的预测模型搭建方法的处理流程图。
[0012]图2为本申请另一示例性实施例的预测模型搭建方法的处理流程图。
[0013]图3为本申请示例性实施例的预测模型搭建装置的结构框图。
具体实施方式
[0014]为了使本领域的人员更好地理解本申请实施例中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请实施例一部分实施例,而不是全部的实施例。基于本申请实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本申请实施例保护的范围。
[0015]模型训练主要包括有监督方式和无监督方式,其中,有监督方式需要预先准备大量的有标签数据,会耗费大量的样本标注的人力成本和时间成本,而无监督方式所训练的预测模型,仅能够简单区分不同样本的能力,无法区分不同类别之间的能力,存在模型预测效果不佳的问题。
[0016]有鉴于此,本申请提供一种模型搭建技术,不仅可实现无监督方式的模型训练,且可确保模型预测精度。
[0017]以下将结合各附图详细描述本申请的各具体实施例。
[0018]图1为本申请示例性实施例的预测模型搭建方法的处理流程图,其主要包括以下步骤:
[0019]步骤S102,利用训练好的特征提取模型,针对每一个训练样本执行特征提取,获得每一个训练样本的样本特征。
[0020]可选地,训练样本包括无标签的图像样本。
[0021]于本实施例中,特征提取模型可利用任意一种现有模型训练方案训练获得,本申请对此不作限制。
[0022]步骤S104,根据多个不同的特征粒度,分别针对所有样本特征执行聚类分析,获得每一个特征粒度的特征聚类结果。
[0023]可选地,可利用预设聚类算法,根据每一个特征粒度,分别针对所有样本特征执行聚类分析,获得每一个特征粒度的特征聚类结果。
[0024]于本实施例中,每一个特征粒度的特征聚类结果包括有至少两个聚类特征集。
[0025]示例性地,若待预测目标为超市贩售商品,可将特征粒度设定为三个层级,其中,第一层级可将超市贩售商品分为“素食”和“荤食”两大类别;第二层级可将超市贩售商品分为“蔬菜”、“水果”、“肉禽蛋”三大类别;第三层级可将超市贩售商品分为“芹菜”、“菠菜”、“白菜”、“西瓜”、“橘子”、“牛肉”、“鸡肉”、“猪肉”等更多类别。
[0026]根据上述示例可以看出,当层级越低时,其相应的特征粒度越为粗糙(例如超市贩售商品的第一层级仅包含两个聚类特征集),当层级越高时,其相应的特征粒度则越为精细
(例如超市贩售商品的第三层级包含有七个聚类特征集),据以满足不同应用场景下的预测需求。
[0027]可选地,预设聚类算法包括但不限于:基于距离的聚类方法(如k

means)、基于层次的聚类算法(如AGNES)、基于密度的聚类算法等。
[0028]步骤S106,根据每一个特征粒度的训练标签组、每一个特征粒度的特征聚类结果,训练每一个特征粒度的分类器,获得每一个特征粒度的训练好的分类器。
[0029]可选地,可利用深度学习方法,根据每一个特征粒度的特征聚类结果,执行分类器的训练,获得每一个特征粒度的训练好的分类器。但并不以此为限,也可利用其它方式执行分类器的训练,本申请对此不作限制。
[0030]步骤S108,根据预测需求,利用训练好的各分类器中的至少一个,搭建满足预测需求的预测模型。
[0031]可选地,可根据预测需求,从各特征粒度中确定满足预测需求的至少一个目标粒度,并利用每一个目标粒度的训练好的分类器,搭建满足预测需求的预测模型。
[0032]于本实施例中,可根据待预测目标以及待预测目标的粗细度层级,确定预测需求,据以确定各特征粒度中的目标粒度。
[0033]示例性地,可根据待预测目标(例如,超市贩售商品)以及待预测目标的粗细度层级(例如,第二层级),确定满足于所述待预测目标及其粗细本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预测模型搭建方法,包括:利用训练好的特征提取模型,针对每一个训练样本执行特征提取,获得每一个训练样本的样本特征;根据多个不同的特征粒度,分别针对所有样本特征执行聚类分析,获得每一个特征粒度的特征聚类结果;根据每一个特征粒度的训练标签组、每一个特征粒度的特征聚类结果,训练每一个特征粒度的分类器,获得每一个特征粒度的训练好的分类器;根据预测需求,利用训练好的各分类器中的至少一个,搭建满足所述预测需求的预测模型。2.根据权利要求1所述的方法,其中,所述根据多个不同的特征粒度,分别针对所有样本特征执行聚类分析,获得每一个特征粒度的特征聚类结果,包括:利用预设聚类算法,根据每一个特征粒度,分别针对所有样本特征执行聚类分析,获得每一个特征粒度的特征聚类结果;其中,每一个特征粒度的特征聚类结果包括有至少两个聚类特征集。3.根据权利要求2所述的方法,其中,所述预设聚类算法至少包括:基于距离的聚类方法、基于层次的聚类算法、基于密度的聚类算法中的一个。4.根据权利要求2所述的方法,其中,所述根据每一个特征粒度的训练标签组、每一个特征粒度的特征聚类结果,训练每一个特征粒度的分类器,获得每一个特征粒度的训练好的分类器,包括:针对各特征粒度中的任意一个当前粒度,根据所述当前粒度的当前特征聚类结果,生成所述当前粒度的训练标签组,其中,所述训练标签组包含有多个训练标签,各训练标签与所述当前特征聚类结果中的各聚类特征集一一对应;训练步骤,根据所述当前特征聚类结果中的每一个聚类特征集、每一个聚类特征集的训练标签,训练所述当前粒度的分类器,获得所述当前粒度的训练好的分类器。5.根据权利要求4所述的方法,其中,所述分类器至少包括:贝叶斯分类器、知识向量机分类器中的一...

【专利技术属性】
技术研发人员:朱蕾
申请(专利权)人:北京云从科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1