Provides a machine learning model to use nested execution and system, the forecast method, the nested machine learning model including the upper model and the lower model layer nested framework by training, the method includes: (A) obtain forecast data records; (B) predictive attribute information based on data records the formation and forecast data records a plurality of feature subsets corresponding to the prediction sample; (C) the predicted multiple feature subset samples respectively to study the upper model and the lower model including the model to the nested machine to get the prediction results, the set of machine learning model for prediction samples. According to the system and method, it can effectively fuse many kinds of sub models to work together, and give full play to the advantages of each sub model, so as to achieve better comprehensive machine learning effect.
【技术实现步骤摘要】
利用嵌套机器学习模型来执行预测的方法及系统
本专利技术的示例性实施例总体说来涉及人工智能领域,更具体地说,涉及一种利用嵌套机器学习模型来执行预测的方法及系统以及一种训练嵌套机器学习模型的方法及系统。
技术介绍
随着海量数据的出现,人工智能技术得到了迅速发展,而为了从海量数据中挖掘出价值,需要基于数据记录来产生适用于机器学习的训练和/或预测样本,以有助于训练出机器学习模型和/或利用训练好的机器学习模型来执行预估。这里,每条数据记录可被看做关于一个事件或对象的描述,对应于一个示例或样例。在数据记录中,包括反映事件或对象在某方面的表现或性质的各个事项,这些事项可称为“属性”。通过对数据记录的属性信息进行诸如特征工程等处理,可产生包括各种特征的机器学习样本。在实际的机器学习应用中,数据记录的属性信息在形式或含义等方面各有特点,相应地,所产生的特征也在形式或含义等方面存在各种差异,这使得单个机器学习样本中往往存在不同情况的特征。然而,由于应用机器学习技术的场景必然会面临计算资源有限、样本数据不足、特征处理脱离应用场景等客观问题,所以现实中难以找到一种机器学习模型,使其能够在 ...
【技术保护点】
一种利用嵌套机器学习模型来执行预测的方法,其中,所述嵌套机器学习模型包括根据上下层嵌套框架训练出的上层模型和下层模型,所述方法包括:(A)获取预测数据记录;(B)基于预测数据记录的属性信息来生成与预测数据记录对应的预测样本的多个特征子集;(C)将预测样本的多个特征子集分别提供给嵌套机器学习模型所包括的上层模型和下层模型,以得到嵌套机器学习模型针对预测样本的预测结果。
【技术特征摘要】
1.一种利用嵌套机器学习模型来执行预测的方法,其中,所述嵌套机器学习模型包括根据上下层嵌套框架训练出的上层模型和下层模型,所述方法包括:(A)获取预测数据记录;(B)基于预测数据记录的属性信息来生成与预测数据记录对应的预测样本的多个特征子集;(C)将预测样本的多个特征子集分别提供给嵌套机器学习模型所包括的上层模型和下层模型,以得到嵌套机器学习模型针对预测样本的预测结果。2.如权利要求1所述的方法,其中,所述上层模型包括一个决策树子模型,并且,所述下层模型包括多个线性子模型,其中,每个线性子模型对应于所述决策树子模型的一个叶子节点。3.如权利要求1或2所述的方法,其中,在步骤(B)中,基于预测数据记录的属性信息来生成预测样本的特征,并根据特征的取值连续性和/或取值空间规模来生成预测样本的上层特征子集和预测样本的下层特征子集。4.如权利要求3所述的方法,其中,上层特征子集涵盖取值为连续值的全部特征,并且,下层特征子集涵盖取值为非连续值的全部特征;或者,上层特征子集涵盖取值为连续值的全部特征连同至少一部分取值为非连续值的特征,并且,下层特征子集涵盖其余取值为非连续值的特征。5.如权利要求1或2所述的方法,其中,在步骤(B)中,基于预测数据记录的属性信息来生成预测样本的特征,并根据特征的缺失性来生成预测样本的上层特征子集和预测样本的下层特征子集,其中,特征的缺失性指示该特征是否基于预测数据记录相对于训练数据记录的缺失属性信息而生成。6.如权利要求5所述的方法,其中,上层特征子集涵盖全部非缺失特征,并且,下层特征子集涵盖全部缺失特征和全部非缺失特征。7.一种利用...
【专利技术属性】
技术研发人员:陈雨强,戴文渊,杨强,郭夏玮,涂威威,
申请(专利权)人:第四范式北京技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。