一种模型整合方法及装置制造方法及图纸

技术编号：17995475 阅读：71 留言：0更新日期：2018-05-19 12:34

公开了一种模型整合方法及装置。一种模型整合方法包括：确定待整合的至少2个独立模型，每个独立模型具有1个输出值；从历史事件记录中获取事件数据集；根据所获得的事件数据集，生成整合模型训练样本；利用有监督学习算法对样本进行训练得到整合模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种模型整合方法及装置
本说明书实施例涉及数据处理
，尤其涉及一种模型整合方法及装置。
技术介绍
智能化或自动化处理的本质，是由计算机根据给定的输入信息，经计算后得到对应输出信息的过程，模型则是用于描述上述输入-输出关系的一种信息。简单的模型可以是根据人工规则建立，在数据时代，基于大数据及机器学习技术进行数据建模则成为主流，目前在多种应用领域中，都已经广泛使用大数据建模来实现各种智能化处理功能，但是随着模型数量的增加，也相应产生了难于管理及资源消耗过多等问题。以风控系统为例，目前以模型驱动的风控策略已被广泛应用，特别是针对一些综合的业务平台，可以基于不同场景不同维度的大数据构建出多种模型，从而实现全面的风险控制。然而，在风险预测覆盖不断完善的同时，模型的数量也随之增长，久而久之会导致整体风控体系越来越庞大，不仅令管理维护成本变得不可控，而且由于不同的模型之间经常存在冗余，实际上也造成了系统处理资源的不必要消耗。
技术实现思路
针对上述技术问题，本说明书实施例提供一种模型整合方法及装置，技术方案如下：根据本说明书实施例的第一方面，提供一种模型整合方法，该方法包括：确定待整合的至少2个独立模型，每个独立模型具有1个输出值；从历史事件记录中获取事件数据集，每条事件数据中包括：每个独立模型针对该事件的预测输出值、该事件的综合标签值；根据所获得的事件数据集，生成整合模型训练样本；利用有监督学习算法对样本进行训练得到整合模型，所述整合模型具有1个整合输出值、且以多个独立模型的输出值作为输入值。根据本说明书实施例的第二方面，提供一种模型整合装置，该装置包括：独立模型确...
一种模型整合方法及装置

【技术保护点】
一种模型整合方法，该方法包括：确定待整合的至少2个独立模型，每个独立模型具有1个输出值；从历史事件记录中获取事件数据集，每条事件数据中包括：每个独立模型针对该事件的预测输出值、该事件的综合标签值；根据所获得的事件数据集，生成整合模型训练样本；利用有监督学习算法对样本进行训练得到整合模型，所述整合模型具有1个整合输出值、且以多个独立模型的输出值作为输入值。

【技术特征摘要】
1.一种模型整合方法，该方法包括：确定待整合的至少2个独立模型，每个独立模型具有1个输出值；从历史事件记录中获取事件数据集，每条事件数据中包括：每个独立模型针对该事件的预测输出值、该事件的综合标签值；根据所获得的事件数据集，生成整合模型训练样本；利用有监督学习算法对样本进行训练得到整合模型，所述整合模型具有1个整合输出值、且以多个独立模型的输出值作为输入值。2.根据权利要求1所述的方法，所述根据所获得的事件数据集，生成整合模型训练样本，包括：根据预设的映射规则，对各独立模型的输出值进行映射处理，将映射结果确定为用于训练整合模型的训练特征值。3.根据权利要求2所述的方法，所述对各独立模型的输出值进行映射处理，包括：将独立模型i的输出值的值域划分为Li个子区间；其中Li≥2，i＝1,2,3…M，M为参与整合的独立模型数量；对于独立模型i的任意输出值，根据该输出值所处的子区间，确定该输出值对应的映射结果。4.根据权利要求3所述的方法，所述将独立模型i的输出值的值域划分为Li个子区间，包括：针对所获得的事件数据集，根据独立模型i对各事件的输出值的分布情况，将独立模型i的输出值的值域划分为Li个子区间。5.根据权利要求4所述的方法，不同独立模型i所对应的子区间划分数量Li相同，且不同独立模型间的相应子区间对应的输出值分布占比相同。6.根据权利要求3所述的方法，所述对于独立模型i的任意输出值，根据该输出值所处的子区间，确定该输出值对应的映射结果，包括：对于独立模型i的任意输出值，将输出值所处的子区间的WOE分值确定为该输出值的映射结果；独立模型i的每个输出值对应1个训练特征值。7.根据权利要求3所述的方法，所述对于独立模型i的任意输出值，根据该输出值所处的子区间，确定该输出值对应的映射结果，包括：对于独立模型i的任意输出值，根据该输出值所处的子区间，将该输出值转换为长度为Li的One-Hot编码值；独立模型i的每个输出值对应Li个训练特征值。8.根据权利要求1所述的方法，所述方法还包括：在确定当前的整合模型的指标值不满足性能需求的情况下，根据预设的优化训练事件集对整合模型进行优化处理，所述优化处理包括：对多个独立模型的整合方式进行调整、或者对独立模型进行单独调整；其中，所述指标值是基于当前的整合模型针对预设的测试事件集输出的预测结果统计得到。9.一种模型整合装置，该装置包括：独立模型确定...

【专利技术属性】
技术研发人员：高利翠，陈露佳，赵闻飙，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛,KY

全部详细技术资料下载我是这个专利的主人