一种模型构建系统及方法技术方案

技术编号:30826781 阅读:19 留言:0更新日期:2021-11-18 12:27
本申请提供了一种模型构建系统及方法,属于模型构建技术领域。所述系统包括:数据采集模块,用于采集至少一个数据源的样本数据;数据检测模块,用于针对至少一个数据源的样本数据,基于与所述数据源对应的预设质量标准对所述样本数据进行检测,将符合预设质量标准的样本数据作为目标样本数据;特征提取模块,用于提取所述目标样本数据的数据特征;特征分析模块,用于在所述数据特征中选取符合预设特征指标的数据特征作为目标特征;特征处理模块,用于确定所述目标特征的分布特点,并基于所述分布特点对所述目标特征进行分箱处理,得到多个特征箱;模型训练模块,用于基于多个所述特征箱训练目标模型。实现模型构建过程的标准化和流程化。流程化。流程化。

【技术实现步骤摘要】
一种模型构建系统及方法


[0001]本申请涉及模型构建
,尤其涉及一种模型构建系统及方法。

技术介绍

[0002]随着人工智能和机器学习领域技术的发展,数据建模为数据赋能提供了新的技术手段。通过对海量数据进行建模分析,可以为精准营销,风险防控,金融授信等多个场景提供业务支持和高准确率的策略推荐。
[0003]目前,在互联网金融行业的风控建模过程中,数据的采集、处理及模型训练等环节,一般是分开进行的,每一个环节由负责该环节的开发人员在本机操作。
[0004]然而,利用这种方式建模,流程化和标准化不足,会存在开发人员因漏掉某一个环节、操作不规范、主观性过高而引起的模型效果较弱、准确性较低的问题。

技术实现思路

[0005]本申请实施例的目的在于提供一种模型构建系统及方法,以解决目前建模过程流程化和标准化不足导致的模型效果较弱、准确性较低的问题。具体技术方案如下:
[0006]第一方面,提供了一种模型构建系统,所述系统包括:数据采集模块、数据检测模块、特征提取模块、特征分析模块、特征处理模块及模型训练模块;
[0007]所述数据采集模块,用于采集至少一个数据源的样本数据;
[0008]所述数据检测模块,用于针对至少一个所述数据源的样本数据,基于与所述数据源对应的预设质量标准对所述样本数据进行检测,将符合所述预设质量标准的样本数据作为目标样本数据;
[0009]所述特征提取模块,用于提取所述目标样本数据的数据特征;
[0010]所述特征分析模块,用于在所述数据特征中选取符合预设特征指标的数据特征作为目标特征;
[0011]所述特征处理模块,用于确定所述目标特征的分布特点,并基于所述分布特点对所述目标特征进行分箱处理,得到多个特征箱;
[0012]所述模型训练模块,用于基于多个所述特征箱训练目标模型。
[0013]在一个可能的实施方式中,所述系统还包括:模型分析模块;
[0014]所述模型分析模块用于针对每个模块,基于所述模块对应的分析指标对所述模块的执行情况进行分析,得到所述模块对应的分析结果。
[0015]在一个可能的实施方式中,所述系统还包括:报告生成模块;
[0016]所述报告生成模块用于基于所述分析结果和预设报告格式生成分析报告。
[0017]在一个可能的实施方式中,所述系统还包括:模型部署模块,所述模型部署模块用于确定所述目标模型的配置文件,并基于所述配置文件对所述目标模型进行上线部署。
[0018]在一个可能的实施方式中,所述特征提取模块包括:提取子模块和衍生子模块;
[0019]所述提取子模块,用于提取所述目标样本数据的基础特征,并将所述基础特征作
为所述数据特征;
[0020]所述衍生子模块,用于对所述基础特征进行加工得到衍生特征,并将所述衍生特征作为所述数据特征。
[0021]第二方面,提供了一种模型构建方法,所述方法包括:
[0022]采集至少一个数据源的样本数据;
[0023]针对至少一个所述数据源的样本数据,基于与所述数据源对应的预设质量标准对所述样本数据进行检测,将符合所述预设质量标准的样本数据作为目标样本数据;
[0024]提取所述目标样本数据的数据特征,并在所述数据特征中选取符合预设特征指标的数据特征作为目标特征;
[0025]确定所述目标特征的分布特点,并基于所述分布特点对所述目标特征进行分箱处理,得到多个特征箱;
[0026]基于多个所述特征箱训练目标模型,直至所述目标模型收敛。
[0027]在一个可能的实施方式中,所述方法还包括:
[0028]针对每个模块,基于所述模块对应的分析指标对所述模块的执行情况进行分析,得到所述模块对应的分析结果。
[0029]在一个可能的实施方式中,所述方法还包括:
[0030]基于所述分析结果和预设报告格式生成分析报告。
[0031]在一个可能的实施方式中,所述方法还包括:
[0032]确定所述目标模型的配置文件;
[0033]基于所述配置文件对所述目标模型进行上线部署。
[0034]在一个可能的实施方式中,所述提取所述目标样本数据的数据特征包括:
[0035]提取所述目标样本数据的基础特征,并将所述基础特征作为所述数据特征;
[0036]对所述基础特征进行加工得到衍生特征,并将所述衍生特征作为所述数据特征。
[0037]本申请实施例有益效果:
[0038]本申请实施例提供了一种模型构建系统及方法,所述系统包括:数据采集模块,用于采集至少一个数据源的样本数据;数据检测模块,用于针对至少一个所述数据源的样本数据,基于与所述数据源对应的预设质量标准对所述样本数据进行检测,将符合所述预设质量标准的样本数据作为目标样本数据;特征提取模块,用于提取所述目标样本数据的数据特征;特征分析模块,用于在所述数据特征中选取符合预设特征指标的数据特征作为目标特征;特征处理模块,用于确定所述目标特征的分布特点,并基于所述分布特点对所述目标特征进行分箱处理,得到多个特征箱;模型训练模块,用于基于多个所述特征箱训练目标模型。
[0039]即,本申请通过将构建模型时所需的各个模块集成在一个系统中,使模型构建的过程标准化、流程化,避免模型构建过程中由于人为操作导致漏掉某个环节,影响最终构建的模型的性能。
[0040]当然,实施本申请的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
[0041]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0042]图1为本申请实施例提供的一种模型构建系统的结构示意图;
[0043]图2为本申请实施例提供的一种模型构建方法的流程图。
具体实施方式
[0044]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0045]由于目前,在互联网金融行业的风控建模过程中,数据的采集、处理及模型训练等环节一般是分开进行的,每一个环节由负责该环节的开发人员本机操作。然而,利用这种方式建模,流程化和标准化不足,会存在开发人员因漏掉某一个环节、操作不规范、主观性过高而引起的模型效果较弱、准确性较低的问题。为此,本申请实施例提供了一种模型构建方法。
[0046]如图1所示,为本申请实施例提供的一种模型构建系统,该包括:数据采集模块、数据检测模块、特征提取模块、特征分析模块、特征处理模块及模型训练模块;
[0047]所述数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型构建系统,其特征在于,所述系统包括:数据采集模块、数据检测模块、特征提取模块、特征分析模块、特征处理模块及模型训练模块;所述数据采集模块,用于采集至少一个数据源的样本数据;所述数据检测模块,用于针对至少一个所述数据源的样本数据,基于与所述数据源对应的预设质量标准对所述样本数据进行检测,将符合所述预设质量标准的样本数据作为目标样本数据;所述特征提取模块,用于提取所述目标样本数据的数据特征;所述特征分析模块,用于在所述数据特征中选取符合预设特征指标的数据特征作为目标特征;所述特征处理模块,用于确定所述目标特征的分布特点,并基于所述分布特点对所述目标特征进行分箱处理,得到多个特征箱;所述模型训练模块,用于基于多个所述特征箱训练目标模型。2.根据权利要求1所述的系统,其特征在于,所述系统还包括:模型分析模块;所述模型分析模块用于针对每个模块,基于所述模块对应的分析指标对所述模块的执行情况进行分析,得到所述模块对应的分析结果。3.根据权利要求2所述的系统,其特征在于,所述系统还包括:报告生成模块;所述报告生成模块用于基于所述分析结果和预设报告格式生成分析报告。4.根据权利要求1所述的系统,其特征在于,所述系统还包括:模型部署模块,所述模型部署模块用于确定所述目标模型的配置文件,并基于所述配置文件对所述目标模型进行上线部署。5.根据权利要求1所述的系统,其特征在于,所述特征提取模块包括:提取子模块和衍生子模块;所述提取子模块,用于...

【专利技术属性】
技术研发人员:李晓晓刘慈文
申请(专利权)人:上海晓途网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1