一种评级模型训练方法和装置制造方法及图纸

技术编号:27937959 阅读:19 留言:0更新日期:2021-04-02 14:18
本发明专利技术公开了一种评级模型训练方法和装置,涉及计算机技术领域。该方法的一具体实施例包括:根据所接收的评级资料,自动获取监管数据;根据所述评级资料和所述监管数据,构建训练样本和验证样本;根据所述训练样本构建基础评级模型;根据所述验证样本,对所述基础评级模型进行模型泛化性能验证,如果验证结果不满足预设准确度阈值,则对所述基础评级模型进行进一步的训练;根据训练后的数据构建优化评级模型;并且基于对所述基础评级模型与所述优化评级模型的对比调整,获得最终评级模型。本发明专利技术还公开了一种评级模型训练装置。

【技术实现步骤摘要】
一种评级模型训练方法和装置
本专利技术涉及计算机
,尤其涉及一种评级模型训练方法和评级模型训练装置。
技术介绍
地方金融机构现有评级体系往往采取线下人工打分的形式,监管指标涉及数量多,实际评级时计算复杂,结果更新慢,造成较大的监管人力资源和时间成本投入。本专利技术提供一种人工智能的地方金融机构监管评级模型的训练方法,通过信息化手段不断提高评级结果的精确程度,节约人力成本和时间成本。地方金融机构评级模型建立了指标之间的关联和权重关系,通过增加精确度和召回率来对参数进行调和,在数据采集阶段运用机器学习匹配相关函数,建立多指标、多维度、多向量的识别模式,充分考虑模型的复杂性以及模型的准确性,才能建立了更加精确可靠的评级模型。现有监管评级模型假设指标之间无关联关系,通过单一指标的加工计算形成评级得分,往往未考虑指标之间的关联和权重关系,与本方案相似度不高。传统的监管评级模型加工方法通常采用接入业务数据形成单一指标,通过计算指标归集形成指数,利用指数与阈值的关系进行区间打分,最终根据加总的得分匹配对应的评级结果。传统的评级方法有一定的局限性,单一指标的计算假设各个指标之间无关联,计算方法较为简单,无法实现识别到并发关联的风险。模型的核心是假定了所有指标向量之间的单个协方差都为零,简化了数据的搜集和整理。
技术实现思路
有鉴于此,本专利技术实施例提供一种评级模型训练方法和评级模型训练装置。本专利技术将建立指标之间的关联和权重关系,解决传统模型存在的缺陷,并通过训练不断调整关联和权重关系,提升模型的精确度。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种评级模型训练方法,包括:根据所接收的评级资料,自动获取监管数据;根据所述评级资料和所述监管数据,构建训练样本和验证样本;根据所述训练样本构建基础评级模型;根据所述验证样本,对所述基础评级模型进行模型泛化性能验证,如果验证结果不满足预设准确度阈值,则对所述基础评级模型进行进一步的训练;根据训练后的数据构建优化评级模型;并且基于对所述基础评级模型与所述优化评级模型的对比调整,获得最终评级模型。可选地,所述训练样本包括训练集和测试集。可选地,所述训练集和测试集的关系为4比1。可选地,所述验证样本包括根据获取的监管数据提取的模型特征、关联关系的交叉特征、偏离值特征以及实际的业务场景存在的隐晦特征。可选地,根据所述训练样本构建基础评级模型,包括:根据所述训练样本中的训练集,基于机器学习算法构建所述基础评级模型。可选地,对所述基础评级模型进行进一步的训练,包括:通过调整所述评级模型构建过程中的参数配置,以及调整所述评级模型构建过程中的样本结构,对所述基础评级模型进行进一步的训练。可选地,调整所述评级模型构建过程中的参数配置,包括:调整指标间交叉特征关联方式、证据权重转换以及选取的特征字段的经济意义。可选地,调整所述评级模型构建过程中的样本结构,包括:调整所述样本结构中的标签定义、样本数量、样本的字段内容以及样本拆分。可选地,所述样本拆分包括所述训练样本与所述验证样本的拆分、所述训练样本中的训练集与测试集的拆分。根据本专利技术实施例的第二方面,提供一种评级模型训练装置,包括:数据获取模块,根据所接收的评级资料,自动获取监管数据;样本构建模块,根据所述评级资料和所述监管数据,构建训练样本和验证样本;基础评级模型构建模块,根据所述训练样本构建基础评级模型;基础评级模型验证模块,根据所述验证样本,对所述基础评级模型进行模型泛化性能验证,其中如果验证结果不满足预设准确度阈值,则对所述基础评级模型进行进一步的训练;优化评级模型构建模块,根据训练后的数据构建优化评级模型;以及最终评级模型生成模块,基于对所述基础评级模型与所述优化评级模型的对比调整,获得最终评级模型。根据本专利技术实施例的第三方面,提供一种实现评级模型训练电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术实施例第一方面提供的方法。根据本专利技术实施例的第四方面,提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本专利技术实施例第一方面提供的方法。上述专利技术中的一个实施例具有如下优点或有益效果:通过一种评级模型训练的方法和装置,提高了评级过程的效率,通过不断训练评级模型,使得监管评级的结果更加精准、可靠和全面,同时能够随着监管政策和监管数据的更新智能化的训练更新评级模型。上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施例加以说明。附图说明附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:图1是根据本专利技术实施例的评级模型训练方法的主要流程的示意图;图2是根据本专利技术实施例的评级模型训练的示意图;图3是根据本专利技术实施例的评级模型训练装置的主要模块的示意图;图4是本专利技术实施例可以应用于其中的示例性装置的架构图;图5是适于用来实现本专利技术实施例的终端设备或服务器的计算机装置的结构示意图。具体实施方式以下结合附图对本专利技术的示范性实施例做出说明,其中包括本专利技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本专利技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。本专利技术设计一种地方金融机构监管评级模型的训练方法和装置,使得评级更为高效,且评级模型不固定,并且会随着新增数据的读取进行优化。根据本专利技术实施例的一个方面,提供了一种评级模型训练方法。图1是根据本专利技术实施例的评级模型训练方法的主要流程的示意图,如图1所示,根据本专利技术实施例的评级模型训练方法,包括:步骤S101、步骤S102、步骤S103、步骤S104、步骤S105和步骤S106。在步骤S101中,根据所接收的评级资料,自动获取监管数据。接收地方金融机构的评级相关资料,根据所接收的监管评级资料自动获取相关监管数据,包括企业基本信息、业务数据、财务数据、舆情数据等。在步骤S102中,根据所述评级资料和所述监管数据,构建训练样本和验证样本。训练样本中包含训练集和测试集,一般训练集和测试集的关系为4比1。验证样本用于验证模型的泛化能力,根据获取的指标提取模型特征、并构建关联关系的交叉特征、偏离值特征以及实际的业务场景存在的隐晦特征。在步骤S103中,根据所述训练样本构建基础评级模型。根据训练样本中的训练集,基于机器学习算法构建基础评级模型,并且利用测试集对其进行模型调优。在步骤S104中,根据所述验证样本,对所述基础评级模型进行模型泛化性能验证,如果验证结果不满足预设准确度本文档来自技高网...

【技术保护点】
1.一种评级模型训练方法,其特征在于,包括:/n根据所接收的评级资料,自动获取监管数据;/n根据所述评级资料和所述监管数据,构建训练样本和验证样本;/n根据所述训练样本构建基础评级模型;/n根据所述验证样本,对所述基础评级模型进行模型泛化性能验证,如果验证结果不满足预设准确度阈值,则对所述基础评级模型进行进一步的训练;/n根据训练后的数据构建优化评级模型;并且/n基于对所述基础评级模型与所述优化评级模型的对比调整,获得最终评级模型。/n

【技术特征摘要】
1.一种评级模型训练方法,其特征在于,包括:
根据所接收的评级资料,自动获取监管数据;
根据所述评级资料和所述监管数据,构建训练样本和验证样本;
根据所述训练样本构建基础评级模型;
根据所述验证样本,对所述基础评级模型进行模型泛化性能验证,如果验证结果不满足预设准确度阈值,则对所述基础评级模型进行进一步的训练;
根据训练后的数据构建优化评级模型;并且
基于对所述基础评级模型与所述优化评级模型的对比调整,获得最终评级模型。


2.如权利要求1所述的方法,其特征在于,所述训练样本包括训练集和测试集。


3.如权利要求2所述的方法,其特征在于,所述训练集和测试集的关系为4比1。


4.如权利要求1所述的方法,其特征在于,所述验证样本包括根据获取的监管数据提取的模型特征、关联关系的交叉特征、偏离值特征以及实际的业务场景存在的隐晦特征。


5.如权利要求1所述的方法,其特征在于,根据所述训练样本构建基础评级模型,包括:
根据所述训练样本中的训练集,基于机器学习算法构建所述基础评级模型。


6.如权利要求1所述的方法,其特征在于,对所述基础评级模型进行进一步的训练,包括:
通过调整所述评级模型构建过程中的参数配置,以及调整所述评级模型构建过程中的样本结构,对所述基础评级模型进行进一步的训练。


7.如权利要求6所述的方法,其特征在于,调整所述评级模型构建过程中的参数配置,包括:
调整指标间交叉特征关联方式、证据...

【专利技术属性】
技术研发人员:张东凯吴勇卢世温陈亚君蔡朴锐李宁
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1