System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 风险评估模型的确定方法、装置与计算机可读存储介质制造方法及图纸_技高网

风险评估模型的确定方法、装置与计算机可读存储介质制造方法及图纸

技术编号:41395583 阅读:3 留言:0更新日期:2024-05-20 19:19
本申请提供了一种风险评估模型的确定方法、装置与计算机可读存储介质,该方法包括:获取目标交易数据和目标文本数据,目标交易数据为与目标交易有关的结构化数据,目标文本数据为与目标交易有关的非结构化数据;分别对目标交易数据和目标文本数据进行特征提取处理,得到目标数据特征;采用智能大语言模型对目标数据特征进行重复自学习训练,得到多个初始训练模型;对各初始训练模型进行评估,得到对应的目标评估分数,并将目标评估分数最高的初始训练模型作为风险评估模型。该方法通过人工智能训练模型来对客户进行风险评估并使用更多数据来源以提供更全面的客户风险概况,提高评估的准确率。

【技术实现步骤摘要】

本申请涉及风险评估模型的确定领域,具体而言,涉及一种风险评估模型的确定方法、风险评估模型的确定装置与计算机可读存储介质。


技术介绍

1、随着金融科技的发展,传统的用户风险评估方法往往基于固定的规则和模型,难以适应复杂和多变的金融环境。

2、其中,传统的客户风险评估方法通常包括以下步骤:获取客户信息,收集客户的基本信息,如年龄、职业、收入、信用历史等;评估信用风险,利用客户的信用评分、信用报告、银行交易记录等信息评估客户的信用风险;审核财务报告,审查客户的财务报表和财务状况,以确定其还款能力和偿还意愿;执行人工评估,通过人工审核、电话访问等方法评估客户的风险程度;实施管理措施,根据客户的风险评估结果采取适当的风险管理措施,以降低风险。

3、采用上述传统的风险评估方法会存在以下缺点:数据限制,传统的客户风险评估方法通常只基于有限的数据,如信用历史、收入和资产等,缺乏客户的全面了解;静态评估,传统的客户风险评估方法偏向于静态评估,不能及时反映客户的变化;缺乏灵活性,传统的客户风险评估方法缺乏灵活性,不能适应不同的客户群体和业务需求;评估偏差,传统的客户风险评估方法可能存在评估偏差,导致不同的客户被错误地评估为相同的风险级别;时间效率低,传统的客户风险评估方法的评估过程通常是人工的,因此需要较长的时间,不利于快速决策。

4、由上可知,现有的客户风险评估方法的数据源不全面,且自动化和智能化较低,依赖于人工数据处理,导致客户风险评估效率较低且不准确。


技术实现思路>

1、本申请的主要目的在于提供一种风险评估模型的确定方法、风险评估模型的确定装置与计算机可读存储介质,以至少解决现有的客户风险评估方法自动化和智能化较低,导致客户风险评估效率较低且不准确的问题。

2、为了实现上述目的,根据本申请的一个方面,提供了一种风险评估模型的确定方法,包括:获取目标交易数据和目标文本数据,所述目标交易数据为与目标交易有关的结构化数据,所述目标文本数据为与所述目标交易有关的非结构化数据;分别对所述目标交易数据和所述目标文本数据进行特征提取处理,得到目标数据特征;采用智能大语言模型对所述目标数据特征进行重复自学习训练,得到多个初始训练模型;对各所述初始训练模型进行评估,得到对应的目标评估分数,并将所述目标评估分数最高的所述初始训练模型作为风险评估模型。

3、可选地,获取目标交易数据和目标文本数据,包括:获取初始交易数据和初始文本数据,所述初始交易数据为采用第一处理方式处理前的所述目标交易数据,所述初始文本数据为采用第二处理方式处理前的所述目标文本数据;采用所述第一处理方式对所述初始交易数据进行处理,得到所述目标交易数据,所述第一处理方式包括以下至少之一:数据清洗、数据去重、缺失值处理和异常值检测;采用所述第二处理方式对所述初始文本数据进行处理,得到所述目标文本数据,所述第二处理方式包括以下至少之一:关键词提取、分词处理、非关键词移除和词干提取。

4、可选地,分别对所述目标交易数据和所述目标文本数据进行特征提取处理,得到目标数据特征,包括:采用第一特征提取模型对所述目标交易数据进行特征提取,得到交易数据基本特征,并根据所述交易数据基本特征,确定交易数据高级特征,所述交易数据基本特征至少包括以下之一:交易频率、交易金额、交易时间和交易类型,所述交易数据高级特征至少包括以下之一:交易波动性、交易时间、异常交易数据;采用第二特征提取模型对所述目标文本数据进行特征提取,得到文本数据高级特征,所述第二特征提取模型至少包括以下之一:词袋模型、词嵌入模型;将所有的所述交易数据高级特征和所有的所述文本数据高级特征均确定为数据特征,并从所述数据特征中确定所述目标数据特征。

5、可选地,从所述数据特征中确定所述目标数据特征,包括:计算各所述数据特征与客户风险程度之间的相关性,得到多个特征相关度,并将大于或者等于预设相关度的所述特征相关度对应的所述数据特征确定为所述目标数据特征;或者,采用递归特征消除模型递归并删除重要程度小于或者等于预设重要程度的所述数据特征,以从所述数据特征中确定所述目标数据特征。

6、可选地,采用第二特征提取模型对所述目标文本数据进行特征提取,得到文本数据高级特征,包括:采用词袋模型将所述目标文本数据转化为向量数据,所述向量数据中的各元素分别表示对应的词语在所述目标文本数据中出现的频率;根据所述向量数据,确定各所述词语的特征参量,所述特征参量至少包括所述词语的频率和所述词语的稀有度,所述词语的频率表示所述词语在所述目标文本数据中出现的频率;根据各所述词语的特征参量,对所述目标文本数据进行特征提取,得到所述文本数据高级特征。

7、可选地,采用智能大语言模型对所述目标数据特征进行重复自学习训练,得到多个初始训练模型,包括:获取客户风险评分报告,所述客户风险评分报告为根据多组训练数据训练得到的,所述多组训练数据中的每一组训练数据均包括历史时间段内获取的:历史训练模型以及与采用对应的所述历史训练模型得到的客户风险评分;将gpt模型确定为所述智能大语言模型,并对所述gpt模型进行初始化,得到初始化后的gpt模型;采用所述初始化后的gpt模型根据所述客户风险评分报告对所述目标数据特征进行重复自学习训练,得到多个所述初始训练模型。

8、可选地,对各所述初始训练模型进行评估,得到对应的目标评估分数,包括:确定评估指标,所述评估指标至少包括以下之一:准确率、召回率、f1分数,所述f1分数表征准确率和召回率的调和平均值;根据所述评估指标对各所述初始训练模型进行评估,得到第一评估分数;采用交叉验证方法评估各所述初始训练模型的泛化能力,得到第二评估分数;根据所述第一评估分数和所述第二评估分数,确定各所述初始训练模型对应的所述目标评估分数。

9、可选地,在将所述目标评估分数最高的所述初始训练模型确定为风险评估模型之后,所述方法还包括:在获取到新的交易数据和/或新的文本数据的情况下,根据所述新的交易数据和/或所述新的文本数据,对所述风险评估模型进行调节,得到调节后的风险评估模型。

10、根据本申请的另一方面,提供了一种风险评估模型的确定装置,包括:获取单元,用于获取目标交易数据和目标文本数据,所述目标交易数据为与目标交易有关的结构化数据,所述目标文本数据为与所述目标交易有关的非结构化数据;提取单元,用于分别对所述目标交易数据和所述目标文本数据进行特征提取处理,得到目标数据特征;训练单元,用于采用智能大语言模型对所述目标数据特征进行重复自学习训练,得到多个初始训练模型;确定单元,用于对各所述初始训练模型进行评估,得到对应的目标评估分数,并将所述目标评估分数最高的所述初始训练模型作为风险评估模型。

11、根据本申请的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行任意一种所述的风险评估模型的确定方法。

12、应用本申请的技术本文档来自技高网...

【技术保护点】

1.一种风险评估模型的确定方法,其特征在于,包括:

2.根据权利要求1所述的确定方法,其特征在于,获取目标交易数据和目标文本数据,包括:

3.根据权利要求1所述的确定方法,其特征在于,分别对所述目标交易数据和所述目标文本数据进行特征提取处理,得到目标数据特征,包括:

4.根据权利要求3所述的确定方法,其特征在于,从所述数据特征中确定所述目标数据特征,包括:

5.根据权利要求3所述的确定方法,其特征在于,采用第二特征提取模型对所述目标文本数据进行特征提取,得到文本数据高级特征,包括:

6.根据权利要求1所述的确定方法,其特征在于,采用智能大语言模型对所述目标数据特征进行重复自学习训练,得到多个初始训练模型,包括:

7.根据权利要求1所述的确定方法,其特征在于,对各所述初始训练模型进行评估,得到对应的目标评估分数,包括:

8.根据权利要求1所述的确定方法,其特征在于,在将所述目标评估分数最高的所述初始训练模型确定为风险评估模型之后,所述方法还包括:

9.一种风险评估模型的确定装置,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至8中任意一项所述的风险评估模型的确定方法。

...

【技术特征摘要】

1.一种风险评估模型的确定方法,其特征在于,包括:

2.根据权利要求1所述的确定方法,其特征在于,获取目标交易数据和目标文本数据,包括:

3.根据权利要求1所述的确定方法,其特征在于,分别对所述目标交易数据和所述目标文本数据进行特征提取处理,得到目标数据特征,包括:

4.根据权利要求3所述的确定方法,其特征在于,从所述数据特征中确定所述目标数据特征,包括:

5.根据权利要求3所述的确定方法,其特征在于,采用第二特征提取模型对所述目标文本数据进行特征提取,得到文本数据高级特征,包括:

6.根据权利要求1所述的确定方法,其特征在于,采用智能大语...

【专利技术属性】
技术研发人员:郭玮李庆磊李培李云云孟雨佳
申请(专利权)人:中国邮政储蓄银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1