一种基于多模态高维特征的不良资产估值算法制造技术

技术编号:39740643 阅读:10 留言:0更新日期:2023-12-17 23:41
本发明专利技术涉及数据收集与处理技术领域,提供了一种基于多模态高维特征的不良资产估值算法

【技术实现步骤摘要】
一种基于多模态高维特征的不良资产估值算法


[0001]本专利技术涉及数据收集与处理
,提供了一种基于多模态高维特征的不良资产估值算法


技术介绍

[0002]金融不良资产广义上指商业银行等持牌金融机构持有的不能为其带来正常经济利益流入的各类股权

债权

实物类资产

金融不良资产处置方式主要包括诉讼清收

债务重组

债权转让

债转股

资产证券化等方式

不良资产处置中离不开对不良资产进行合理的评估定价,该估值将成为不良资产市场上买卖双方交易对价的重要参考依据

[0003]目前市场对于不良资产转让估值没有成熟的方法,目前评估机构还不能短期内拿出成熟的估值报告

这也导致市场上的不良资产转让价格具有很大的随机性和不确定性

而一个不良资产包中一般存在很多不良资产案件,每个案件的状况和实际质地千差万别

在不良资产包估值过程中,由于买卖双方信息不对称,欠缺债务人相对完善的财务信息以及未来收益,债权的可变现价值依赖于每个债务人的实际财务状况和还款意愿

[0004]当前不良资产包估值的方法主要包括:
1、
静态现金流贴现模型:按照确定的期望收益率对证券的未来现金流进行折现,此种方法的关键是确定利率和现金流

静态现金流贴现模型在实操中,最大的难题是未来现金流的确定,以及未来利率走势的预测

由于在不良资产交易过程中,不可能对每个案件的债务人进行详细的了解和资产属性量化,因此单个案件的质地和现金流非常难以判断和定义

因此此种方法对于交易过程中的估值并无太大的实际意义;
2、
蒙特卡洛模拟是一种基于概率论和统计论的计算方法

基本原理就是:以资产的初始价格为起点,在考虑提前偿付与违约情况下模拟多种现金流路径,得到各路径下的现金流,再贴现,并将所有路径下的贴现值进行加权平均,得到资产的理论价格

这种方法同样受制于不良资产交易过程中的现金流是否可能有途径获取;
3、
对不良资产包样本数据建立多因素回归模型,是通过对历史不良资产包的总结和归纳,总结出影响不良资产包最终价值的因素,然后在此基础上运用统计模型对这些因素进行回归分析,建立回归模型

多因素回归分析采用统计学的分析方法,比较适用于不良资产的定价分析,但需要大量的不良资产处置案例即不良资产包来作为理论研究的基础,同时最终估值的准确性很大程度上依赖于建立回归方程时所选取的变量,如果最初选取的影响不良资产回收率的相关因素是错误的,那么最终的结果可能会和实际情况相距甚远

[0005]现有方法中,例如方法1和方法2的是建立在案件现金流的计算或者模拟的基础上,而现金流由于受制于很多客观(不良资产案件的各项属性)和主观(债务人的实际还款意愿)因素以及难以在案件本身体现的其他诸多因素,例如债务人当前的实际财务状况

工作稳定性

家庭负担

健康状况等等,因此这种方法很难适合于不良资产包交易过程中的价值评估

同时目前不管那种估值方法利用的都是结构化数据,并没有将用户贷款时的身份证照片

大头照照片

活体视频

填写地址文本信息

催收语音数据等非结构化数据利用起
来,导致资产包估值和真实价值之间存在很大不匹配,估值不准确等问题,因此,基于多模态语音

图像

视频

文本等,结合结构化数据完成不良资产包价值评估很有研究意义的

[0006]现有的估值算法存在以下问题:1,现有估值算法只利用了结构化数据,并没有很好的利用用户信贷时的身份证照片

大头照

活体视频

催收语音

居住地址等非结构化数据,导致估值算法无法准确估值,估值可依赖的数据少

[0007]2,针对用户信贷的非结构化数据也没有一种可以对其进行结构化的方法,导致高维特征无法被抽取用于算法训练


技术实现思路

[0008]本专利技术的目的在于解决针对用户信贷的非结构化数据现有技术中没有一种可以对其进行结构化的方法,导致高维特征无法被抽取用于算法训练的问题

[0009]为了解决上述技术问题,本专利技术采用以下技术手段:本专利技术提供了一种基于多模态高维特征的不良资产估值算法
,
包括以下步骤:步骤
1、
对非结构化的图像

视频

文本

语音数据进行高维特征提取,得到多模态非结构化特征;步骤
2、
先进行特征筛选,再进行特征融合,具体的为:对结构化特征进行特筛选,再将筛选出的结构化特征和多模态非结构化特征融合,再利用深度学习,对融合后的特征构建预测算法模型,完成资产包的估值

[0010]上述技术方案中,对非结构化的图像

视频

文本

语音数据进行高维特征提取,得到多模态非结构化特征,具体为:通过身份证照片和大头照编码器实现对身份证和大头照的特征编码,得到非结构化图像特征;通过活体视频编码器实现对活体视频的特征编码,得到非结构化视频特征;通过催收语音编码器实现对催收语音的特征编码,得到非结构化语音特征;通过文本编码器实现对身份证
OCR
识别的文本的特征编码,得到非结构化文本特征

[0011]上述技术方案中,获取信贷产品本身存在的结构化数据,结构化数据的加工根据业务指标定义,使用
Spark SQL

Python
等数据加工引擎编写脚本进行数据提取和指标加工,形成多维结构化数据特征

[0012]上述技术方案中,所述特征筛选实现为:对多维结构化数据特征使用
IV
值计算法计算特征重要性,筛选出
IV
值大于
0.1
的多维结构化数据特征

[0013]上述技术方案中,步骤2中特征融合具体的为:对
IV
值大于
0.1
的多维结构化数据特征和非结构化图像特征

非结构化文本特征

非结构化语音特征

非结构化视频特征进行融合,融合时将非结构化图像特征

非结构化文本特征

非结构化语音特征

非结构化视频特征的每一个维度组本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于多模态高维特征的不良资产估值算法,其特征在于,包括以下步骤:步骤
1、
对非结构化的图像

视频

文本

语音数据进行高维特征提取,得到多模态非结构化特征;步骤
2、
先进行特征筛选,再进行特征融合,具体的为:先对结构化特征进行筛选,再将筛选出的结构化特征和多模态非结构化特征进行特征融合,再利用深度学习,对融合后的特征构建预测算法模型,完成资产包的估值
。2.
根据权利要求1所述的一种基于多模态高维特征的不良资产估值算法,其特征在于,对非结构化的图像

视频

文本

语音数据进行高维特征提取,得到多模态非结构化特征,具体为:通过身份证照片和大头照编码器实现对身份证照片和大头照的特征编码,得到非结构化图像特征;通过活体视频编码器实现对活体视频的特征编码,得到非结构化视频特征;通过催收语音编码器实现对催收语音的特征编码,得到非结构化语音特征;通过文本编码器实现对身份证
OCR
识别的文本和用户填写资料文本的特征编码,得到非结构化文本特征
。3.
根据权利要求1所述的一种基于多模态高维特征的不良资产估值算法,其特征在于,获取信贷产品本身存在的结构化数据,结构化数据的加工根据业务指标定义,使用
Spark SQL

Python
数据加工引擎编写脚本进行数据提取和指标加工,形成多维结构化数据特征
。4.
根据权利要求1所述的一种基于多模态高维特征的不良资产估值算法,其特征在于,所述特征筛选实现为:对多维结构化数据特征使用
IV
值计算法计算特征重要性,筛选出
IV
值大于
0.1
的多维结构化数据特征
。5.
根据权利要求4所述的一种基于多模态高维特征的不良资产估值算法,其特征在于,步骤2中特征融合具体的为:对
IV
值大于
0.1
的多维结构化数据特征和非结构化图像特征

非结构化文本特征

非结构化语音特征

非结构化视频特征进行融合,融合时将非结构化图像特征

非结构化文本特征

非结构化语音特征

非结构化视频特征的每一个维度组成一列,非结构化图像特征是
256
维特征

非结构化文本特征是
256
维特征

非结构化语音特征是
128
维特征

非结构化视频特征是
512
维特征,结构化特征是
1000
维特征,组成的特征维度是
256+256+128+512+1000=2152
维特征
。6.
根据权利要求2所述的一种基于多模态高维特征的不良资产估值算法,其特征在于,身份证照片和大头照编码器的实现包括以下步骤:步骤
a1、
使用
Yolov8
算法进行身份证照片检测或者大头照的人脸检测,将身份证照片或人脸照片从图像中提取出来
;
步骤
a2、
基于身份证照片或人脸照片,使用
Resnet34
网络提取身份证照片或人脸照片主干网络特征
;
步骤
a3、
使用
VIT Transformer
嫁接到
Resnet34
网络之后
;
步骤
a4、

VIT Transformer
网络之后,针对人脸照片或者身份证照片造假类型使用
Alexnet

Resnet
网络进行网络连接,最后使用不同的损失函数进行学习目标定义,让
VIT Transformer
学习到图像翻拍,打印特征信息,得到身份证照片和大头照编码器的模型;
步骤
a5、
身份证照片和大头照编码器的模型使用反向传播算法将每一轮迭代得到的误差向前传递,并进行梯度求导和更新,不断经过多次迭代完成身份证照片和大头照编码器的模型训练;步骤
a6、
身份证照片和大头照编码器的模型训练完成后,提取
VIT Transformer
这一层的特征
Map
作为身份证照片或者大头照的特征表示,其特征分别记作:
Face_Vi_Encode

Id_Vi_Encode。7.
根据权利要求2所述的一种基于多模态高维特征的不良资产估值算法,其特征在于,活体视频编码器的实现包括以下步骤:步骤
b1、
对活体视频使用
OpenCV
进行视频解析,将每一帧图像提取出来存入到图像数组中,记作: ,表示图像的序列编号,从1到;步骤
b2、

【专利技术属性】
技术研发人员:张玻
申请(专利权)人:四川智筹科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1