一种风险传播模型及适用于该模型的算法制造技术

技术编号:18019420 阅读:101 留言:0更新日期:2018-05-23 05:27
本发明专利技术公开了一种风险传播模型及适用于该模型的算法,所述风险传播模型包括消息队列中间件、流处理单元、大数据存储模块、大数据图计算模块、风险模型计算模块和图数据库。通过本发明专利技术所述风险传播模型及算法,解决了当信贷、个人信用、公司经营情况、法人状况等各外围因素发展风险变化时,对与之相关联及间接关联的实体所受到的影响进行量化评估的问题,结合具体实际问题能够得到可解释的各个实体的风险状态,便于评估各个实体的实际风险。

【技术实现步骤摘要】
一种风险传播模型及适用于该模型的算法
本专利技术涉及数据处理
,尤其涉及一种与风险传播相关的数据处理模型及算法。
技术介绍
目前广泛应用的企业风险评估模型,都是以企业的财务报表作为评估的基础数据,通过这些可信的财务基础数据,由风控模型计算出企业的经营情况。但在面向企业的金融服务过程中,金融机构还要面对很多企业风险评估中的隐性风险。而建立一种面向企业经营的风险预警模型,来协助金融机构对企业进行信用管理和授信决策已十分必要。
技术实现思路
本专利技术要解决的技术问题是提供了一种风险传播模型及算法,通过该模型及算法将企业或个人存在的隐性风险点进行显性和具体的量化,从而达到评估和预警其金融风险的目的。本专利技术的技术方案是这样实现的:一种风险传播算法,该算法适用于一种风险传播模型,所述风险传播模型包括消息队列中间件、流处理单元、大数据存储模块、大数据图计算模块、风险模型计算模块和图数据库;所述风险传播算法包括以下步骤:S1,消息队列中间件接收原始数据并存入消息队列中;S2,由流处理单元处理消息队列中的数据,并将处理结果同时传送给大数据图计算模块和大数据存储模块;S3,由大数据图计算模块,计算流处理单元传来的处理结果或从大数据存储模块中获取的数据,并将计算结果传送到风险模型计算模块;S4,由风险模型计算模块计算风险传播中各节点的风险指数,对各节点风险进行量化;S5,由图数据库存储S4的结果数据及其附属数据,并作为最终结果展示的数据源。较佳的,所述S2中流处理单元的数据处理是对原数据的ETL操作,ETL操作包含对不正确数据的识别、补充、合并。较佳的,所述大数据存储模块选用具有分布式特性的HDFS存储作为离线存储。较佳的,所述大数据图计算模块选用sparkgraphX分布式图处理框架。较佳的,所述图数据库选用Neo4J图形数据库。一种风险传播模型,包括:消息队列中间件,用于接收原始数据,并将接收到的数据存入消息队列中;流处理单元,用于处理存在于消息队列中的数据,并将处理结果同时传送给大数据图计算模块和大数据存储模块;大数据存储模块,用于数据落地存储及历史数据的保存;大数据图计算模块,用于计算流处理单元传来的处理结果或从大数据存储模块中获取的数据,并将计算结果传送到风险模型计算模块;风险模型计算模块,用于计算风险传播中各节点的风险指数,对各节点风险进行量化;图数据库,用于存储结果数据及附属数据,是最终结果展示的数据源。较佳的,所述大数据存储模块选用具有分布式特性的HDFS存储作为离线存储。较佳的,所述大数据图计算模块选用sparkgraphX分布式图处理框架。较佳的,所述图数据库选用Neo4J图形数据库。本专利技术的有益效果在于:1.通过本专利技术所述风险传播模型,不仅能够解决企业关系类的图谱,也可以对制定环境的子图谱作分析,比如企业/个人担保图谱对于不同的担保金额可以使用不同的权重(为担保金额均值,x为本次担保金额)即可。2.通过本专利技术所述风险传播模型,解决了当信贷、个人信用、公司经营情况、法人状况等各外围因素发展风险变化时,对与之相关联及间接关联的实体所受到的影响进行量化评估的问题,结合具体实际问题能够得到可解释的各个实体的风险状态,便于评估各个实体的实际风险。附图说明附图1为本专利技术所述模型及算法的流程示意图。具体实施方式下面结合附图和实施例对本专利技术做进一步详述:如附图1所示,一种风险传播算法,该算法适用于一种风险传播模型,所述风险传播模型包括消息队列中间件、流处理单元、大数据存储模块、大数据图计算模块、风险模型计算模块和图数据库;所述风险传播算法包括以下步骤:S1,消息队列中间件接收原始数据并存入消息队列中;S2,由流处理单元处理消息队列中的数据,并将处理结果同时传送给大数据图计算模块和大数据存储模块;S3,由大数据图计算模块,计算流处理单元传来的处理结果或从大数据存储模块中获取的数据,并将计算结果传送到风险模型计算模块;S4,由风险模型计算模块计算风险传播中各节点的风险指数,对各节点风险进行量化;S5,由图数据库存储S4的结果数据及其附属数据,并作为最终结果展示的数据源。本实施例中风险传播算法的具体应用场景如下:在一张关系图中,有一些已经明确的风险的节点,这些节点就是风险源的起始点,与这些节点有关联的节点就是受传染的对象,节点间链接的属性不同受传染的程度也不同,当一个节点受到多方传染时定义风险合并逻辑,此处采用风险叠加但是对叠加结果设置上限,保证风险结果的合理性,收到传染的节点继续向下传播,但不会反向传播,防止出现死循环,最后的终止条件可以以风险降低到某个限定值,也可以以传播次数达到某个限定值。以企业关系图谱为例:企业之间存在着资金往来、法人、投资、担保、原材料上下游、同地域等关系,通过这些关系能建立起一张企业关系图谱,通过各渠道(工商、银行、法院等)收集的信息能够给一些企业设定初始的风险值r(0为安全,1为最高风险),例如企业破产则初始值为1,企业负债高于资产较高则设定一个比较高的值,企业近期利润持续降低则给一个相对较低的值,如企业发生特殊事故、事件,则根据实际情况给一个相应的分值。有了原始数据,下面开始进行传播,对于不同关系类型设定不同的权重w,一般来说资金往来、法人、投资的权重要相对高一些,地域、相同经营种类等权重要相对低一些,r*w则是节点受到影响的风险值,同一个节点可能得到多个r*w,则它的风险值为Σri*wi,为了合理性限制其结果为[0,1]即MIN(Σri*wi,1)。由于三层以外的两个企业之间所能产生的影响已经微乎其微了,所以这里设置风险只能传播三层即停止。对于企业之间的关系都是单向的关系,但是在风险传播是可以认定为可以双向传播。例如企业A投资企业B。A与B是由一个有方向的关系链接起来的,但是当A出现风险时,B会受到影响,而当B出现风险时A也是会受到影响的,所以虽然关系时有方向的,但是风险是没有方向的,是可以反向传播的。通过上面操作就可以把一些隐性风险点量化为具体的风险值,从而达到评估节点风险程度的目的。具体计算方式:采用SparkgraphX的pregel计算框架,此计算框架实现了图关系的导入及建立,提供了方便操作图的工具,方便采用遍历图的方式实现风险传播模型的算法逻辑。一、实现vertexProgram方法,此方法是初始化方法,由于本模型的原始数据本身就包含初始风险值及合并风险值,所以此方法下只要把没有初始值或为null等非法值,重置成0;对于合并风险值,即MIN(Σri,1)。二、实现sendMessage方法,此方法是实现向外传播风险值的方法。则向外传播的风险值ri=r*wi(r为该节点的风险值,wi为与ri节点关系类型所对应的权重值)。三、实现messageCombiner方法,此方法是合并该节点接收到的所有风险值。根据前边的论述此处使用Σri来更新本节点的风险值。四、最后在调用pregel时设定传播方向为双向传播,传播次数为三次即实现此算法。如附图1所示,一种风险传播模型,包括:消息队列中间件,用于接收原始数据,并将接收到的数据存入消息队列中;流处理单元,用于处理存在于消息队列中的数据,并将处理结果同时传送给大数据图计算模块和大数据存储模块;大数据存储模块,用于数据落地存储及历史数据的本文档来自技高网...
一种风险传播模型及适用于该模型的算法

【技术保护点】
一种风险传播算法,其特征在于:该算法适用于一种风险传播模型,所述风险传播模型包括消息队列中间件、流处理单元、大数据存储模块、大数据图计算模块、风险模型计算模块和图数据库;所述风险传播算法包括以下步骤:S1,消息队列中间件接收原始数据并存入消息队列中;S2,由流处理单元处理消息队列中的数据,并将处理结果同时传送给大数据图计算模块和大数据存储模块;S3,由大数据图计算模块,计算流处理单元传来的处理结果或从大数据存储模块中获取的数据,并将计算结果传送到风险模型计算模块;S4,由风险模型计算模块计算风险传播中各节点的风险指数,对各节点风险进行量化;S5,由图数据库存储S4的结果数据及其附属数据,并作为最终结果展示的数据源。

【技术特征摘要】
1.一种风险传播算法,其特征在于:该算法适用于一种风险传播模型,所述风险传播模型包括消息队列中间件、流处理单元、大数据存储模块、大数据图计算模块、风险模型计算模块和图数据库;所述风险传播算法包括以下步骤:S1,消息队列中间件接收原始数据并存入消息队列中;S2,由流处理单元处理消息队列中的数据,并将处理结果同时传送给大数据图计算模块和大数据存储模块;S3,由大数据图计算模块,计算流处理单元传来的处理结果或从大数据存储模块中获取的数据,并将计算结果传送到风险模型计算模块;S4,由风险模型计算模块计算风险传播中各节点的风险指数,对各节点风险进行量化;S5,由图数据库存储S4的结果数据及其附属数据,并作为最终结果展示的数据源。2.根据权利要求1所述的计算方法,其特征在于:所述S2中流处理单元的数据处理是对原数据的ETL操作,ETL操作包含对不正确数据的识别、补充、合并。3.根据权利要求1所述的计算方法,其特征在于:所述大数据存储模块选用具有分布式特性的HDFS存储作为离线存储。4.根据权利要求1所述的计算方法,其特征在于:所述大数据图计算模块选用...

【专利技术属性】
技术研发人员:王宝财李勇吕耀中闫威
申请(专利权)人:大连火眼征信管理有限公司
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1