【技术实现步骤摘要】
一种基于流式和批式大数据融合计算的案件风险识别方法
本专利技术属于数据处理
,尤其是涉及一种基于流式和批式大数据融合计算的案件风险识别方法。
技术介绍
近年来,我国金融操作风险案件呈现多发、高发态势,多家银行相继曝出涉案金额巨大的操作风险案件,有关银行在业务操作方面的案件屡屡发生,且操作风险方面的案情日趋复杂,作案手法隐秘。操作风险案件频发,造成了巨大的经济损失和社会影响,给银行业稳健运营带来全新挑战。伴随银行数十年的业务衍生,沉淀了百亿级的数据,如何在海量的数据中筛查可疑风险案件,进行有效的案件防范,已经成为了一个迫切需要解决的问题。传统上,针对金融操作风险案件,银行一般结合业务经验和银行工作流程对案件特征进行剖析,通过纯批式计算的规则进行筛查,然而随着数据量的突增,纯批式计算的筛查方法已经不能满足业务对风险时效性要求和快速响应的管理要求。一般的,纯批式筛查存在以下问题:1)纯批式计算对硬件要求较高,而且关系型数据库在针对海量数据的读写、查询、高并发等方面性能短板明显;2)纯批式大数据计算在针 ...
【技术保护点】
1.一种基于流式和批式大数据融合计算的案件风险识别方法,其特征在于,该方法包括以下步骤:/n步骤1、提取某风险场景下T时间范围内的数据,并将滚动增量和全量的数据进行去重处理,再导入到大数据平台;/n步骤2、基于步骤1中风险场景的历史风险行为,提炼风险特征,并确定特征加工逻辑;/n步骤3、对于步骤1中导入大数据平台的数据进行预处理操作;/n步骤4、基于步骤2中的风险特征及特征加工逻辑,对于非时序类的特征通过Spark批式大数据计算对步骤3中的预处理数据进行特征加工,得到非时序类数据的特征;/n步骤5、基于步骤2中的风险特征及特征加工逻辑,对于有时序要求的特征,通过流式大数据计 ...
【技术特征摘要】
1.一种基于流式和批式大数据融合计算的案件风险识别方法,其特征在于,该方法包括以下步骤:
步骤1、提取某风险场景下T时间范围内的数据,并将滚动增量和全量的数据进行去重处理,再导入到大数据平台;
步骤2、基于步骤1中风险场景的历史风险行为,提炼风险特征,并确定特征加工逻辑;
步骤3、对于步骤1中导入大数据平台的数据进行预处理操作;
步骤4、基于步骤2中的风险特征及特征加工逻辑,对于非时序类的特征通过Spark批式大数据计算对步骤3中的预处理数据进行特征加工,得到非时序类数据的特征;
步骤5、基于步骤2中的风险特征及特征加工逻辑,对于有时序要求的特征,通过流式大数据计算对步骤3中的预处理数据进行特征加工,得到时序类数据的特征。
步骤6、对步骤4、步骤5中得到的非时序类数据的特征和时序类数据的特征,通过业务专家进行组合,形成规则;
步骤7、对步骤6形成的规则,通过Spark+Rete技术进行规则决策,识别可疑风险案例。
2.根据权利要求1所述的一种基于流式和批式大数据融合计算的案件风险识别方法,其特征在于,所述步骤1中,所述的风险场景,包括但不限于银行操作风险案件中涉及的内外勾结、内部舞弊、违规操作或外部欺诈等案件风险;所述的数据包括:交易流水数据、操作流水数据和静态信息数据等。
3.根据权利要求1所述的一种基于流式和批式大数据融合计算的案件风险识别方法,其特征在于,所述步骤2中,所述提炼风险特征,即通过分析历史风险案例中案例主体的风险行为特征,判断作业模式和操作流程是否存在漏洞或缺陷,并通过相应数...
【专利技术属性】
技术研发人员:孙斌杰,王新根,鲁萍,黄滔,陈浩,席龙,吴晶晶,
申请(专利权)人:浙江邦盛科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。