本发明专利技术提供了一种基于分布式数据库的客户风险识别方法及装置,基于分布式数据库的客户风险识别方法包括:响应于风险识别请求,获取至少一个分布式数据库中的客户数据;对客户数据进行汇聚,以提取客户数据所对应的风险识别指标;获取用户针对风险识别指标配置的风险评估规则集合;根据风险评估规则集合以及风险识别指标生成对应的风险识别模型;根据风险识别模型和客户数据对客户进行风险识别。本发明专利技术实现了风险识别指标、风险识别规则和模型的灵活定义,并能够实现风险判别规则和数据库的解耦,从而最大化地节省系统运算资源和存储资源。
【技术实现步骤摘要】
基于分布式数据库的客户风险识别方法及装置
本专利技术涉及计算机
,尤其是涉及利用数据库监控的
,具体涉及一种基于分布式数据库的客户风险识别方法及装置。
技术介绍
现有技术中,在多行业客户风险识别的应用系统中,一般是采用传统基于数据库系统自有的运算机制来实现风险规则运算。目前客户风险识别类软件主要采用基于关系型数据库的自身运算机制来实现。由于客户日常的运营类数据多数采用关系数据数据库存储,风险评估软件的各个模块通常采用数据库内置的SQL运算实现,包含SQLDDL/DQL/DML语句、SQL函数、SQL存储过程等。由于现有的大部分的客户风险评估系统的运算主要依赖于SQL,所以系统整体的性能依赖于以下因素:(1)数据库服务器本身的处理性能:通常对大数据量运算场景,会给单台数据库配置较多的CPU核和内存;(2)评估规则SQL的复杂性:如果评估规则需要SQL关联较多的表,而关联表的数据长度较大时,运算就会耗费较长的时间;(3)数据量本身的大小及数据索引等存储设定机制:如果需要评估的数据量过大(如千万级以上),每日产生的交易类数据过多(每日千万级的交易量),也会对整体的运算效率造成较大的压力,同样各类数据在存储时所建立的索引和分区是否合理也会对运算效率造成较大的影响;(4)其他影响因素:比如系统整体运算的时间限制(如每日运算要求在3小时内完成)就和运行的并发设置有关,这些都可能对系统整体的运行性能造成影响。从上述描述可知,现有基于数据库SQL运算风险评估的技术,主要存在的问题是:(1)风险规则及模型的灵活性不足:由于要每条评估规则需要编制独立的SQL语句,所以客户的风险规则和模型是由程序员预置在系统中,在运行阶段无法由业务人员完成规则及模型的配置;(2)系统运算能力难以实现横向扩展:由于数据库系统是集中式系统,核心的运算能力全部集中在数据库服务器上,其运算能力一般只能通过升级服务器配置或优化数据库系统来实现,很难通过配置额外的运算主机来完成运算能力的横向扩展;(3)对各个规则中相同的处理能力难以合并运算:基于SQL的运算处理模块通常是面向规则的,各个规则的运算之间互相独立,而规则中会有很多相同或相似的逻辑,这样相同的部分会进行重复运算,造成运算资源及存储资源的浪费;(4)较难实现对需要与库外系统进行关联运算的评估规则:库内运算能力与存储资源紧密耦合,SQL运算也主要针对库内资源,很难实现与库外系统进行整合运算;(5)库内运算的SQL代码不方便版本化管理:由于SQL语句的脚本在开发阶段往往直接存在数据库上,运行阶段的调整也在数据库系统上完成,不容易实现对运算逻辑代码的版本化管理。
技术实现思路
针对现有技术中的问题,本专利技术提供的基于分布式数据库的客户风险识别方法及装置,可以实现风险判别规则和数据库的解耦,从而实现模型运算的灵活配置和分布式运行,在客户风险类应用软件的设计上具有重要意义。为解决上述技术问题,本专利技术提供以下技术方案:第一方面,本专利技术提供一种基于分布式数据库的客户风险识别方法,包括:响应于风险识别请求,获取至少一个分布式数据库中的客户数据;对所述客户数据进行汇聚,以提取所述客户数据所对应的风险识别指标;获取用户针对所述风险识别指标配置的风险评估规则集合;根据所述风险评估规则集合以及所述风险识别指标生成对应的风险识别模型;根据所述风险识别模型和所述客户数据对客户进行风险识别。一实施例中,在对所述客户数据进行汇聚,以提取所述客户数据所对应的风险识别指标之前,还包括:对所述客户数据进行标准化操作,以生成全量客户数据;所述标准化操作包括:清洗,码表映射以及字段标准化。一实施例中,所述风险识别指标包括:一级风险识别指标以及二级风险识别指标;所述对所述客户数据进行汇聚,以提取所述客户数据所对应的风险识别指标,包括:对所述全量客户数据进行汇聚,以生成一级风险识别指标;对所述一级风险识别指标进行汇聚,以生成二级风险识别指标。一实施例中,所述根据所述风险识别模型和所述客户数据对客户进行风险识别,包括:根据所述风险评估规则配置所述风险识别指标;根据客户的风险评估规则以及配置后的风险识别指标生成与所述风险评估规则对应的规则表达式;在所述风险识别模型内运行所述规则表达式,以生成风险识别结果。一实施例中,利用后台数据库配置方法或Web配置方法,以伪数据库语言的方式根据所述风险评估规则配置所述风险识别指标;所述在所述风险识别模型内运行所述规则表达式,包括:利用数据库语言将所述规则表达式进行翻译;在所述风险识别模型内运行翻译后的规则表达式。第二方面,本专利技术提供一种基于分布式数据库的客户风险识别装置,包括:客户数据获取单元,用于响应于风险识别请求,获取至少一个分布式数据库中的客户数据;识别指标提取单元,用于对所述客户数据进行汇聚,以提取所述客户数据所对应的风险识别指标;集合获取单元,用于获取用户针对所述风险识别指标配置的风险评估规则集合;模型生成单元,用于根据所述风险评估规则集合以及所述风险识别指标生成对应的风险识别模型;风险识别单元,用于根据所述风险识别模型和所述客户数据对客户进行风险识别。一实施例中,基于分布式数据库的客户风险识别装置还包括:客户数据标准化单元,所述客户数据标准化单元具体用于对所述客户数据进行标准化操作,以生成全量客户数据;所述标准化操作包括:清洗,码表映射以及字段标准化。一实施例中,所述风险识别指标包括:一级风险识别指标以及二级风险识别指标;所述识别指标提取单元包括:一级指标生成模块,用于对所述全量客户数据进行汇聚,以生成一级风险识别指标;二级指标生成模块,用于对所述一级风险识别指标进行汇聚,以生成二级风险识别指标。一实施例中,所述风险识别单元包括:指标配置模块,用于根据所述风险评估规则配置所述风险识别指标;表达式生成模块,用于根据客户的风险评估规则以及配置后的风险识别指标生成与所述风险评估规则对应的规则表达式;识别结果生成模块,用于在所述风险识别模型内运行所述规则表达式,以生成风险识别结果。一实施例中,所述指标配置模块具体用于利用后台数据库配置方法或Web配置方法,以伪数据库语言的方式根据所述风险评估规则配置所述风险识别指标;所述识别结果生成模块包括:表达式翻译模块,用于利用数据库语言将所述规则表达式进行翻译;表达式运行模块,用于在所述风险识别模型内运行翻译后的规则表达式。第三方面,本专利技术提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现基于分布式数据库的客户风险识别方法的步骤。第四方面,本专利技术提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现基于分本文档来自技高网...
【技术保护点】
1.一种基于分布式数据库的客户风险识别方法,其特征在于,包括:/n响应于风险识别请求,获取至少一个分布式数据库中的客户数据;/n对所述客户数据进行汇聚,以提取所述客户数据所对应的风险识别指标;/n获取用户针对所述风险识别指标配置的风险评估规则集合;/n根据所述风险评估规则集合以及所述风险识别指标生成对应的风险识别模型;/n根据所述风险识别模型和所述客户数据对客户进行风险识别。/n
【技术特征摘要】
1.一种基于分布式数据库的客户风险识别方法,其特征在于,包括:
响应于风险识别请求,获取至少一个分布式数据库中的客户数据;
对所述客户数据进行汇聚,以提取所述客户数据所对应的风险识别指标;
获取用户针对所述风险识别指标配置的风险评估规则集合;
根据所述风险评估规则集合以及所述风险识别指标生成对应的风险识别模型;
根据所述风险识别模型和所述客户数据对客户进行风险识别。
2.根据权利要求1所述的客户风险识别方法,其特征在于,在对所述客户数据进行汇聚,以提取所述客户数据所对应的风险识别指标之前,还包括:
对所述客户数据进行标准化操作,以生成全量客户数据;所述标准化操作包括:清洗,码表映射以及字段标准化。
3.根据权利要求2所述的客户风险识别方法,其特征在于,所述风险识别指标包括:一级风险识别指标以及二级风险识别指标;所述对所述客户数据进行汇聚,以提取所述客户数据所对应的风险识别指标,包括:
对所述全量客户数据进行汇聚,以生成一级风险识别指标;
对所述一级风险识别指标进行汇聚,以生成二级风险识别指标。
4.根据权利要求1所述的客户风险识别方法,其特征在于,所述根据所述风险识别模型和所述客户数据对客户进行风险识别,包括:
根据所述风险评估规则配置所述风险识别指标;
根据客户的风险评估规则以及配置后的风险识别指标生成与所述风险评估规则对应的规则表达式;
在所述风险识别模型内运行所述规则表达式,以生成风险识别结果。
5.根据权利要求4所述的客户风险识别方法,其特征在于,
所述根据所述风险评估规则配置所述风险识别指标,包括:利用后台数据库配置方法或Web配置方法,以伪数据库语言的方式根据所述风险评估规则配置所述风险识别指标;
所述在所述风险识别模型内运行所述规则表达式,包括:
利用数据库语言将所述规则表达式进行翻译;
在所述风险识别模型内运行翻译后的规则表达式。
6.一种基于分布式数据库的客户风险识别装置,其特征在于,包括:
客户数据获取单元,用于响应于风险识别请求,获取至少一个分布式数据库中的客户数据;
识别指标提取单元,用于对所述客户数据进行汇聚,以提取所述客户数据所对应的风险识别指...
【专利技术属性】
技术研发人员:杜海亮,海礴,李偲伟,刘爽,
申请(专利权)人:工银科技有限公司,
类型:发明
国别省市:河北;13
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。