【技术实现步骤摘要】
一种数据源评估方法、装置、电子设备及存储介质
[0001]本专利技术涉及大数据离线计算领域,尤其涉及一种数据源评估方法、装置、电子设备及存储介质。
技术介绍
[0002]数据价值评估的本质是对数据的解析计算和存储,涉及到的是大数据计算相关领域的技术。随着信息行业的快速发展,用户的数量、网络服务以及计算设备都在呈指数级别的增长,直接带来的影响是“数据流量”井喷式增长。面对着TB、PB甚至更大数量级的数据产生,“大数据”一词在数据计算、数据挖掘与分析行业快速提升知名度。为了处理海量的服务数据,各领域相继推出各种数据处理架构模型,随着产品的不断迭代和发展,分布式计算和存储的数据处理框架得到了越来越多互联网企业的青睐和应用。
[0003]目前,大数据技术在面向金融领域的数据价值评估模型中有很好的应用发展,大数据应用技术在金融行业的应用提升了资源配置效率,强化了风险管控能力。在传统方法中违约风险评估基于历史的交易和信贷数据进行分析,这种方式缺少前瞻性,而利用大数据技术对信贷风险进行评估更趋于事实,而且目前金融领域的外部服务数据源众多、格式复杂多样,同时由于金融领域的特殊性,数据需要存储3年甚至更长,因此数据量级可以轻松达到TB甚至PB级别。
[0004]现有的数据价值评估模型面向中小数据集时是满足业务需求的,但是当应用于金融行业,需要处理TB甚至PB级别的数据量的时候会暴露出很多弊端,例如,超大规模的数据集需要依赖超强的算力,而算力的基础是物理资源的支撑,因此面向超大规模数据集时,目前的数据价值评估模型会消耗过 ...
【技术保护点】
【技术特征摘要】
1.一种数据源评估方法,其特征在于,所述方法包括:获取待评估的目标数据源的历史服务数据;对所述历史服务数据进行指标计算处理,得到所述目标数据源的第一指标统计结果;当基于所述第一指标统计结果确定进行在线评估时,获取所述目标数据源的在线服务数据;对所述在线服务数据进行指标计算处理,得到所述目标数据源的第二指标统计结果;基于所述第一指标统计结果和/或所述第二指标统计结果,确定所述目标数据源的价值评估结果。2.根据权利要求1所述的方法,其特征在于,所述在线服务数据为访问服务数据流;所述对所述在线服务数据进行指标计算处理,得到所述目标数据源的第二指标统计结果,包括:基于访问服务数据流的访问时间信息,在所述在线服务数据中分别确定第一客群数据流和第二客群数据流;获取第一客群对应的第一用户属性数据和第一借据数据,并与所述第一客群数据流相结合,以确定所述第一客群对应的第一服务数据;获取第二客群对应的第二用户属性数据、第二借据数据和贷后流水数据,并与所述第二客群数据流相结合,以确定所述第二客群对应的第二服务数据;根据预先设置的评估指标,对所述第一服务数据和所述第二服务数据进行指标计算处理,得到所述评估指标的统计结果,作为所述目标数据源的第二指标统计结果。3.根据权利要求2所述的方法,其特征在于,所述第一客群包括多个第一客户;所述获取第一客群对应的第一用户属性数据和第一借据数据,并与所述第一客群数据流相结合,以确定所述第一客群对应的第一服务数据,包括:获取预先存储的用户属性信息和借据信息,所述用户属性信息包括每个第一客户的客户标识;基于所述每个第一客户的客户标识,在所述用户属性信息中获取每个第一客户的第一用户属性数据,在所述借据信息中获取每个第一客户的第一借据数据,在所述第一客群数据流中获取每个第一客户的第一客户数据;基于每个第一客户的第一用户属性数据、第一借据数据和第一客户数据,构建所述第一客群对应的第一服务数据。4.根据权利要求2所述的方法,其特征在于,所述第二客群包括多个第二客户;所述获取第二客群对应的第二用户属性数据、第二借据数据和贷后流水数据,并与所述第二客群数据流相结合,以确定所述第二客群对应的第二服务数据,包括:获取预先存储的借据信息和贷后流水信息;基于所述预先存储的借据信息和贷后流水信息,确定每个第二客户的客户标识;基于所述每个第二客户的客户标识,在预先存储的用户属性信息中获取每个第二客户的第二用户属性数据,在所述借据信息中获取每个第二客户的第二借据数据,在所述贷后流水信息中获取每个第二客户的贷后流水数据,在所述第二客群数据流中获取每个第二客户的第二客户数据;基于每个第二客户的第二用户属性数据、第二借据数据、贷后流水数据和第二客户数
据,构建所述第二客群对应的第二服务数据。5.根据权利要求4所述的方法,其特征在于,...
【专利技术属性】
技术研发人员:杨立鹏,
申请(专利权)人:度小满科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。