一种基于去隐私数据的金融贷款大数据风险评估方法与系统技术方案

技术编号:19321000 阅读:27 留言:0更新日期:2018-11-03 11:11
本申请实施例提供一种基于去隐私数据的金融贷款大数据风险评估方法和系统,包括:获取目标客户的历史交易信息数据,对历史交易信息数据进行分类处理,将历史交易信息数据划分为账户信息数据和交易信息数据,生成账户信息数据的替代信息数据,建立账户信息数据和替代信息数据的对应关系;用替代信息数据替换账户信息数据,并根据交易信息数据和替代信息数据对目标客户的收支情况进行分析处理,生成处理结果,处理结果包括替代信息数据和收支能力分析结果;基于对应关系,将处理结果中的替代信息数据替换为账户信息数据,并生成最终的收支能力评估结果。

A risk assessment method and system for large loan data based on privacy data

The embodiment of this application provides a method and system for risk assessment of large data of financial loans based on de-privacy data, including acquiring historical transaction information data of target customers, classifying and processing historical transaction information data, dividing historical transaction information data into account information data and transaction information data, and generating accounts. Substitute information data of household information data, establish corresponding relationship between account information data and substitution information data, replace account information data with substitution information data, analyze and process revenue and expenditure of target customers according to transaction information data and substitution information data, and generate processing results, including substitution letter. Interest data and revenue and expenditure ability analysis results; based on the corresponding relationship, the replacement information data in the processing results are replaced by account information data, and the final revenue and expenditure ability evaluation results are generated.

【技术实现步骤摘要】
一种基于去隐私数据的金融贷款大数据风险评估方法与系统
本申请涉及大数据
,尤其涉及一种基于去隐私数据的金融贷款大数据风险评估方法与系统。
技术介绍
大数据(bigdata),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。现有技术中,金融机构在对客户的借贷偿还能力进行评估时,通常会借助大数据技术,即对目标客户在一定时间段内的收入和支出的大数据进行分析,生成评估结果,以此来综合判断该目标客户是否具有偿还能力。有时候,金融机构需要将上述评估工作外包给专业的大数据分析团队执行。但是,在分析过程中,会涉及到目标客户的隐私信息,例如姓名、住址、电话、健康状况、身份证号码、各类卡号和账号等等。而目标客户的隐私信息处于泄露的风险之中,为客户的财产造成安全隐患,也容易使金融机构承担不必要的法律责任。
技术实现思路
有鉴于此,本申请的目的在于提出一种基于去隐私数据的金融贷款大数据风险评估方法与系统,来解决现有技术中,在对客户的偿还能力进行评估过程中造成的客户隐私信息的泄露的技术问题。基于上述目的,本申请提出了一种基于去隐私数据的金融贷款大数据风险评估方法,包括:获取目标客户的历史交易信息数据;对所述历史交易信息数据进行分类处理,将所述历史交易信息数据划分为账户信息数据和交易信息数据;生成所述账户信息数据的替代信息数据,并建立所述账户信息数据和所述替代信息数据的对应关系;用所述替代信息数据替换所述账户信息数据,并根据所述交易信息数据和所述替代信息数据对所述目标客户的收支情况进行分析处理,生成处理结果,所述处理结果包括所述替代信息数据和收支能力分析结果;基于所述对应关系,将所述处理结果中的替代信息数据替换为所述账户信息数据,并生成最终的收支能力评估结果。在一些实施例中,所述获取目标客户的历史交易信息包括:基于关键字段从数据库中筛选关于所述目标客户的交易记录,生成所述目标客户的历史交易信息数据。在一些实施例中,所述对所述历史交易信息数据进行分类处理,将所述历史交易信息数据划分为账户信息数据和交易信息数据,具体包括:基于所述历史交易信息数据中的关键词,对所述历史交易信息数据进行分类处理,将所述历史交易信息数据划分为账户信息数据和交易信息数据。在一些实施例中,所述基于所述历史交易信息数据中的关键词,对所述历史交易信息数据进行分类处理具体包括:第一步,从历史已经成功提取的数据积累当中,提取一定数量已知的账户信息数据和交易信息数据,分别汇合为账户信息数据和交易信息数据的分类参考集合;第二步,对账户信息数据和交易信息数据的集合当中的原始信息进行语法分词,并参照停用词表去除停用词;对于账户信息数据和交易信息数据的分类参考集合当中的关键词,根据预设的语料库扩展其同义词,扩充形成由每个关键词及其同义词组成的分类参考集合;第三步,对于待提取的原始交易信息数据,执行分词、去除停用词和同义词扩展处理,获得待分类的关键词集合,然后查询该关键词集合与各个分类参考集合相对应的匹配度,取匹配度最大的分类参考集合,根据该分类参考集合是属于账户信息数据还是属于交易信息数据,将当期待分类的关键词判定为属于账户信息数据还是属于交易信息数据。在一些实施例中,更进一步来说,在上述第三步中,计算匹配度如下:其中,M表示待分类关键词集合与某一个分类参考集合的匹配度,tk表示待分类关键词集合,tc表示分类参考集合;f(tk),f(tc)分别表示待分类关键词集合、分类参考集合中的词数量,f(tk,tc)表示待分类关键词集合、分类参考集合二者当中相同的词数量。在一些实施例中,所述历史交易信息数据包括账户信息、账户类型和交易记录,所述将所述历史交易信息数据划分为账户信息数据和交易信息数据,包括:将所述账户信息和所述账户类型划分为账户信息数据,将所述交易记录划分为交易信息数据。在一些实施例中,所述生成所述账户信息数据的替代信息数据,并建立所述账户信息数据和所述替代信息数据的对应关系,具体包括:将随机生成的字符串作为所述替代信息数据,并建立所述替代信息数据和所述账户信息数据的索引,对所述索引进行存储。在一些实施例中,所述基于所述对应关系,将所述处理结果中的替代信息数据替换为所述账户信息数据,并生成最终的收支能力评估结果,具体包括:基于所述索引,根据所述替代信息数据查找对应的账户信息数据,并将所述处理结果中的替代信息数据替换为所述账户信息数据,将所述账户信息数据和对应的收支能力分析结果作为最终的收支能力评估结果。基于上述目的,本申请提出了一种基于去隐私数据的金融贷款大数据风险评估系统,包括:信息获取模块,用于获取目标客户的历史交易信息数据;信息分类模块,用于对所述历史交易信息数据进行分类处理,将所述历史交易信息数据划分为账户信息数据和交易信息数据;信息替代模块,用于生成所述账户信息数据的替代信息数据,并建立所述账户信息数据和所述替代信息数据的对应关系;分析处理模块,用于用所述替代信息数据替换所述账户信息数据,并根据所述交易信息数据和所述替代信息数据对所述目标客户的收支情况进行分析处理,生成处理结果,所述处理结果包括所述替代信息数据和收支能力分析结果;信息还原模块,用于基于所述对应关系,将所述处理结果中的替代信息数据替换为所述账户信息数据,并生成最终的收支能力评估结果。在一些实施例中,所述信息获取模块包括关键字段识别单元,所述关键字段识别单元用于基于关键字段从数据库中筛选关于所述目标客户的交易记录,生成所述目标客户的历史交易信息数据。在一些实施例中,所述信息分类模块包括关键词识别单元,所述关键词识别单元用于基于所述历史交易信息数据中的关键词,对所述历史交易信息数据进行分类处理,将所述历史交易信息数据划分为账户信息数据和交易信息数据。在一些实施例中,所述关键词识别单元采用如下方式基于所述历史交易信息数据中的关键词,对所述历史交易信息数据进行分类处理:从历史已经成功提取的数据积累当中,提取一定数量已知的账户信息数据和交易信息数据,分别汇合为账户信息数据和交易信息数据的分类参考集合;对账户信息数据和交易信息数据的集合当中的原始信息进行语法分词,并参照停用词表去除停用词;对于账户信息数据和交易信息数据的分类参考集合当中的关键词,根据预设的语料库扩展其同义词,扩充形成由每个关键词及其同义词组成的分类参考集合;对于待提取的原始交易信息数据,执行分词、去除停用词和同义词扩展处理,获得待分类的关键词集合,然后查询该关键词集合与各个分类参考集合相对应的匹配度,取匹配度最大的分类参考集合,根据该分类参考集合是属于账户信息数据还是属于交易信息数据,将当期待分类的关键词判定为属于账户信息数据还是属于交易信息数据。在一些实施例中,更进一步来说,所述关键词识别单元计算匹配度如下:其中,M表示待分类关键词集合与某一个分类参考集合的匹配度,tk表示待分类关键词集合,tc表示分类参考集合;f(tk),f(tc)分别表示待分类关键词集合、分类参考集合中的词数量,f(tk,tc)表示待分类关键词集合、分类参考集合二者当中相同的词数量。在一些实施例中,所述历史交易信息数据包括账户信息、账户类型本文档来自技高网...

【技术保护点】
1.一种基于去隐私数据的金融贷款大数据风险评估,其特征在于,包括:获取目标客户的历史交易信息数据;对所述历史交易信息数据进行分类处理,将所述历史交易信息数据划分为账户信息数据和交易信息数据;生成所述账户信息数据的替代信息数据,并建立所述账户信息数据和所述替代信息数据的对应关系;用所述替代信息数据替换所述账户信息数据,并根据所述交易信息数据和所述替代信息数据对所述目标客户的收支情况进行分析处理,生成处理结果,所述处理结果包括所述替代信息数据和收支能力分析结果;基于所述对应关系,将所述处理结果中的替代信息数据替换为所述账户信息数据,并生成最终的收支能力评估结果。

【技术特征摘要】
1.一种基于去隐私数据的金融贷款大数据风险评估,其特征在于,包括:获取目标客户的历史交易信息数据;对所述历史交易信息数据进行分类处理,将所述历史交易信息数据划分为账户信息数据和交易信息数据;生成所述账户信息数据的替代信息数据,并建立所述账户信息数据和所述替代信息数据的对应关系;用所述替代信息数据替换所述账户信息数据,并根据所述交易信息数据和所述替代信息数据对所述目标客户的收支情况进行分析处理,生成处理结果,所述处理结果包括所述替代信息数据和收支能力分析结果;基于所述对应关系,将所述处理结果中的替代信息数据替换为所述账户信息数据,并生成最终的收支能力评估结果。2.根据权利要求1所述的方法,其特征在于,所述获取目标客户的历史交易信息包括:基于关键字段从数据库中筛选关于所述目标客户的交易记录,生成所述目标客户的历史交易信息数据。3.根据权利要求1所述的方法,其特征在于,所述对所述历史交易信息数据进行分类处理,将所述历史交易信息数据划分为账户信息数据和交易信息数据,具体包括:基于所述历史交易信息数据中的关键词,对所述历史交易信息数据进行分类处理,将所述历史交易信息数据划分为账户信息数据和交易信息数据。4.根据权利要求1所述的方法,其特征在于,所述历史交易信息数据包括账户信息、账户类型和交易记录,所述将所述历史交易信息数据划分为账户信息数据和交易信息数据,包括:将所述账户信息和所述账户类型划分为账户信息数据,将所述交易记录划分为交易信息数据。5.根据权利要求4所述的方法,其特征在于,所述生成所述账户信息数据的替代信息数据,并建立所述账户信息数据和所述替代信息数据的对应关系,具体包括:将随机生成的字符串作为所述替代信息数据,并建立所述替代信息数据和所述账户信息数据的索引,对所述索引进行存储。6.根据权利要求5所述的方法,其特征在于,所述基于所述对应关系,将所述处理结果中的...

【专利技术属性】
技术研发人员:伞兴沈文彬
申请(专利权)人:杭州连银科技有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1