风控文本处理方法、装置及电子设备制造方法及图纸

技术编号:24252441 阅读:28 留言:0更新日期:2020-05-23 00:02
本公开涉及一种风控文本处理方法、装置、电子设备及计算机可读介质。该方法包括:获取用户的风控文本,所述风控文本包括用户描述文本、应用列表、金融记录文本;将所述风控文本输入文本向量化模型中,生成风控向量;将所述风控向量输入风险预测模型中以确定所述用户的风险类别和其对应的风险概率;以及基于所述风险类别和其对应的风险概率生成所述用户的风险策略。本公开涉及的风控文本处理方法、装置、电子设备及计算机可读介质,能够对用户的风控文本进行自动处理,确定用户的风险分类,还能够自动对异常用户文本信息监测,实现自适应的用户风险预判。

Text processing method, device and electronic equipment of risk control

【技术实现步骤摘要】
风控文本处理方法、装置及电子设备
本公开涉及计算机信息处理领域,具体而言,涉及一种风控文本处理方法、装置、电子设备及计算机可读介质。
技术介绍
在风险防控中,管理人员会收集已经定性为风险案件中的相关数据,进而进行更深层次的分析,以寻找措施避免类似案件发生。在这些已定性的案件里,管理人员除了用户的个人特征之外,往往还会关注多种不同的风险手法、风险类型。在实际风控中,提前预知和得到相应的风险手法往往是必要的和有价值的。主要原因在于不同风险手法有相应的风控手段,比如用户逾期风险,当用户在文本中表现出对贷款和资金情况偏向的信息,进而调整该用户的金融服务策略。对风险手法、风险类型的分析,能够帮助业务人员弥补金融服务条款或者金融服务策略上的漏洞,完善金融服务系统,其中,风险案件中的风险手法和风险类别可为已有的风险手法和未知的风险手法现有的技术对于文本的风险感知没有任何处理,每次出现一个新的案件后,主要通过审理人员查看案件的方式,判断案件是否是属于已知的风险,并挖掘可能出现的未知风险。这样导致的结果是过度的使用了人力,而且人力可能会过度疲劳导致出错。另外人工抽样的样本量每天是有限的,很多在数学和其他统计上可能能统计出异常的样本点,因为抽样的偏度可能会被忽略。因此,需要一种新的风控文本处理方法、装置、电子设备及计算机可读介质。在所述
技术介绍
部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
有鉴于此,本公开提供一种风控文本处理方法、装置、电子设备及计算机可读介质,能够对用户的风控文本进行自动处理,确定用户的风险分类,还能够自动对异常用户文本信息监测,实现自适应的用户风险预判。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的一方面,提出一种风控文本处理方法,该方法包括:获取用户的风控文本,所述风控文本包括用户描述文本、应用列表、金融记录文本;将所述风控文本输入文本向量化模型中,生成风控向量;将所述风控向量输入风险预测模型中以确定所述用户的风险类别和其对应的风险概率;以及基于所述风险类别和其对应的风险概率生成所述用户的风险策略。可选地,还包括:通过预设的自然语言处理模型进行调整以生成所述文本向量化模型,所述自然语言处理模型包括双向编解码模型。可选地,通过预设的自然语言处理模型进行调整以生成所述文本向量化模型,包括:确定初始双向编解码模型;基于历史用户的风控文本对所述初始双向编解码模型的参数进行微调,生成更新参数;以及基于所述更新参数生成所述文本向量化模型。可选地,还包括:通过历史用户的风控向量对机器学习模型进行训练,以生成所述风险预测模型,所述机器学习模型包括极端梯度提升决策树模型。可选地,还包括:获取历史用户的风控向量;为所述风控向量确定风险类别标签;以及通过所述风控向量及其对应的风险类别标签对极端梯度提升决策树模型进行训练以生成所述风险预测模型。可选地,获取历史用户的风控向量,包括:通过所述文本向量化模型对历史用户的风控文本进行处理,生成历史用户的所述风控向量。可选地,还包括:在所述风险类别为未知风险时,将所述用户的风控向量与预设向量进行对比以确定所述用户的风险类别。可选地,将所述用户的风控向量与预设向量进行对比以确定所述用户的风险类别,包括:在所述相似度数值大于等于阈值时,确定所述用户的风控向量的类别为低风险类别。可选地,将所述用户的风控向量与预设向量进行对比以确定所述用户的风险类别,包括:将所述用户的风控向量与预设向量进行相似度对比,生成相似度数值;以及在所述相似度数值小于阈值时,确定所述用户的风控向量为新风险类别。可选地,将所述用户的风控向量与预设向量进行对比以确定所述用户的风险类别,还包括:对新风险类别的用户的行为进行监督;并基于所述新风险类别对应的风险向量对所述文本向量化模型进行更新。根据本公开的一方面,提出一种风控文本处理装置,该装置包括:文本模块,用于获取用户的风控文本,所述风控文本包括用户描述文本、应用列表、金融记录文本;向量模块,用于将所述风控文本输入文本向量化模型中,生成风控向量;预测模块,用于将所述风控向量输入风险预测模型中以确定所述用户的风险类别和其对应的风险概率;以及策略模块,用于基于所述风险类别和其对应的风险概率生成所述用户的风险策略。可选地,还包括:调整模块,用于通过预设的自然语言处理模型进行调整以生成所述文本向量化模型,所述自然语言处理模型包括双向编解码模型。可选地,所述调整模块,包括:模型单元,用于确定初始双向编解码模型;参数单元,用于基于历史用户的风控文本对所述初始双向编解码模型的参数进行微调,生成更新参数;以及更新单元,用于基于所述更新参数生成所述文本向量化模型。可选地,还包括:训练模块,用于通过历史用户的风控向量对机器学习模型进行训练,以生成所述风险预测模型,所述机器学习模型包括极端梯度提升决策树模型。可选地,所述训练模块,包括:历史单元,用于获取历史用户的风控向量;标签单元,用于为所述风控向量确定风险类别标签;以及训练单元,用于通过所述风控向量及其对应的风险类别标签对极端梯度提升决策树模型进行训练以生成所述风险预测模型。可选地,所述历史单元,还用于通过所述文本向量化模型对历史用户的风控文本进行处理,生成历史用户的所述风控向量。可选地,还包括:对比模块,用于在所述风险类别为未知风险时,将所述用户的风控向量与预设向量进行对比以确定所述用户的风险类别。可选地,所述对比模块,包括:阈值单元,用于在所述相似度数值大于等于阈值时,确定所述用户的风控向量的类别为低风险类别。可选地,所述对比模块,包括:对比单元,用于将所述用户的风控向量与预设向量进行相似度对比,生成相似度数值;以及类别单元,用于在所述相似度数值小于阈值时,确定所述用户的风控向量为新风险类别。可选地,所述类别单元,还用于对新风险类别的用户的行为进行监督;并基于所述新风险类别对应的风险向量对所述文本向量化模型进行更新。根据本公开的一方面,提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上文的方法。根据本公开的一方面,提出一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上文中的方法。根据本公开的风控文本处理方法、装置、电子设备及计算机可读介质,获取用户的风控文本,所述风控文本包括用户描述文本、应用列表、金融记录文本;将所述风控文本输入文本向量化模型中,生成风控向量;将所述风控向量输入风险预测模型中以确定所述用户的风险类别和其对应的风险概率;以及基于所述风险类别和其对应的风险概率生成所述用户的风险策略的方式,能够对用户的风控文本进行自动处理,确定用户的风险分类,还能够自动对异常用户文本信息监测,实现自适应本文档来自技高网...

【技术保护点】
1.一种风控文本处理方法,其特征在于,包括:/n获取用户的风控文本,所述风控文本包括用户描述文本、应用列表、金融记录文本;/n将所述风控文本输入文本向量化模型中,生成风控向量;/n将所述风控向量输入风险预测模型中以确定所述用户的风险类别和其对应的风险概率;以及/n基于所述风险类别和其对应的风险概率生成所述用户的风险策略。/n

【技术特征摘要】
1.一种风控文本处理方法,其特征在于,包括:
获取用户的风控文本,所述风控文本包括用户描述文本、应用列表、金融记录文本;
将所述风控文本输入文本向量化模型中,生成风控向量;
将所述风控向量输入风险预测模型中以确定所述用户的风险类别和其对应的风险概率;以及
基于所述风险类别和其对应的风险概率生成所述用户的风险策略。


2.如权利要求1所述的方法,其特征在于,还包括:
通过预设的自然语言处理模型进行调整以生成所述文本向量化模型,所述自然语言处理模型包括双向编解码模型。


3.如权利要求1-2所述的方法,其特征在于,通过预设的自然语言处理模型进行调整以生成所述文本向量化模型,包括:
确定初始双向编解码模型;
基于历史用户的风控文本对所述初始双向编解码模型的参数进行微调,生成更新参数;以及
基于所述更新参数生成所述文本向量化模型。


4.如权利要求1-3所述的方法,其特征在于,还包括:
通过历史用户的风控向量对机器学习模型进行训练,以生成所述风险预测模型,所述机器学习模型包括极端梯度提升决策树模型。


5.如权利要求1-4所述的方法,其特征在于,通过历史用户的风控向量对机器学习模型进行训练,以生成所述风险预测模型,包括:
获取历史用户的风控向量;
为所述风控向量确定风险类别标签;以及
通过所述...

【专利技术属性】
技术研发人员:李达张彤彤苏绥绥常富洋
申请(专利权)人:北京淇瑀信息科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1