风险评估方法及装置制造方法及图纸

技术编号:24095286 阅读:20 留言:0更新日期:2020-05-09 10:01
本申请公开了风险评估方法及装置,涉及风控技术领域。具体实现方案为:获取待进行评估的用户的行为文本,将行为文本输入预设的逾期风险模型,获取逾期风险模型输出的逾期风险值;逾期风险模型为经过中文语料集预训练,以及风险场景数据微调得到的模型;结合逾期风险值,对用户进行风险决策,该方法通过采用对应系数能够反映语义信息以及蕴含知识的模型,结合用户的行为文本确定用户的逾期风险,提高了逾期风险计算的准确度。

Risk assessment methods and devices

【技术实现步骤摘要】
风险评估方法及装置
本申请涉及数据处理
,具体涉及风控
,尤其涉及风险评估方法及装置。
技术介绍
目前,在教育贷和教育现金贷的审核过程中,需要引入一些自动的用户风控方法对用户的风险进行评估。相关技术中,对用户风控方法主要是,基于词典、词向量的方法对用户的行为文本信息进行向量化,然后基于向量以及模型计算确定用户的逾期风险。但是,在上述方法中,模型基于用户的行为向量来计算逾期风险,而行为向量是结合用户的行为文本以及词典等确定的,难以反映行为文本中的语义信息以及蕴含知识,导致计算得到的逾期风险并不准确。
技术实现思路
本申请提出一种风险评估方法及装置,通过采用对应系数能够反映语义信息以及蕴含知识的模型,结合用户的行为文本确定用户的逾期风险,提高了逾期风险计算的准确度。本申请一方面实施例提出了一种风险评估方法,包括:获取待进行评估的用户的行为文本;将所述行为文本输入预设的逾期风险模型,获取所述逾期风险模型输出的逾期风险值;所述逾期风险模型为经过中文语料集预训练,以及风险场景数据微调得到的模型;结合所述逾期风险值,对所述用户进行风险决策。在本申请一个实施例中,所述将所述行为文本输入预设的逾期风险模型,获取所述逾期风险模型输出的逾期风险值之前,还包括:获取初始的逾期风险模型,以及中文语料集;所述中文语料集包括:大于第一预设数量的中文语料;采用所述中文语料集对所述初始的逾期风险模型进行预训练,得到经过预训练的逾期风险模型;获取风险场景的训练数据,所述训练数据包括:大于第二预设数量的用户行为文本以及对应的逾期风险值;采用所述训练数据对经过预训练的逾期风险模型进行训练,得到所述预设的逾期风险模型。在本申请一个实施例中,所述获取待进行评估的用户的行为文本,包括:获取待进行评估的用户的反馈数据,所述反馈数据包括:多个搜索文本;对所述反馈数据进行采样以及分隔符拼接,得到所述用户的行为文本。在本申请一个实施例中,所述逾期风险模型为知识增强语义表示模型。本申请实施例的风险评估方法,通过获取待进行评估的用户的行为文本;将所述行为文本输入预设的逾期风险模型,获取所述逾期风险模型输出的逾期风险值;所述逾期风险模型为经过中文语料集预训练,以及风险场景数据微调得到的模型;结合所述逾期风险值,对所述用户进行风险决策,该方法通过采用对应系数能够反映语义信息以及蕴含知识的模型,结合用户的行为文本确定用户的逾期风险值,提高了逾期风险计算的准确度。本申请另一方面实施例提出了一种风险评估装置,包括:获取模块,用于获取待进行评估的用户的行为文本;输入模块,用于将所述行为文本输入预设的逾期风险模型,获取所述逾期风险模型输出的逾期风险值;所述逾期风险模型为经过中文语料集预训练,以及风险场景数据微调得到的模型;决策模块,用于结合所述逾期风险值,对所述用户进行风险决策。在本申请一个实施例中,风险评估装置还包括:预训练模块和训练模块;所述获取模块,还用于获取初始的逾期风险模型,以及中文语料集;所述中文语料集包括:大于第一预设数量的中文语料;所述预训练模块,用于采用所述中文语料集对所述初始的逾期风险模型进行预训练,得到经过预训练的逾期风险模型;所述获取模块,还用于获取风险场景的训练数据,所述训练数据包括:大于第二预设数量的用户行为文本以及对应的逾期风险值;所述训练模块,用于采用所述训练数据对经过预训练的逾期风险模型进行训练,得到所述预设的逾期风险模型。在本申请一个实施例中,所述获取模块具体用于,获取待进行评估的用户的反馈数据,所述反馈数据包括:多个搜索文本;对所述反馈数据进行采样以及分隔符拼接,得到所述用户的行为文本。在本申请一个实施例中,所述逾期风险模型为知识增强语义表示模型。本申请实施例的风险评估装置,通过获取待进行评估的用户的行为文本;将所述行为文本输入预设的逾期风险模型,获取所述逾期风险模型输出的逾期风险值;所述逾期风险模型为经过中文语料集预训练,以及风险场景数据微调得到的模型;结合所述逾期风险值,对所述用户进行风险决策,该装置可实现通过采用对应系数能够反映语义信息以及蕴含知识的模型,结合用户的行为文本确定用户的逾期风险,提高了逾期风险计算的准确度。本申请另一方面实施例提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请实施例的风险评估方法。本申请另一方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请实施例的风险评估方法。上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是根据本申请第一实施例的示意图;图2是根据本申请第二实施例的示意图。图3是本申请实施例逾期风险模型框架示意图;图4是根据本申请第三实施例的示意图;图5是根据本申请第四实施例的示意图;图6是用来实现本申请实施例的风险评估方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。下面参考附图描述本申请实施例的风险评估方法及装置。图1是根据本申请第一实施例的示意图。其中,需要说明的是,本实施例提供的风险评估方法的执行主体为风险评估装置,该装置可以由软件和/或硬件的方式实现,该装置可以配置在终端设备或者服务器中,该实施例对此不作具体限定。如图1所示,该风险评估方法可以包括:步骤101,获取待进行评估的用户的行为文本。在本申请实施例中,待进行评估的用户的行为文本可为待进行评估的用户的反馈数据。可选地,获取待进行评估的用户的反馈数据,反馈数据包括:多个搜索文本;对反馈数据进行采样以及分隔符拼接,得到用户的行为文本。作为一种示例,比如,用户在浏览器搜索栏中输入文本,根据用户输入的文本进行提取可获取用户的反馈数据。为了节省相关计算资源,对反馈数据进行采样,并对采用后的反馈数据采用分隔符进行拼接,得到用户的行为文本。步骤102,将行为文本输入预设的逾期风险模型,获取逾期风险模型输出的逾期风险值;逾期风险模型为经过中文语料集预训练,以及风险场景数据微调得到的模型。在本申请实施例中,获取待进行评估的用户的行为文本之后,可将该行为文本输入预设的逾期风险模型,获取逾期风险模型输出的逾期风险值。其中,需要说明的是,逾期风险模型可为经过中文语料集预训练,以及风险场景数据微调得到的模型。作为一种示例,逾期风险模型可以是但不限于本文档来自技高网...

【技术保护点】
1.一种风险评估方法,其特征在于,包括:/n获取待进行评估的用户的行为文本;/n将所述行为文本输入预设的逾期风险模型,获取所述逾期风险模型输出的逾期风险值;所述逾期风险模型为经过中文语料集预训练,以及风险场景数据微调得到的模型;/n结合所述逾期风险值,对所述用户进行风险决策。/n

【技术特征摘要】
1.一种风险评估方法,其特征在于,包括:
获取待进行评估的用户的行为文本;
将所述行为文本输入预设的逾期风险模型,获取所述逾期风险模型输出的逾期风险值;所述逾期风险模型为经过中文语料集预训练,以及风险场景数据微调得到的模型;
结合所述逾期风险值,对所述用户进行风险决策。


2.根据权利要求1所述的方法,其特征在于,所述将所述行为文本输入预设的逾期风险模型,获取所述逾期风险模型输出的逾期风险值之前,还包括:
获取初始的逾期风险模型,以及中文语料集;所述中文语料集包括:大于第一预设数量的中文语料;
采用所述中文语料集对所述初始的逾期风险模型进行预训练,得到经过预训练的逾期风险模型;
获取风险场景的训练数据,所述训练数据包括:大于第二预设数量的用户行为文本以及对应的逾期风险值;
采用所述训练数据对经过预训练的逾期风险模型进行训练,得到所述预设的逾期风险模型。


3.根据权利要求1所述的方法,其特征在于,所述获取待进行评估的用户的行为文本,包括:
获取待进行评估的用户的反馈数据,所述反馈数据包括:多个搜索文本;
对所述反馈数据进行采样以及分隔符拼接,得到所述用户的行为文本。


4.根据权利要求1-3任一项所述的方法,其特征在于,所述逾期风险模型为知识增强语义表示模型。


5.一种风险评估装置,其特征在于,包括:
获取模块,用于获取待进行评估的用户的行为文本;
输入模块,用于将所述行为文本输入预设的逾期风险模型,获取所述逾期风险模型输出的逾期风险值;所述逾期风险模型为经过中文语料集预训练,以...

【专利技术属性】
技术研发人员:曹宇慧冯仕堃何径舟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1