基于半监督学习的用户行为模型训练方法及装置制造方法及图纸

技术编号:18019540 阅读:34 留言:0更新日期:2018-05-23 05:31
本发明专利技术公开了一种基于半监督学习的用户行为模型训练方法及装置,其方法包括:将用户数据输入至在数个中间层中引入噪声数据的神经网络中,获取第一中间层的第一噪声输出结果;利用第一噪声输出结果对神经网络进行重构处理,得到至少一个第二中间层的第二重构输出结果;将用户数据输入至神经网络中,得到至少一个第二中间层的第二输出结果以及第一中间层的第一输出结果;利用第二输出结果与第二重构输出结果之间的损失,以及第一输出结果与第一噪声输出结果之间的损失,对神经网络进行训练。本发明专利技术在神经网络中引入噪声数据,利用噪声输出结果得到重构输出结果。利用重构输出结果与神经网络的输出结果之间的损失,实现对神经网络的训练。

【技术实现步骤摘要】
基于半监督学习的用户行为模型训练方法及装置
本专利技术涉及深度学习领域,具体涉及一种基于半监督学习的用户行为模型训练方法及装置。
技术介绍
对于金融领域,由于存在对用户放款后,用户在还款时可能逾期的行为,逾期还款会导致各种风险问题。因此,需要对金融进行风控管理,通过风控管理,结合用户的行为,对金融贷款的风险进行把控。现有技术在金融风控管理时,一般采用评分卡模型,仅对放款的用户进行管理,且评分卡模型需要监督学习,即需要有标注的用户数据,且用户数据的结果分类比例要求均衡。但在当前的大数据时代,往往收集到的用户数据大量为无标注的用户数据,且收集到的有标注用户数据的结果分类比例相差很大。因此,需要一种方法,基于大量无标注的用户数据对用户行为进行挖掘,以便根据挖掘结果进行风控管理。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的基于半监督学习的用户行为模型训练方法及装置。根据本专利技术的一个方面,提供了一种基于半监督学习的用户行为模型训练方法,其包括:将用户数据输入至在数个中间层中引入噪声数据的神经网络中,数个中间层包括第一中间层和至少一个第二中间层;获取第一中间层的第一噪声输出结果;利用第一噪声输出结果对神经网络进行重构处理,得到至少一个第二中间层的第二重构输出结果;将用户数据输入至神经网络中,得到至少一个第二中间层的第二输出结果以及第一中间层的第一输出结果;利用第二输出结果与第二重构输出结果之间的损失,以及第一输出结果与第一噪声输出结果之间的损失,对神经网络进行训练。可选地,针对具有标注结果的用户数据,方法还包括:通过将用户数据输入至神经网络中,得到神经网络的输出层的输出结果;利用输出层的输出结果与标注结果之间的损失,对神经网络进行训练。可选地,第一中间层为神经网络的瓶颈层。可选地,至少一个第二中间层为彼此相邻的第二中间层和/或彼此间具有层间隔的第二中间层。可选地,用户数据包括无标注结果的用户数据和具有标注结果的用户数据;无标注结果的用户数据为未放款用户数据;具有标注结果的用户数据为放款且不逾期用户数据和/或放款且逾期用户数据。根据本专利技术的另一方面,提供了一种预测方法,其包括:将未放款用户数据输入至利用上述基于半监督学习的用户行为模型训练方法得到的神经网络中,得到预测结果;预测结果为不逾期或逾期。根据本专利技术的另一方面,提供了一种基于半监督学习的用户行为模型训练装置,其包括:噪声输出模块,适于将用户数据输入至在数个中间层中引入噪声数据的神经网络中,数个中间层包括第一中间层和至少一个第二中间层;获取第一中间层的第一噪声输出结果;噪声重构模块,适于利用第一噪声输出结果对神经网络进行重构处理,得到至少一个第二中间层的第二重构输出结果;输出模块,适于将用户数据输入至神经网络中,得到至少一个第二中间层的第二输出结果以及第一中间层的第一输出结果;第一训练模块,适于利用第二输出结果与第二重构输出结果之间的损失,以及第一输出结果与第一噪声输出结果之间的损失,对神经网络进行训练。可选地,针对具有标注结果的用户数据,装置还包括:第二训练模块,适于通过将用户数据输入至神经网络中,得到神经网络的输出层的输出结果;利用输出层的输出结果与标注结果之间的损失,对神经网络进行训练。可选地,第一中间层为神经网络的瓶颈层。可选地,至少一个第二中间层为彼此相邻的第二中间层和/或彼此间具有层间隔的第二中间层。可选地,用户数据包括无标注结果的用户数据和具有标注结果的用户数据;无标注结果的用户数据为未放款用户数据;具有标注结果的用户数据为放款且不逾期用户数据和/或放款且逾期用户数据。根据本专利技术的另一方面,提供了一种预测装置,适于将未放款用户数据输入至利用上述基于半监督学习的用户行为模型训练装置得到的神经网络中,得到预测结果;预测结果为不逾期或逾期。根据本专利技术的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;存储器用于存放至少一可执行指令,可执行指令使处理器执行上述基于半监督学习的用户行为模型训练方法对应的操作。根据本专利技术的再一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述基于半监督学习的用户行为模型训练方法对应的操作。根据本专利技术的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;存储器用于存放至少一可执行指令,可执行指令使处理器执行上述预测方法对应的操作。根据本专利技术的再一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述预测方法对应的操作。根据本专利技术提供的基于半监督学习的用户行为模型训练方法及装置,将用户数据输入至在数个中间层中引入噪声数据的神经网络中,数个中间层包括第一中间层和至少一个第二中间层;获取第一中间层的第一噪声输出结果;利用第一噪声输出结果对神经网络进行重构处理,得到至少一个第二中间层的第二重构输出结果;将用户数据输入至神经网络中,得到至少一个第二中间层的第二输出结果以及第一中间层的第一输出结果;利用第二输出结果与第二重构输出结果之间的损失,以及第一输出结果与第一噪声输出结果之间的损失,对神经网络进行训练。本专利技术构建了双向的网络结构,在神经网络中引入噪声数据,利用噪声输出结果对神经网络进行重构处理,得到重构输出结果。利用重构输出结果与神经网络的输出结果之间的损失,实现神经网络的训练。进一步,本专利技术有效的利用大量无标注的数据对神经网络进行训练,提高大量无标注数据的利用率。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了根据本专利技术一个实施例的基于半监督学习的用户行为模型训练方法的流程图;图2示出了根据本专利技术一个实施例的基于半监督学习的用户行为模型训练装置的功能框图;图3示出了根据本专利技术一个实施例的一种计算设备的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。图1示出了根据本专利技术一个实施例的基于半监督学习的用户行为模型训练方法的流程图。如图1所示,基于半监督学习的用户行为模型训练方法具体包括如下步骤:步骤S101,将用户数据输入至在数个中间层中引入噪声数据的神经网络中,数个中间层包括第一中间层和至少一个第二中间层;获取第一中间层的第一噪声输出结果。用户数据包括无标注结果的用户数据和具有标注结果的用户数据。具体的,如对于金融风控领域,可以收集到大量的无标注结果的本文档来自技高网...
基于半监督学习的用户行为模型训练方法及装置

【技术保护点】
一种基于半监督学习的用户行为模型训练方法,其包括:将用户数据输入至在数个中间层中引入噪声数据的神经网络中,所述数个中间层包括第一中间层和至少一个第二中间层;获取所述第一中间层的第一噪声输出结果;利用所述第一噪声输出结果对所述神经网络进行重构处理,得到所述至少一个第二中间层的第二重构输出结果;将所述用户数据输入至所述神经网络中,得到所述至少一个第二中间层的第二输出结果以及所述第一中间层的第一输出结果;利用所述第二输出结果与所述第二重构输出结果之间的损失,以及所述第一输出结果与所述第一噪声输出结果之间的损失,对所述神经网络进行训练。

【技术特征摘要】
1.一种基于半监督学习的用户行为模型训练方法,其包括:将用户数据输入至在数个中间层中引入噪声数据的神经网络中,所述数个中间层包括第一中间层和至少一个第二中间层;获取所述第一中间层的第一噪声输出结果;利用所述第一噪声输出结果对所述神经网络进行重构处理,得到所述至少一个第二中间层的第二重构输出结果;将所述用户数据输入至所述神经网络中,得到所述至少一个第二中间层的第二输出结果以及所述第一中间层的第一输出结果;利用所述第二输出结果与所述第二重构输出结果之间的损失,以及所述第一输出结果与所述第一噪声输出结果之间的损失,对所述神经网络进行训练。2.根据权利要求1所述的方法,其中,针对具有标注结果的用户数据,所述方法还包括:通过将用户数据输入至所述神经网络中,得到所述神经网络的输出层的输出结果;利用所述输出层的输出结果与所述标注结果之间的损失,对所述神经网络进行训练。3.根据权利要求1或2所述的方法,其中,所述第一中间层为所述神经网络的瓶颈层。4.一种预测方法,其包括:将未放款用户数据输入至利用权利要求1-3中任一项所述的基于半监督学习的用户行为模型训练方法得到的神经网络中,得到预测结果;所述预测结果为不逾期或逾期。5.一种基于半监督学习的用户行为模型训练装置,其包括:噪声输出模块,适于将用户数据输入至在数个中间层中引入噪声数据的神经网络中,所述数个中间层包括第一中间层和至少一个第二中间层;获取所述第一中间层的第一噪声输出结果;噪声重构模块,适于利用所述第一噪声输出结果对所述神经网络进...

【专利技术属性】
技术研发人员:董健
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1