基于半监督学习的用户行为模型训练方法及装置制造方法及图纸

技术编号：18019540 阅读：34 留言：0更新日期：2018-05-23 05:31

本发明专利技术公开了一种基于半监督学习的用户行为模型训练方法及装置，其方法包括：将用户数据输入至在数个中间层中引入噪声数据的神经网络中，获取第一中间层的第一噪声输出结果；利用第一噪声输出结果对神经网络进行重构处理，得到至少一个第二中间层的第二重构输出结果；将用户数据输入至神经网络中，得到至少一个第二中间层的第二输出结果以及第一中间层的第一输出结果；利用第二输出结果与第二重构输出结果之间的损失，以及第一输出结果与第一噪声输出结果之间的损失，对神经网络进行训练。本发明专利技术在神经网络中引入噪声数据，利用噪声输出结果得到重构输出结果。利用重构输出结果与神经网络的输出结果之间的损失，实现对神经网络的训练。

全部详细技术资料下载

【技术实现步骤摘要】
基于半监督学习的用户行为模型训练方法及装置
本专利技术涉及深度学习领域，具体涉及一种基于半监督学习的用户行为模型训练方法及装置。
技术介绍
对于金融领域，由于存在对用户放款后，用户在还款时可能逾期的行为，逾期还款会导致各种风险问题。因此，需要对金融进行风控管理，通过风控管理，结合用户的行为，对金融贷款的风险进行把控。现有技术在金融风控管理时，一般采用评分卡模型，仅对放款的用户进行管理，且评分卡模型需要监督学习，即需要有标注的用户数据，且用户数据的结果分类比例要求均衡。但在当前的大数据时代，往往收集到的用户数据大量为无标注的用户数据，且收集到的有标注用户数据的结果分类比例相差很大。因此，需要一种方法，基于大量无标注的用户数据对用户行为进行挖掘，以便根据挖掘结果进行风控管理。
技术实现思路
鉴于上述问题，提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的基于半监督学习的用户行为模型训练方法及装置。根据本专利技术的一个方面，提供了一种基于半监督学习的用户行为模型训练方法，其包括：将用户数据输入至在数个中间层中引入噪声数据的神经网络中，数个中间层包括第一中间层和至少一个第二中间层；获取第一中间层的第一噪声输出结果；利用第一噪声输出结果对神经网络进行重构处理，得到至少一个第二中间层的第二重构输出结果；将用户数据输入至神经网络中，得到至少一个第二中间层的第二输出结果以及第一中间层的第一输出结果；利用第二输出结果与第二重构输出结果之间的损失，以及第一输出结果与第一噪声输出结果之间的损失，对神经网络进行训练。可选地，针对具有标注结果的用户数据，方法还包括：通...
基于半监督学习的用户行为模型训练方法及装置

【技术保护点】
一种基于半监督学习的用户行为模型训练方法，其包括：将用户数据输入至在数个中间层中引入噪声数据的神经网络中，所述数个中间层包括第一中间层和至少一个第二中间层；获取所述第一中间层的第一噪声输出结果；利用所述第一噪声输出结果对所述神经网络进行重构处理，得到所述至少一个第二中间层的第二重构输出结果；将所述用户数据输入至所述神经网络中，得到所述至少一个第二中间层的第二输出结果以及所述第一中间层的第一输出结果；利用所述第二输出结果与所述第二重构输出结果之间的损失，以及所述第一输出结果与所述第一噪声输出结果之间的损失，对所述神经网络进行训练。

【技术特征摘要】
1.一种基于半监督学习的用户行为模型训练方法，其包括：将用户数据输入至在数个中间层中引入噪声数据的神经网络中，所述数个中间层包括第一中间层和至少一个第二中间层；获取所述第一中间层的第一噪声输出结果；利用所述第一噪声输出结果对所述神经网络进行重构处理，得到所述至少一个第二中间层的第二重构输出结果；将所述用户数据输入至所述神经网络中，得到所述至少一个第二中间层的第二输出结果以及所述第一中间层的第一输出结果；利用所述第二输出结果与所述第二重构输出结果之间的损失，以及所述第一输出结果与所述第一噪声输出结果之间的损失，对所述神经网络进行训练。2.根据权利要求1所述的方法，其中，针对具有标注结果的用户数据，所述方法还包括：通过将用户数据输入至所述神经网络中，得到所述神经网络的输出层的输出结果；利用所述输出层的输出结果与所述标注结果之间的损失，对所述神经网络进行训练。3.根据权利要求1或2所述的方法，其中，所述第一中间层为所述神经网络的瓶颈层。4.一种预测方法，其包括：将未放款用户数据输入至利用权利要求1-3中任一项所述的基于半监督学习的用户行为模型训练方法得到的神经网络中，得到预测结果；所述预测结果为不逾期或逾期。5.一种基于半监督学习的用户行为模型训练装置，其包括：噪声输出模块，适于将用户数据输入至在数个中间层中引入噪声数据的神经网络中，所述数个中间层包括第一中间层和至少一个第二中间层；获取所述第一中间层的第一噪声输出结果；噪声重构模块，适于利用所述第一噪声输出结果对所述神经网络进...

【专利技术属性】
技术研发人员：董健，
申请(专利权)人：北京奇虎科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人