【技术实现步骤摘要】
模型训练方法、行为预测方法、装置及电子设备
[0001]本专利技术涉及数据处理
,具体涉及一种模型训练方法、行为预测方法、装置及电子设备。
技术介绍
[0002]在互联网金融领域,用户行为序列建模是一项重要的任务,根据用户行为数据,如用户安装使用手机应用程序(application,APP)列表,用户搜索记录等,利用序列建模方法,深度挖掘用户的信贷相关表征,能够用于互金领域多种场景,比如获客,风控,老客经营等。因此有效的序列建模方法,对于充分挖掘用户数据是极其关键的。
[0003]相关技术中,通常采用针对自然语言处理(Natural Language Processing,NLP)的模型对用户的行为进行学习,但是,用户行为与自然语言之间存在较大的差异,因此,采用该种训练方式将导致模型的训练质量较差,且训练获得的模型并不能精准地表征用户的行为。
技术实现思路
[0004]本专利技术为了克服现有技术的缺陷,提出了一种模型训练方法、行为预测方法、装置及电子设备,能够提高模型的训练质量,以及通过训练完成 ...
【技术保护点】
【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:获取多个用户的历史行为数据,所述历史行为数据中包括历史行为操作数据和标签标识,所述标签标识用于指示所述用户是否具有标签信息,所述标签信息用于指示所述用户是否发生预设行为;对所述历史行为数据进行掩码处理,获得掩码后的历史行为数据;基于所述掩码后的历史行为数据对模型进行训练。2.根据权利要求1所述的方法,其特征在于,所述获取多个用户的历史行为数据的步骤,包括:获取所述历史行为操作数据;获取所述标签标识,在所述用户具有所述标签信息,且所述用户发生所述预设行为的情况下,所述标签标识为第一预设数值;在所述用户具有所述标签信息,且所述用户未发生所述预设行为的情况下,所述标签标识为第二预设数值;在所述用户不具有所述标签信息的情况下,所述标签标识为第三预设数值;将所述历史行为操作数据和所述标签标识进行组合,获得所述历史行为数据。3.根据权利要求2所述的方法,其特征在于,所述历史行为操作数据中包括多个数据单元;所述对所述历史行为数据进行掩码处理,获得掩码后的历史行为数据的步骤,包括:在所述用户具有所述标签信息的情况下,对所述标签标识以及所述历史行为操作数据中的部分所述数据单元进行掩码处理;在所述用户不具有所述标签信息的情况下,对所述历史操作行为数据中的部分所述数据单元进行掩码处理。4.根据权利要求1
‑
3任一项所述的方法,其特征在于,所述基于所述掩码后的历史行为数据对模型进行训练的步骤,包括:利用所述掩码后的历史行为数据对所述模型进行预训练,获得预训练后的模型;利用所述历史行为操作数据对所述预训练后的模型进行训练,获得训练好的模型。5.根据权利要求4所述的方法,其特征在于,所述利用所述掩码后的历史行为数据对所述模型进行预训练,获得预训练后的模型的步骤,包括:确定初始模型的初始网络参数;将各所述用户的所述掩码后的历史行为数据输入至所述初始模型中;提取所述掩码后的历史行为数据的相关性特征,所述相关性特征表示所述掩码后的历史行为操作数据中各数据...
【专利技术属性】
技术研发人员:刘洪涛,杨青,
申请(专利权)人:度小满科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。