用户画像识别模型训练方法、设备、可读存储介质及产品技术

技术编号:27813712 阅读:17 留言:0更新日期:2021-03-30 09:59
本申请公开了用户画像识别模型训练方法、设备、可读存储介质及产品,涉及数据处理中的深度学习、大数据。具体实现方案为:获取多组用户画像数据以及用户画像数据对应的标签信息;通过多组用户画像数据以及标签信息,对预设的基准网络模型和影子网络模型进行训练操作,获得基准网络模型输出的第一预测标签和影子网络模型输出的第二预测标签;根据标签信息、第一预测标签、第二预测标签,对基准网络模型和影子网络模型的训练参数进行更新,获得基准网络模型对应的第一训练参数、影子网络模型对应的第二训练参数;采用第一训练参数以及第二训练参数对基准网络模型和影子网络模型进行训练。从而能够提高用户画像识别模型鲁棒性以及识别精度。识别精度。识别精度。

【技术实现步骤摘要】
用户画像识别模型训练方法、设备、可读存储介质及产品


[0001]本申请涉及数据处理中的深度学习、大数据,尤其涉及一种用户画像识别模型训练方法、设备、可读存储介质及产品。

技术介绍

[0002]用户画像又称用户角色,在大数据时代背景下,用户信息充斥在网络中,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而能够有效地为用户提供有针对性的服务。
[0003]为了实现对用户画像的识别操作,现有技术中一般都通过预先收集的大量带有标签信息的用户画像训练数据,将用户画像数据分别多组,对预设的网络模型进行训练操作。
[0004]但是,采用上述方法进行模型训练的过程中,由于用户画像的标签识别场景中,特征高维稀疏,模型的解空间复杂,导致模型较为敏感脆弱。如果存在某组质量不佳的训练数据,则可能会导致模型过拟合,进而导致训练后的模型识别精度不高。

技术实现思路

[0005]本申请提供了一种用于提高用户画像识别模型鲁棒性的用户画像识别模型训练方法、装置、设备以及存储介质。
[0006]根据本申请的第一方面,提供了一种用户画像识别模型训练方法,包括:
[0007]获取多组用户画像数据以及所述用户画像数据对应的标签信息;
[0008]通过所述多组用户画像数据以及所述用户画像数据对应的标签信息,分别对预设的基准网络模型和影子网络模型进行训练操作,获得所述基准网络模型输出的第一预测标签和影子网络模型输出的第二预测标签;
[0009]根据所述用户画像数据对应的标签信息、第一预测标签以及所述第二预测标签,对所述基准网络模型和影子网络模型的训练参数进行更新操作,获得所述基准网络模型对应的更新后的第一训练参数以及影子网络模型对应的更新后的第二训练参数;
[0010]采用所述第一训练参数以及所述第二训练参数对所述基准网络模型和影子网络模型进行训练操作。
[0011]根据本申请的第二方面,提供了一种用户画像识别模型训练装置,包括:
[0012]获取模块,用于获取多组用户画像数据以及所述用户画像数据对应的标签信息;
[0013]训练模块,用于通过所述多组用户画像数据以及所述用户画像数据对应的标签信息,分别对预设的基准网络模型和影子网络模型进行训练操作,获得所述基准网络模型输出的第一预测标签和影子网络模型输出的第二预测标签;
[0014]更新模块,用于根据所述用户画像数据对应的标签信息、第一预测标签以及所述第二预测标签,对所述基准网络模型和影子网络模型的训练参数进行更新操作,获得所述基准网络模型对应的更新后的第一训练参数以及影子网络模型对应的更新后的第二训练参数;
[0015]处理模块,用于采用所述第一训练参数以及所述第二训练参数对所述基准网络模型和影子网络模型进行训练操作。
[0016]根据本申请的第三方面,提供了一种电子设备,包括:
[0017]至少一个处理器;以及
[0018]与所述至少一个处理器通信连接的存储器;其中,
[0019]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面所述的用户画像识别模型训练方法。
[0020]根据本申请的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行如第一方面所述的用户画像识别模型训练方法。
[0021]根据本申请的第五方面,提供了一种计算机程序产品,所述程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面所述的方法。
[0022]根据本申请的技术解决了现有的用户画像识别模型训练方法,当存在质量不佳的训练数据时,导致模型过拟合,模型鲁棒性不佳,且识别精度不高的技术问题。
[0023]应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0024]附图用于更好地理解本方案,不构成对本申请的限定。其中:
[0025]图1为本申请基于的网络架构示意图;
[0026]图2为本申请实施例一提供的用户画像识别模型训练方法的流程示意图;
[0027]图3为本申请实施例提供的模型训练的场景示意图;
[0028]图4为本申请实施例二提供的用户画像识别模型训练方法的流程示意图;
[0029]图5为本申请实施例三提供的用户画像识别模型训练装置的结构示意图;
[0030]图6为本申请实施例四提供的电子设备的结构示意图。
具体实施方式
[0031]以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0032]针对上述提及的现有的用户画像识别模型训练方法,当存在质量不佳的训练数据时,导致模型过拟合,模型鲁棒性不佳,且识别精度不高的技术问题,本申请提供了一种用户画像识别模型训练方法、装置、设备、可读存储介质及产品。
[0033]需要说明的是,本申请提供用户画像识别模型训练方法、设备、可读存储介质及产品可运用在对任意一种模型进行训练,提高模型鲁棒性的场景中。
[0034]现有的用户画像识别模型训练过程中,一般将数据随机分为多个数据子集,采用各数据子集对模型进行训练操作。但是,由于用户画像的标签识别问题中,特征高维稀疏,模型的解空间复杂,加之输入样本中噪声的存在,由此导致模型相对敏感脆弱,特征输入变化都可能导致模型产生错误的判断。
[0035]在解决上述技术问题的过程中,专利技术人通过研究发现,为了提高用户画像识别模型的鲁棒性,可以同时对基准网络模型以及与基准网络模型对应的影子网络模型进行训练操作。根据基准网络模型输出的第一预测标签和影子网络模型输出的第二预测标签,对基准网络模型和影子网络模型的训练参数进行调节。通过两个模型同时训练,互相约束,从而能够在保证用户画像识别模型鲁棒性的基础上,保证用户画像识别模型的识别精度。
[0036]图1为本申请基于的网络架构示意图,如图1所示,本申请基于的网络架构至少包括:数据服务器1以及服务器2,其中,服务器2中设置有用户画像识别模型训练装置,该用户画像识别模型训练装置可采用C/C++、Java、Shell或Python等语言编写;数据服务器1则可为云端服务器或服务器集群,其内存储有大量的数据。该数据服务器1与服务器2可以通信连接,从而服务器2中设置的用户画像识别模型训练装置可以从数据服务器中获取多组用户画像数据以及所述用户画像数据对应的标签信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户画像识别模型训练方法,包括:获取多组用户画像数据以及所述用户画像数据对应的标签信息;通过所述多组用户画像数据以及所述用户画像数据对应的标签信息,分别对预设的基准网络模型和影子网络模型进行训练操作,获得所述基准网络模型输出的第一预测标签和影子网络模型输出的第二预测标签;根据所述用户画像数据对应的标签信息、第一预测标签以及所述第二预测标签,对所述基准网络模型和影子网络模型的训练参数进行更新操作,获得所述基准网络模型对应的更新后的第一训练参数以及影子网络模型对应的更新后的第二训练参数;采用所述第一训练参数以及所述第二训练参数对所述基准网络模型和影子网络模型进行训练操作。2.根据权利要求1所述的方法,所述根据所述用户画像数据对应的标签信息、第一预测标签以及所述第二预测标签,对所述基准网络模型和影子网络模型的训练参数进行更新操作,包括:根据所述基准网络模型对应的交叉熵损失函数对所述第一预测标签以及所述用户画像数据对应的标签信息进行计算,获得所述基准网络模型对应的第一损失值;根据所述基准网络模型对应的均方误差损失函数对所述第一预测标签以及所述第二预测标签进行计算,获得所述基准网络模型对应的第二损失值;根据所述第一损失值以及所述第二损失值,对所述基准网络模型和影子网络模型的训练参数进行更新操作。3.根据权利要求2所述的方法,所述根据所述第一损失值以及所述第二损失值,对所述基准网络模型和影子网络模型的训练参数进行更新操作,包括:根据所述第一损失值以及所述第二损失值,对所述基准网络模型的训练参数进行更新操作,获得所述第一训练参数;通过所述第一训练参数以及预设的参数动量累积公式,对所述影子网络模型的训练参数进行更新操作,获得所述第二训练参数。4.根据权利要求3所述的方法,所述根据所述第一损失值以及所述第二损失值,对所述基准网络模型的训练参数进行更新操作,获得所述第一训练参数,包括;对所述第一损失值以及所述第二损失值进行求和操作,获得目标损失值;根据所述目标损失值,对所述基准网络对应的基准训练参数进行更新操作,获得所述第一训练参数。5.根据权利要求3所述的方法,所述通过所述第一训练参数以及预设的参数动量累积公式,对所述影子网络模型的训练参数进行更新操作之前,还包括:确定所述基准网络模型和影子网络模型当前的迭代训练次数;根据所述迭代训练次数,以及预设的超参数计算公式,计算与所述迭代训练次数对应的待选超参数;将所述待选超参数以及所述用户超参数中数值小的超参数作为所述当前的目标超参数。6.根据权利要求5所述的方法,所述通过所述第一训练参数以及预设的参数动量累积公式,对所述影子网络模型的训练参数进行更新操作,包括:
通过所述第一训练参数、所述目标超参数以及预设的参数动量累积公式,对所述影子网络模型的训练参数进行更新操作。7.根据权利要求1

6任一项所述的方法,所述采用所述第一训练参数以及所述第二训练参数对所述基准网络模型和影子网络模型进行训练操作之后,还包括:判断分别采用所述第一训练参数以及所述第二训练参数训练后的所述基准网络模型和影子网络模型是否满足预设的收敛条件;若不满足,则返回执行所述通过所述待训练数据集,分别对预设的基准网络模型和影子网络模型进行训练操作,获得所述基准网络模型和影子网络模型对应的损失值的步骤,直至所述基准网络模型和影子网络模型满足预设的收敛条件,将满足收敛条件的基准网络模型或影子网络模型作为训练完毕的用户画像识别模型。8.根据权利要求7所述的方法,所述判断分别采用所述第一训练参数以及所述第二训练参数训练后的所述基准网络模型和影子网络模型是否满足预设的收敛条件,包括:确定采用所述第一训练参数训练后的基准网络模型对应第三损失值以及第四损失值;判断第三损失值以及第四损失值是否小于预设的损失阈值;若小于,则判定所述基准网络模型和影子网络模型满足所述收敛条件;若小于,则判定所述基准网络模型和影子网络模型不满足所述收敛条件。9.一种用户画像识别模型训练装置,包括:获取模块,用于获取多组用...

【专利技术属性】
技术研发人员:王龙飞
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1