用户画像识别模型训练方法、设备、可读存储介质及产品技术

技术编号：27813712 阅读：17 留言：0更新日期：2021-03-30 09:59

本申请公开了用户画像识别模型训练方法、设备、可读存储介质及产品，涉及数据处理中的深度学习、大数据。具体实现方案为：获取多组用户画像数据以及用户画像数据对应的标签信息；通过多组用户画像数据以及标签信息，对预设的基准网络模型和影子网络模型进行训练操作，获得基准网络模型输出的第一预测标签和影子网络模型输出的第二预测标签；根据标签信息、第一预测标签、第二预测标签，对基准网络模型和影子网络模型的训练参数进行更新，获得基准网络模型对应的第一训练参数、影子网络模型对应的第二训练参数；采用第一训练参数以及第二训练参数对基准网络模型和影子网络模型进行训练。从而能够提高用户画像识别模型鲁棒性以及识别精度。识别精度。识别精度。

全部详细技术资料下载

【技术实现步骤摘要】
用户画像识别模型训练方法、设备、可读存储介质及产品

[0001]本申请涉及数据处理中的深度学习、大数据，尤其涉及一种用户画像识别模型训练方法、设备、可读存储介质及产品。

技术介绍

[0002]用户画像又称用户角色，在大数据时代背景下，用户信息充斥在网络中，将用户的每个具体信息抽象成标签，利用这些标签将用户形象具体化，从而能够有效地为用户提供有针对性的服务。
[0003]为了实现对用户画像的识别操作，现有技术中一般都通过预先收集的大量带有标签信息的用户画像训练数据，将用户画像数据分别多组，对预设的网络模型进行训练操作。
[0004]但是，采用上述方法进行模型训练的过程中，由于用户画像的标签识别场景中，特征高维稀疏，模型的解空间复杂，导致模型较为敏感脆弱。如果存在某组质量不佳的训练数据，则可能会导致模型过拟合，进而导致训练后的模型识别精度不高。

技术实现思路

[0005]本申请提供了一种用于提高用户画像识别模型鲁棒性的用户画像识别模型训练方法、装置、设备以及存储介质。
[0006]根据本申请的第一方面，提供了一种用户画像识别模型训练方法，包括：
[0007]获取多组用户画像数据以及所述用户画像数据对应的标签信息；
[0008]通过所述多组用户画像数据以及所述用户画像数据对应的标签信息，分别对预设的基准网络模型和影子网络模型进行训练操作，获得所述基准网络模型输出的第一预测标签和影子网络模型输出的第二预测标签；
[0009]根据所述用户画像数据对应的标签信息、第...

【技术保护点】

【技术特征摘要】
1.一种用户画像识别模型训练方法，包括：获取多组用户画像数据以及所述用户画像数据对应的标签信息；通过所述多组用户画像数据以及所述用户画像数据对应的标签信息，分别对预设的基准网络模型和影子网络模型进行训练操作，获得所述基准网络模型输出的第一预测标签和影子网络模型输出的第二预测标签；根据所述用户画像数据对应的标签信息、第一预测标签以及所述第二预测标签，对所述基准网络模型和影子网络模型的训练参数进行更新操作，获得所述基准网络模型对应的更新后的第一训练参数以及影子网络模型对应的更新后的第二训练参数；采用所述第一训练参数以及所述第二训练参数对所述基准网络模型和影子网络模型进行训练操作。2.根据权利要求1所述的方法，所述根据所述用户画像数据对应的标签信息、第一预测标签以及所述第二预测标签，对所述基准网络模型和影子网络模型的训练参数进行更新操作，包括：根据所述基准网络模型对应的交叉熵损失函数对所述第一预测标签以及所述用户画像数据对应的标签信息进行计算，获得所述基准网络模型对应的第一损失值；根据所述基准网络模型对应的均方误差损失函数对所述第一预测标签以及所述第二预测标签进行计算，获得所述基准网络模型对应的第二损失值；根据所述第一损失值以及所述第二损失值，对所述基准网络模型和影子网络模型的训练参数进行更新操作。3.根据权利要求2所述的方法，所述根据所述第一损失值以及所述第二损失值，对所述基准网络模型和影子网络模型的训练参数进行更新操作，包括：根据所述第一损失值以及所述第二损失值，对所述基准网络模型的训练参数进行更新操作，获得所述第一训练参数；通过所述第一训练参数以及预设的参数动量累积公式，对所述影子网络模型的训练参数进行更新操作，获得所述第二训练参数。4.根据权利要求3所述的方法，所述根据所述第一损失值以及所述第二损失值，对所述基准网络模型的训练参数进行更新操作，获得所述第一训练参数，包括；对所述第一损失值以及所述第二损失值进行求和操作，获得目标损失值；根据所述目标损失值，对所述基准网络对应的基准训练参数进行更新操作，获得所述第一训练参数。5.根据权利要求3所述的方法，所述通过所述第一训练参数以及预设的参数动量累积公式，对所述影子网络模型的训练参数进行更新操作之前，还包括：确定所述基准网络模型和影子网络模型当前的迭代训练次数；根据所述迭代训练次数，以及预设的超参数计算公式，计算与所述迭代训练次数对应的待选超参数；将所述待选超参数以及所述用户超参数中数值小的超参数作为所述当前的目标超参数。6.根据权利要求5所述的方法，所述通过所述第一训练参数以及预设的参数动量累积公式，对所述影子网络模型的训练参数进行更新操作，包括：
通过所述第一训练参数、所述目标超参数以及预设的参数动量累积公式，对所述影子网络模型的训练参数进行更新操作。7.根据权利要求1
‑
6任一项所述的方法，所述采用所述第一训练参数以及所述第二训练参数对所述基准网络模型和影子网络模型进行训练操作之后，还包括：判断分别采用所述第一训练参数以及所述第二训练参数训练后的所述基准网络模型和影子网络模型是否满足预设的收敛条件；若不满足，则返回执行所述通过所述待训练数据集，分别对预设的基准网络模型和影子网络模型进行训练操作，获得所述基准网络模型和影子网络模型对应的损失值的步骤，直至所述基准网络模型和影子网络模型满足预设的收敛条件，将满足收敛条件的基准网络模型或影子网络模型作为训练完毕的用户画像识别模型。8.根据权利要求7所述的方法，所述判断分别采用所述第一训练参数以及所述第二训练参数训练后的所述基准网络模型和影子网络模型是否满足预设的收敛条件，包括：确定采用所述第一训练参数训练后的基准网络模型对应第三损失值以及第四损失值；判断第三损失值以及第四损失值是否小于预设的损失阈值；若小于，则判定所述基准网络模型和影子网络模型满足所述收敛条件；若小于，则判定所述基准网络模型和影子网络模型不满足所述收敛条件。9.一种用户画像识别模型训练装置，包括：获取模块，用于获取多组用...

【专利技术属性】
技术研发人员：王龙飞，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人