特征重构模型的训练方法、使用方法、装置、设备及介质制造方法及图纸

技术编号:35060885 阅读:18 留言:0更新日期:2022-09-28 11:13
本申请公开了一种特征重构模型的训练方法、使用方法、装置、设备及介质,属于人工智能技术领域。该方法包括:获取第一帐号的第一通识特征,以及获取第二帐号的第二通识特征和辅助特征;对第一通识特征进行编码处理得到第一重构通识特征,对第二通识特征进行编码处理得到第二重构通识特征,以及对辅助特征进行编码处理得到重构辅助特征;对第一重构通识特征和第二重构通识特征所属的帐号类型进行预测,得到预测分类结果;根据对比误差和对抗误差对特征重构模型进行训练。本申请通过对特征重构模型进行训练,缩小了帐号类型为第一类型和第二类型的帐号之间的区别;避免了因为不同类型之间的帐号的信息差异导致的难于聚类问题。间的帐号的信息差异导致的难于聚类问题。间的帐号的信息差异导致的难于聚类问题。

【技术实现步骤摘要】
特征重构模型的训练方法、使用方法、装置、设备及介质


[0001]本申请涉及人工智能
,特别涉及一种特征重构模型的训练方法、使用方法、装置、设备及介质。

技术介绍

[0002]随着互联网技术发展,对不同用户进行聚类,并根据不同聚类结果进行个性化服务的需求日益提高。
[0003]在相关技术中,通常通过提取用户在应用程序中的行为信息,比如用户对多媒体资讯的浏览信息、用户对应用程序的使用信息,根据行为信息对用户进行聚类处理,以得到用户的聚类结果。
[0004]然而,这种方法严重依赖于用户在应用程序中的行为信息,对于首次使用应用程序的用户或在应用程序中行为信息少的用户,往往难于分类,如何提升聚类结果是亟待解决的问题。

技术实现思路

[0005]本申请提供了一种特征重构模型的训练方法、使用方法、装置、设备及介质,所述技术方案如下:
[0006]根据本申请的一方面,提供了一种特征重构模型的训练方法,所述方法包括:
[0007]获取第一帐号的第一通识特征,以及获取第二帐号的第二通识特征和辅助特征,所述第一通识特征包括所述第一帐号的第一通识信息的特征表示,所述第二通识特征包括所述第二帐号的第二通识信息的特征表示,所述辅助特征包括所述第二帐号的辅助信息的特征表示;所述第一帐号的帐号类型为第一类型,所述第二帐号的帐号类型为第二类型,所述第一类型中的帐号不存在对应的辅助信息;
[0008]对所述第一通识特征进行编码处理得到第一重构通识特征,对所述第二通识特征进行编码处理得到第二重构通识特征,以及对所述辅助特征进行编码处理得到重构辅助特征;
[0009]对所述第一重构通识特征和所述第二重构通识特征所属的帐号类型进行预测,得到预测分类结果;
[0010]根据对比误差和对抗误差对所述特征重构模型进行训练,得到训练后的特征重构模型,所述对比误差包括所述第二重构通识特征和所述重构辅助特征之间的误差,所述对抗误差包括所述预测分类结果和实际分类结果之间的误差,所述实际分类结果是所述第一通识特征和所述第二通识特征实际对应的帐号类型。
[0011]根据本申请的另一方面,提供了一种特征重构模型的使用方法,所述特征重构模型是根据上述特征重构模型的训练方法训练得到的,所述方法包括:
[0012]获取至少一个第三帐号的通识特征,所述通识特征包括所述第三帐号的通识信息的特征表示;
[0013]基于所述特征重构模型对所述通识特征进行编码处理得到重构通识特征;
[0014]对所述重构通识特征进行聚类处理,得到所述第三帐号的聚类结果。
[0015]根据本申请的另一方面,提供了一种资讯推荐方法,所述方法包括:
[0016]获取多个目标应用帐号的应用特征,所述目标应用帐号包括至少一个帐号类型为非活跃类型的第四帐号和至少一个帐号类型为活跃类型的第五帐号,所述应用特征包括所述目标应用帐号的应用信息的特征表示,所述应用信息包括所述目标应用帐号对至少一个应用的安装卸载信息;
[0017]基于特征重构模型对所述应用特征进行编码处理得到重构应用特征,所述特征重构模型是根据上述特征重构模型的训练方法训练得到的;
[0018]对所述重构应用特征进行聚类处理,得到所述目标应用帐号的聚类结果;
[0019]基于所述第五帐号的资讯信息,确定和所述第五帐号属于同一聚类结果的所述第四帐号的资讯推荐信息,所述资讯信息包括所述第五帐号在目标应用中的资讯浏览信息。
[0020]根据本申请的另一方面,提供了一种特征重构模型的训练装置,所述装置包括:
[0021]获取模块,用于获取第一帐号的第一通识特征,以及获取第二帐号的第二通识特征和辅助特征,所述第一通识特征包括所述第一帐号的第一通识信息的特征表示,所述第二通识特征包括所述第二帐号的第二通识信息的特征表示,所述辅助特征包括所述第二帐号的辅助信息的特征表示;所述第一帐号的帐号类型为第一类型,所述第二帐号的帐号类型为第二类型,所述第一类型中的帐号不存在对应的辅助信息;
[0022]编码模块,用于对所述第一通识特征进行编码处理得到第一重构通识特征,对所述第二通识特征进行编码处理得到第二重构通识特征,以及对所述辅助特征进行编码处理得到重构辅助特征;
[0023]预测模块,用于对所述第一重构通识特征和所述第二重构通识特征所属的帐号类型进行预测,得到预测分类结果;
[0024]训练模块,用于根据对比误差和对抗误差对所述特征重构模型进行训练,得到训练后的特征重构模型,所述对比误差包括所述第二重构通识特征和所述重构辅助特征之间的误差,所述对抗误差包括所述预测分类结果和实际分类结果之间的误差,所述实际分类结果是所述第一通识特征和所述第二通识特征实际对应的帐号类型。
[0025]在本申请的一个可选设计中,所述特征重构模型包括对比学习编码器;
[0026]所述编码模块还用于:
[0027]调用所述对比学习编码器对所述第一通识特征进行编码处理得到所述第一重构通识特征,调用所述对比学习编码器对所述第二通识特征进行编码处理得到所述第二重构通识特征,以及调用所述对比学习编码器对所述辅助特征进行编码处理得到所述重构辅助特征。
[0028]在本申请的一个可选设计中,所述特征重构模型还包括通识编码器和辅助编码器;
[0029]所述获取模块还用于:
[0030]获取第一帐号的所述第一通识信息,以及获取第二帐号的所述第二通识信息和所述辅助信息;
[0031]调用所述通识编码器对所述第一通识信息进行编码处理得到所述第一通识特征,
调用所述通识编码器对所述第二通识信息进行编码处理得到所述第二通识特征,调用所述辅助编码器对所述辅助信息进行编码处理得到所述辅助特征。
[0032]在本申请的一个可选设计中,所述第一通识信息和所述第二通识信息为多热编码向量,所述辅助信息为连续值向量。
[0033]在本申请的一个可选设计中,所述特征重构模型还包括通识解码器和辅助解码器;
[0034]所述装置还包括:
[0035]解码模块,用于调用所述通识解码器对所述第一通识特征进行解码处理得到第一重构通识信息,调用所述通识解码器对所述第二通识特征进行解码处理得到第二重构通识信息,调用所述辅助解码器对所述辅助特征进行解码处理得到重构辅助信息;
[0036]所述训练模块还用于:
[0037]根据所述对比误差、所述对抗误差和重构误差对所述特征重构模型进行训练,得到所述训练后的特征重构模型;
[0038]其中,所述重构误差包括:所述第一重构通识信息和所述第一通识信息之间的误差、所述第二重构通识信息和所述第二通识信息之间的误差以及所述重构辅助信息和所述辅助信息之间的误差中的至少之一。
[0039]在本申请的一个可选设计中,所述对比误差、所述对抗误差和所述重构误差中的至少之一包括交叉熵损失。
[0040]在本申请的一个可选设计中,所述特征重构模型包括梯本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种特征重构模型的训练方法,其特征在于,所述方法包括:获取第一帐号的第一通识特征,以及获取第二帐号的第二通识特征和辅助特征,所述第一通识特征包括所述第一帐号的第一通识信息的特征表示,所述第二通识特征包括所述第二帐号的第二通识信息的特征表示,所述辅助特征包括所述第二帐号的辅助信息的特征表示;所述第一帐号的帐号类型为第一类型,所述第二帐号的帐号类型为第二类型,所述第一类型中的帐号不存在对应的辅助信息;对所述第一通识特征进行编码处理得到第一重构通识特征,对所述第二通识特征进行编码处理得到第二重构通识特征,以及对所述辅助特征进行编码处理得到重构辅助特征;对所述第一重构通识特征和所述第二重构通识特征所属的帐号类型进行预测,得到预测分类结果;根据对比误差和对抗误差对所述特征重构模型进行训练,得到训练后的特征重构模型,所述对比误差包括所述第二重构通识特征和所述重构辅助特征之间的误差,所述对抗误差包括所述预测分类结果和实际分类结果之间的误差,所述实际分类结果是所述第一通识特征和所述第二通识特征实际对应的帐号类型。2.根据权利要求1所述的方法,其特征在于,所述特征重构模型包括对比学习编码器;所述对所述第一通识特征进行编码处理得到第一重构通识特征,对所述第二通识特征进行编码处理得到第二重构通识特征,以及对所述辅助特征进行编码处理得到重构辅助特征,包括:调用所述对比学习编码器对所述第一通识特征进行编码处理得到所述第一重构通识特征,调用所述对比学习编码器对所述第二通识特征进行编码处理得到所述第二重构通识特征,以及调用所述对比学习编码器对所述辅助特征进行编码处理得到所述重构辅助特征。3.根据权利要求2所述的方法,其特征在于,所述特征重构模型还包括通识编码器和辅助编码器;所述获取第一帐号的第一通识特征,以及获取第二帐号的第二通识特征和辅助特征,包括:获取第一帐号的所述第一通识信息,以及获取第二帐号的所述第二通识信息和所述辅助信息;调用所述通识编码器对所述第一通识信息进行编码处理得到所述第一通识特征,调用所述通识编码器对所述第二通识信息进行编码处理得到所述第二通识特征,调用所述辅助编码器对所述辅助信息进行编码处理得到所述辅助特征。4.根据权利要求3所述的方法,其特征在于,所述特征重构模型还包括通识解码器和辅助解码器;所述方法还包括:调用所述通识解码器对所述第一通识特征进行解码处理得到第一重构通识信息,调用所述通识解码器对所述第二通识特征进行解码处理得到第二重构通识信息,调用所述辅助解码器对所述辅助特征进行解码处理得到重构辅助信息;所述根据对比误差和对抗误差对所述特征重构模型进行训练,得到训练后的特征重构模型,包括:
根据所述对比误差、所述对抗误差和重构误差对所述特征重构模型进行训练,得到所述训练后的特征重构模型;其中,所述重构误差包括:所述第一重构通识信息和所述第一通识信息之间的误差、所述第二重构通识信息和所述第二通识信息之间的误差以及所述重构辅助信息和所述辅助信息之间的误差中的至少之一。5.根据权利要求1至4任一所述的方法,其特征在于,所述特征重构模型包括梯度反转层和帐号分类器;所述对所述第一重构通识特征和所述第二重构通识特征所属的帐号类型进行预测,得到预测分类结果,包括:调用所述梯度反转层对所述第一重构通识特征和所述第二重构通识特征进行反转处理,得到处理后的第一重构通识特征和处理后的第二重构通识特征;调用所述帐号分类器对所述处理后的第一重构通识特征和所述处理后的第二重构通识特征的帐号类型进行预测,得到所述预测分类结果。6.根据权利要求1所述的方法,其特征在于,所述第一通识信息为第一应用信息,所述第一应用信息包括所述第一帐号对至少一个应用的安装卸载信息,所述第二通识信息为第二应用信息,所述第二应用信息包括所述第二帐号对至少一个应用的安装卸载信息,所述辅助信息为资讯信息,所述资讯信息包括所述第二帐号在目标应用中的资讯浏览信息;所述获取第一帐号的第一通识特征,以及获取第二帐号的第二通识特征和辅助特征,包括:获取所述第一帐号的第一应用特征,以及获取所述第二帐号的第二应用特征和资讯特征,所述第一应用特征包括所述第一帐号的所述第一应用信息的特征表示,所述第二应用特征包括所述第二帐号的所述第二应用信息的特征表示,所述资讯特征包括所述第二帐号的所述资讯信息的特征表示;所述对所述第一通识特征进行编码处理得到第一重构通识特征,对所述第二通识特征进行编码处理得到第二重构通识特征,以及对所述辅助特征进行编码处理得到重构辅助特征,包括:对所述第一应用特征进行编码处理得到第一重构应用特征,对所述第二应用特征进行编码处理得到第二重构应用特征,以及对所述资讯特征进行编码处理得到重构资讯特征...

【专利技术属性】
技术研发人员:白冰
申请(专利权)人:腾讯科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1