建立表征提取模型、表征提取、类型识别的方法和装置制造方法及图纸

技术编号:32111211 阅读:28 留言:0更新日期:2022-01-29 18:54
本说明书实施例提供了一种建立表征提取模型、表征提取、类型识别的方法和装置。根据该实施例的方法,首先获取包含一个以上样本对的第一训练数据,样本对包括正样本对和负样本对;然后利用第一训练数据训练第一表征提取模型和第二表征提取模型,其中第一表征提取模型用以利用用户的终端侧特征提取用户的终端侧表征向量,第二表征提取模型用以利用用户的服务器侧特征提取用户的服务器侧表征向量;训练目标为最大化正样本对的终端侧表征向量与服务器侧表征向量之间的相似度且最小化负样本对的终端侧表征向量与服务器侧表征向量之间的相似度;再将训练得到的第一表征提取模型部署于终端设备。署于终端设备。署于终端设备。

【技术实现步骤摘要】
建立表征提取模型、表征提取、类型识别的方法和装置


[0001]本说明书一个或多个实施例涉及人工智能
,尤其涉及建立表征提取模型、表征提取、类型识别的方法和装置。

技术介绍

[0002]近年来随着智能手机的快速发展,推动了终端设备和边缘计算的发展。这就意味着许多任务可以放在终端设备上进行,无需交由云端处理。这种方式具有减轻云端负荷、响应用户更快以及保护用户隐私等优点。虽然终端设备上采集并保留了大量特征数据,但人工智能的原理决定了需要在终端设备上部署能够提取表征向量的模型,用以在终端设备上实现具体的任务。

技术实现思路

[0003]有鉴于此,本说明书一个或多个实施例描述了一种建立表征提取模型、表征提取、类型识别的方法和装置。
[0004]根据第一方面,提供了一种建立表征提取模型的方法,该方法包括:获取包含一个以上样本对的第一训练数据,所述样本对包括正样本对和负样本对,所述正样本对包括同一用户的终端侧特征和服务器侧特征,所述负样本对包括不同用户的终端侧特征和服务器侧特征;利用所述第一训练数据训练第一表征提取模型和第二表征本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.建立表征提取模型的方法,包括:获取包含一个以上样本对的第一训练数据,所述样本对包括正样本对和负样本对,所述正样本对包括同一用户的终端侧特征和服务器侧特征,所述负样本对包括不同用户的终端侧特征和服务器侧特征;利用所述第一训练数据训练第一表征提取模型和第二表征提取模型,其中所述第一表征提取模型用以利用用户的终端侧特征提取用户的终端侧表征向量,所述第二表征提取模型用以利用用户的服务器侧特征提取用户的服务器侧表征向量;训练目标为最大化正样本对中的终端侧表征向量与服务器侧表征向量之间的相似度且最小化负样本对中的终端侧表征向量与服务器侧表征向量之间的相似度;将训练得到的第一表征提取模型部署于终端设备。2.根据权利要求1所述的方法,其中,所述终端侧特征包括用户在终端设备上的行为特征序列和终端设备的状态特征序列中的至少一种;和/或所述服务器侧特征包括服务器侧收集的用户的属性特征和行为统计特征中的至少一种。3.根据权利要求1所述的方法,其中,所述第一表征提取模型包括循环神经网络RNN、长短期记忆网络LSTM或门控循环单元GRU;和/或所述第二表征提取模型包括多层感知器MLP、卷积神经网络CNN或残差网络ResNet。4.根据权利要求1所述的方法,其中,所述将训练得到的第一表征提取模型部署于终端设备包括:获取包括一个以上标注样本的第二训练数据,所述标注样本包括用户的终端侧特征以及标注的类型标签;利用所述第二训练数据训练包括所述训练得到的第一表征提取模型和线性回归模型的识别模型;其中,所述第一表征提取模型用以利用用户的终端侧特征提取用户的终端侧表征向量,所述线性回归模型用以利用用户的终端侧表征向量预测类型标签,训练目标为最小化预测结果与标注样本中类型标签的差异;将所述识别模型部署于终端设备。5.根据权利要求4所述的方法,其中,在训练所述识别模型的过程中,保持第一表征提取模型的模型参数不变,仅更新所述线性回归模型的参数。6.根据权利要求4所述的方法,其中,所述终端侧特征包括用户浏览的页面特征序列;和/或所述服务器侧特征包括用户的属性特征和交易统计特征;和/或所述类型标签包括风险类型标签、是否具有特定类型风险的标签或特定类型风险的风险等级。7.表征提取方法,由终端设备执行,包括:获取用户的终端侧特征;将所述用户的终端侧特征输入第一表征提取模型,得到所述用户的终端侧表征向量;其中所述第一表征提取模型是采用如权利要求1至3中任一项所述的方法预先建立的。8.类型识别的方法,由终端设备执行,包括:获取用户的终端侧特征;
将所述用户的终端侧特征输入识别模型,得到所述识别模型预测的类型标签,其中所述识别模型是...

【专利技术属性】
技术研发人员:吕乐周璟刘佳范东云傅幸王宁涛杨阳
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1