对象分类模型的训练、对象分类方法、装置及存储介质制造方法及图纸

技术编号:39249695 阅读:7 留言:0更新日期:2023-10-30 12:01
本申请公开了一种对象分类模型的训练、对象分类方法、装置及存储介质,可以应用于云技术、人工智能、智慧交通、车联网等各种场景,所述方法包括:获取样本对象的样本资源转移特征;对样本资源转移特征进行分类处理,得到非数值型特征和数值型特征;基于类别特征提取网络,对数值型特征进行类别特征提取处理,得到初始数值类别特征;基于预设注意力网络,对初始数值类别特征进行线性处理,以及对线性处理结果进行重缩放处理,得到数值型类别特征;对非数值型特征以及数值型类别特征进行融合处理,得到样本融合特征;基于样本类别预测结果与样本类别标签之间的差异,得到对象分类模型。本申请提高了对象分类模型的准确率和召回率。率。率。

【技术实现步骤摘要】
对象分类模型的训练、对象分类方法、装置及存储介质


[0001]本申请涉及计算机
,尤其涉及一种对象分类模型的训练、对象分类方法、装置及存储介质。

技术介绍

[0002]在支付交易中,对于交易过程中异常对象的识别,主要依赖专家规则、逻辑回归模型。但是在实际业务场景中,商户的历史行为序列是不够平稳的:一方面,商户种类多、支付场景多、支付方式多、交易行为丰富,商户之间的交易规模、交易规律差异大;其次,由于使用的商户历史序列数据周期长跨度大,同一个商户不同时间点交易行为序列波动大;以及,异常交易的发生往往具有突发性。现有的商户序列建模方法通过获取建模样本,对数值型特征做标准化如处理成均值为0方差为1的分布,对类别型特征做Embedding,预测商户的风险评分,将模型评分用于欺诈处理策略评估。或者在数值型特征入模前对特征做了标准化处理如处理成均值为0方差为1的分布,这种方法可以保证数值型特征量纲相同,避免模型参数在优化过程中容易陷入梯度饱和区,加快模型收敛速度,提升模型训练效率,加快模型收敛速度,提升模型稳定性。但是这种训练方法会对模型带来一个负面影响:平稳化后的序列虽然统计量一致了,但是这个过程中也让数据损失了一些个性化的信息,导致不同序列的Attention矩阵趋同,从而导致模型的准确率较低。

技术实现思路

[0003]本申请提供了一种对象分类模型的训练、对象分类方法、装置及存储介质,可以提高模型学习不平稳序列特征的准确率,提高对象分类模型的准确率和召回率。
[0004]一方面,本申请提供了一种对象分类模型的训练方法,所述方法包括:
[0005]获取样本对象的样本资源转移特征;所述样本资源转移特征标注了所述样本对象的样本类别标签;所述样本类别包括正常类别和异常类别;
[0006]基于预设模型的特征分类网络对所述样本资源转移特征进行分类处理,得到非数值型特征和数值型特征;
[0007]基于所述预设模型的类别特征提取网络,对所述数值型特征进行类别特征提取处理,得到初始数值类别特征;
[0008]基于所述预设模型的预设注意力网络,对所述初始数值类别特征进行线性处理,以及对线性处理结果进行重缩放处理,得到数值型类别特征;
[0009]基于所述预设模型的特征融合网络,对所述非数值型特征以及所述数值型类别特征进行特征融合处理,得到样本融合特征;
[0010]基于样本类别预测结果与所述样本类别标签之间的差异,对所述预设模型进行训练,得到对象分类模型;所述样本类别预测结果为基于所述样本融合特征进行类别预测得到的结果。
[0011]另一方面提供了一种对象分类方法,所述方法包括:
[0012]获取待识别对象的目标资源转移特征;
[0013]将所述目标资源转移特征,输入对象分类模型进行对象类别识别处理,得到所述待识别对象的目标类别识别结果;所述目标类别识别结果表征所述待识别对象是否为异常对象,所述对象分类模型为基于上述的训练方法训练得到。
[0014]另一方面提供了一种对象分类模型的训练装置,所述装置包括:
[0015]特征获取模块,用于获取样本对象的样本资源转移特征;所述样本资源转移特征标注了所述样本对象的样本类别标签;所述样本类别包括正常类别和异常类别;
[0016]分类模块,用于基于预设模型的特征分类网络对所述样本资源转移特征进行分类处理,得到非数值型特征和数值型特征;
[0017]初始特征确定模块,用于基于所述预设模型的类别特征提取网络,对所述数值型特征进行类别特征提取处理,得到初始数值类别特征;
[0018]数值型类别特征确定模块,用于基于所述预设模型的预设注意力网络,对所述初始数值类别特征进行线性处理,以及对线性处理结果进行重缩放处理,得到数值型类别特征;
[0019]特征融合模块,用于基于所述预设模型的特征融合网络,对所述非数值型特征以及所述数值型类别特征进行特征融合处理,得到样本融合特征;
[0020]模型训练模块,用于基于样本类别预测结果与所述样本类别标签之间的差异,对所述预设模型进行训练,得到对象分类模型;所述样本类别预测结果为基于所述样本融合特征进行类别预测得到的结果。
[0021]在一示例性实施方式中,所述预设注意力网络包括第一矩阵乘法层、第二矩阵乘法层以及重缩放层,所述数值型类别特征确定模块包括:
[0022]第一处理单元,用于基于所述第一矩阵乘法层,分别对预设查询矩阵以及预设键矩阵进行线性处理,得到预设数值类别特征;所述预设查询矩阵以及所述预设键矩阵基于对所述初始数值类别特征进行线性变换处理得到;
[0023]第二处理单元,用于基于所述重缩放层,对所述预设数值类别特征进行重缩放处理,得到重缩放特征;
[0024]第三处理单元,用于基于所述第二矩阵乘法层,对预设值矩阵进行线性处理,得到第二数值类别特征;所述预设值矩阵基于对所述初始数值类别特征进行线性变换处理得到;
[0025]数值型类别特征确定单元,用于基于所述重缩放特征以及所述第二数值类别特征,确定所述数值型类别特征。
[0026]在一示例性实施方式中,所述重缩放层包括第一全连接层以及第二全连接层,所述第二处理单元包括:
[0027]第一处理子单元,用于基于所述第一全连接层,对所述预设查询矩阵对应的预设数值类别特征进行重缩放处理,得到第一重缩放特征;
[0028]第二处理子单元,用于基于所述第二全连接层,对所述预设键矩阵对应的预设数值类别特征进行重缩放处理,得到第二重缩放特征;
[0029]重缩放特征确定子单元,用于基于所述第一重缩放特征以及所述第二重缩放特征,确定所述重缩放特征。
[0030]在一示例性实施方式中,所述预设注意力网络还包括线性层以及归一化层,所述装置还包括:
[0031]线性变换模块,用于基于所述线性层对所述初始数值类别特征进行线性变换处理,得到所述预设查询矩阵、所述预设键矩阵以及所述预设值矩阵;
[0032]在一示例性实施方式中,所述数值型类别特征确定单元包括:
[0033]归一化处理子单元,用于基于所述归一化层,对所述重缩放特征进行归一化处理,得到归一化特征;
[0034]第一数值特征确定子单元,用于基于所述第二矩阵乘法层,对所述归一化特征进行线性处理,得到第一数值类别特征;
[0035]数值型类别特征确定子单元,用于基于所述第一数值类别特征以及所述第二数值类别特征,确定所述数值型类别特征。
[0036]在一示例性实施方式中,所述类别特征提取网络包括标准化处理网络以及第一全连接神经网络,所述初始特征确定模块包括:
[0037]标准化数值特征确定单元,用于基于所述标准化处理网络,对所述数值型特征进行标准化处理,得到标准化数值特征;
[0038]初始数值类别特征确定单元,用于基于所述第一全连接神经网络,对所述标准化数值特征进行类别特征提取处理,得到所述初始数值类别特征。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对象分类模型的训练方法,其特征在于,所述方法包括:获取样本对象的样本资源转移特征;所述样本资源转移特征标注了所述样本对象的样本类别标签;所述样本类别包括正常类别和异常类别;基于预设模型的特征分类网络对所述样本资源转移特征进行分类处理,得到非数值型特征和数值型特征;基于所述预设模型的类别特征提取网络,对所述数值型特征进行类别特征提取处理,得到初始数值类别特征;基于所述预设模型的预设注意力网络,对所述初始数值类别特征进行线性处理,以及对线性处理结果进行重缩放处理,得到数值型类别特征;基于所述预设模型的特征融合网络,对所述非数值型特征以及所述数值型类别特征进行融合处理,得到样本融合特征;基于样本类别预测结果与所述样本类别标签之间的差异,对所述预设模型进行训练,得到对象分类模型;所述样本类别预测结果为基于所述样本融合特征进行类别预测得到的结果。2.根据权利要求1所述的方法,其特征在于,所述预设注意力网络包括第一矩阵乘法层、第二矩阵乘法层以及重缩放层,所述基于所述预设模型的预设注意力网络,对所述初始数值类别特征进行线性处理,以及对线性处理结果进行重缩放处理,得到数值型类别特征,包括:基于所述第一矩阵乘法层,分别对预设查询矩阵以及预设键矩阵进行线性处理,得到预设数值类别特征;所述预设查询矩阵以及所述预设键矩阵基于对所述初始数值类别特征进行线性变换处理得到;基于所述重缩放层,对所述预设数值类别特征进行重缩放处理,得到重缩放特征;基于所述第二矩阵乘法层,对预设值矩阵进行线性处理,得到第二数值类别特征;所述预设值矩阵基于对所述初始数值类别特征进行线性变换处理得到;基于所述重缩放特征以及所述第二数值类别特征,确定所述数值型类别特征。3.根据权利要求2所述的方法,其特征在于,所述重缩放层包括第一全连接层以及第二全连接层,所述基于所述重缩放层,对所述预设数值类别特征进行重缩放处理,得到重缩放特征,包括:基于所述第一全连接层,对所述预设查询矩阵对应的预设数值类别特征进行重缩放处理,得到第一重缩放特征;基于所述第二全连接层,对所述预设键矩阵对应的预设数值类别特征进行重缩放处理,得到第二重缩放特征;基于所述第一重缩放特征以及所述第二重缩放特征,确定所述重缩放特征。4.根据权利要求2所述的方法,其特征在于,所述预设注意力网络还包括线性层以及归一化层,所述方法还包括:基于所述线性层对所述初始数值类别特征进行线性变换处理,得到所述预设查询矩阵、所述预设键矩阵以及所述预设值矩阵;所述基于所述重缩放特征以及所述第二数值类别特征,确定所述数值型类别特征,包括:
基于所述归一化层,对所述重缩放特征进行归一化处理,得到归一化特征;基于所述第二矩阵乘法层,对所述归一化特征进行线性处理,得到第一数值类别特征;基于所述第一数值类别特征以及所述第二数值类别特征,确定所述数值型类别特征。5.根据权利要求1所述的方法,其特征在于,所述类别特征提取网络包括标准化处理网络以及第一全连接神经网络,所述基于所述预设模型的类别特征提取网络,对所述数值型特征进行类别特征提取处理,得到初始数值类别特征,包括:基于所述标准化处理网络,对所述数值型特征进行标准化处理,得到标准化数值特征;基于所述第一全连接神经网络,对所述标准化数值特征进行类别特征提取处理,得到所述初始数值类别特征。6.根据权利要求5所述的方法,其特征在于,所述预设模型还包括逆标准化处理网络,所述方法还包括:基于所述逆标准化网络对所述数值型类别特征进行逆标准化处理,得到样本数值类别特征;所述基于所述预设模型的特征融合网络,对所述非数值型特征以及所述数值型类别特征进行融合处理,得到样本融合特征,包括:基于所述预设模型的特征融合网络,对所述非数值型特征以及所述样本数值类别特征进行融合处理,得到所述样本融合...

【专利技术属性】
技术研发人员:翁灿栋
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1