【技术实现步骤摘要】
训练行为意图识别模型的方法、行为意图识别方法及装置
[0001]本说明书一个或多个实施例涉及机器学习
,尤其涉及一种训练行为意图识别模型的方法、行为意图识别方法及装置。
技术介绍
[0002]随着互联网技术的迅猛发展,人们越来越多地利用互联网进行通信、学习、工作,甚至通过互联网进行交易、支付、转账、投资等行为。这些行为可能存在一定的风险,对网络行为的安全性带来了威胁,因此对于行为意图的识别就非常重要。对行为意图进行识别能够为后续风险识别提供参考依据和分析基础。
[0003]传统的行为意图识别模型采用的是一种多分类模型,将行为特征映射到具体的意图类别上。然而在很多场景中,常常会涉及到诸如二层级类别、三层级类别等多层级类别的分类任务。假设最下层类别为个,行为意图识别模型采用的是一个多分类模型将用户行为特征映射至个行为意图类别上,采用诸如softmax函数作为输出层的激活函数。目前在模型训练过程中使用交叉熵损失函数以最小化行为意图识别模型输出的意图类别与对应标签之间的差异。但这种方式得到的行为意图识别模型的识别准确度 ...
【技术保护点】
【技术特征摘要】
1.一种训练行为意图识别模型的方法,其特征在于,所述方法包括:获取包括多个训练样本的训练数据,所述训练样本包括行为样本以及所述行为样本被标注的类别标签,所述类别标签为多层级行为意图类别中的最下层类别的标签;利用所述训练数据训练多分类模型和附加模型;其中,将所述行为样本输入所述多分类模型,由所述多分类模型输出所述行为样本在所述多层级行为意图类别中各最下层类别上的第一概率;所述附加模型利用所述行为样本在所述各最下层类别上的第一概率,确定所述行为样本在所述多层级行为意图类别中第N层类别上的分配权重,所述第N层类别为非最下层类别,所述N为预设的正整数,利用所述行为样本在所述第N层类别上的分配权重以及所述行为样本在所述各最下层类别上的第一概率,确定所述行为样本在所述各最下层类别上的第二概率;所述训练的目标包括:最小化依据所述第二概率得到的所述行为样本所属的最下层类别与所述行为样本内标注的类别标签之间的差异;训练结束后,利用所述多分类模型得到行为意图识别模型。2.根据权利要求1所述的方法,其特征在于,利用所述行为样本在所述各最下层类别上的第一概率,确定所述行为样本在所述多层级行为意图类别中第N层类别上的分配权重包括:分别对各第N层类别下所述行为样本在最下层类别上的第一概率进行池化处理,得到各第N层类别对应的池化结果;利用各第N层类别对应的池化结果进行映射处理,得到所述行为样本在各第N层类别上的分配权重。3.根据权利要求2所述的方法,其特征在于,所述利用各第N层类别对应的池化结果进行映射处理,得到所述行为样本在各第N层类别上的分配权重包括:将所述各第N层类别对应的池化结果进行拼接,将拼接得到的结果进行softmax处理得到所述行为样本在各第N层类别上的分配权重。4.根据权利要求1所述的方法,其特征在于,利用所述行为样本在所述第N层类别上的分配权重以及所述行为样本在所述各最下层类别上的第一概率,确定所述行为样本在所述各最下层类别上的第二概率包括:将所述行为样本在最下层类别上的第一概率乘以所述行为样本在该最下层类别所属第N层类别上的分配权重,得到所述行为样本在该最下层类别上的第二概率。5.根据权利要求1所述的方法,其特征在于,所述训练还包括:在每一轮迭代中利用交叉熵损失函数的取值,更新所述多分类模型和附加模型的模型参数,直至满足预设的训练结束条件,所述交叉熵损失函数是利用所述训练的目标构造的。6.根据权利要求1至5中任一项...
【专利技术属性】
技术研发人员:陆奕强,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。