【技术实现步骤摘要】
【国外来华专利技术】使用加权训练数据的机器学习模型的多阶段训练技术
[0001]本公开概括而言涉及用于训练机器学习模型的改进技术,更具体而言,根据各种实施例,涉及在至少一个阶段中使用加权训练数据来训练机器学习模型的多阶段训练技术。
技术介绍
[0002]服务器系统利用各种技术来检测其系统和其提供的服务的风险。许多风险检测问题可以被表征为“分类问题”,其中基于观察的特征来将该观察分类为多个类别中的一个。作为一个非限制性示例,“垃圾邮件”(不想要的电子邮件)检测的问题可以被认为是一个二元分类问题,对于这个问题,分类模型可以被用来生成概率值,指示入站的电子邮件应当被分类为“垃圾邮件”(或者“非垃圾邮件”)的可能性。
[0003]用于生成分类模型的一种技术是在先前观察(例如,在当前示例中,是电子邮件)的训练数据集上训练人工神经网络,这样,一旦经过训练,该模型就能够对新的观察进行分类。例如,现有的训练技术在“全局”上优化分类模型,使得模型的准确性在预测概率值的整个分布中是相对一致的。然而,这种训练技术存在各种技术缺陷。例如,如下文更详细描述的,现有的训练技术可能会限制模型对新的观察进行准确分类的能力,从而降低了分类模型的性能。
附图说明
[0004]图1的框图图示了根据一些实施例的可操作来使用多阶段训练操作对分类模型进行训练的示例训练模块。
[0005]图2的框图图示了根据一些实施例的包括示例训练模块和加权值生成器的计算机系统。
[0006]图3的框图图示了根据一些实施例的在第二训练阶段期间执行各种操作的示 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:计算机系统在第一训练阶段中基于训练数据集训练机器学习分类模型的初始版本,其中,在所述第一训练阶段期间,同等权重被应用到所述训练数据集中的多个训练样本;利用所述机器学习分类模型的初始版本,所述计算机系统生成与所述训练数据集中的所述多个训练样本相对应的多个模型得分,其中,对于所述多个训练样本中的给定训练样本,来自所述机器学习分类模型的初始版本的相应给定模型得分指示出所述给定训练样本属于多个类别中的特定类别的概率;由所述计算机系统基于所述多个模型得分执行一个或多个变换,以为所述多个训练样本生成相应的多个加权值;并且所述计算机系统生成所述机器学习分类模型的更新版本,包括所述计算机系统在第二训练阶段期间,基于所述训练数据集对所述机器学习分类模型执行额外的训练,以生成所述机器学习分类模型的更新版本,其中,在所述第二训练阶段期间,所述多个训练样本被使用所述相应的多个加权值来加权。2.如权利要求1所述的方法,其中,所述相应的多个加权值的生成使得具有第一模型得分的第一训练样本被赋予比具有较低的第二模型得分的第二训练样本更高的加权值。3.如权利要求1所述的方法,其中,所述执行额外的训练包括:应用优化算法来修改所述机器学习分类模型的一个或多个参数,其中所述优化算法使用特定损失函数来为所述多个训练样本中的给定训练样本评估所述机器学习分类模型的性能,并且其中,对于所述给定训练样本,利用所述特定损失函数生成的相应损失值被基于与所述给定训练样本相关联的给定加权值来加权。4.如权利要求3所述的方法,其中,所述特定损失函数包括二元交叉熵损失函数。5.如权利要求1所述的方法,其中,所述第一训练阶段使用第一学习率来训练所述机器学习分类模型的初始版本,并且其中,所述第二训练阶段使用较低的第二学习率来训练所述机器学习分类模型的更新版本。6.如权利要求1所述的方法,其中,对于所述多个训练样本中的具有第一相应模型得分的第一训练样本,所述执行一个或多个变换包括:对所述第一相应模型得分执行对数函数以生成第一对数值;基于以下项来正规化所述第一对数值:基于所述多个模型得分生成的多个对数值中的最高对数值;以及基于所述多个模型得分生成的多个对数值中的最低对数值;并且基于正规化的第一对数值为所述第一训练样本生成第一加权值。7.如权利要求1所述的方法,其中,所述机器学习分类模型是使用人工神经网络(ANN)实现的。8.如权利要求1所述的方法,其中,所述机器学习分类模型是二元分类模型。9.如权利要求1所述的方法,其中,所述多个训练样本对应于多个先前电子交易,并且其中,与所述多个先前电子交易中的第一先前电子交易相对应的第一训练样本指示出:与所述第一先前电子交易相关联的一个或多个属性;以及将所述第一先前电子交易分类到多个类别中的一个类别中的标签。10.如权利要求9所述的方法,还包括:
由所述计算机系统接收与第二电子交易相对应的授权请求,其中所述授权请求指定与所述第二电子交易相关联的一个或多个属性;由所述计算机系统将对应于与所述第二电子交易相关联的一个或多个属性的信息作为输入应用到所述机器学习分类模型的更新版本,以为所述第二电子交易生成预测分类;并且由所述计算机系统基于所述预测分类来确定是否授权所述第二电子交易。11.一种非暂态计算机可读介质,其上存储有可由计算机系统执行来执行操作的指令,所述操作包括:执行第一训练阶段以生成机器学习分类模型的初始版本,其中,在所述第一训练阶段期间,同等加权被应用到训练数据集中的多个训练样本;为所述多个训练样本生成相应的多个加权值,其中,对于所述多个训练样本中的给定训练样本,生成相应加权值包括:利用所述机器学习分类模型的初始版本为所述给定训练样本生成模型得分;并且基于所述模型得分为所述给定训练样本生成所述相应加权值;并且基于所述训练数据集,执行第二训练阶段以生成所述机器学习分类模型的更新版本,包括通过以下操作来生成:使用所述机器学习分类模型的初始版本的一个或多个参数的值,作为所述机器学习分类模型的更新版本的一个或多个参数的初始值;并且应用优化算法来修改所述机器学习分类模型的更新版本的一个或多个参数的初始值;其中,在所述第二训练阶段期间,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。