一种基于样本模式增广的机器学习模型训练方法及系统技术方案

技术编号：39040816 阅读：14 留言：0更新日期：2023-10-10 11:53

本说明书实施例公开了一种基于样本模式增广的机器学习模型训练方法及系统，涉及人工智能技术领域，技术要点包括：利用真实样本以及增广样本对目标模型进行一轮以上迭代训练；其中的一轮迭代训练包括：通过目标模型分别处理真实样本和增广样本的特征值，得到对应的第一输出；通过滑动平均模型至少处理增广样本的特征值，得到对应的第二输出；其中，滑动平均模型的模型参数基于两轮以上历史迭代训练中的目标模型的模型参数获得；调整目标模型的模型参数，以减小真实样本对应的第一输出与对应标签之间的差异，同时减小增广样本对应的第一输出与第二输出之间的差异。出与第二输出之间的差异。出与第二输出之间的差异。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于样本模式增广的机器学习模型训练方法及系统

[0001]本专利技术涉及人工智能
，特别涉及一种基于样本模式增广的机器学习模型训练方法和系统。

技术介绍

[0002]在机器学习模型训练过程中，可能存在训练样本不足或样本模式单一，训练出来的模型效果不理想的问题。本说明书一些实施例旨在提供一种基于样本模式增广的模型训练方法及系统，以获取增广样本作为真实样本的补充，联合真实样本和增广样本训练机器学习模型，让模型能够“见到”更为充足、全面的样本，从而提高模型的稳定性。

技术实现思路

[0003]本说明书实施例之一提供一种基于样本模式增广的机器学习模型训练方法，包括利用真实样本以及增广样本对目标模型进行一轮以上迭代训练；真实样本包括特征值及标签，增广样本不具有标签且其特征值对照所述真实样本的特征值获取以具备与真实样本不同的模式；其中，一轮迭代训练包括：通过目标模型分别处理真实样本和增广样本的特征值，得到对应的第一输出；通过滑动平均模型至少处理增广样本的特征值，得到对应的第二输出；其中，滑动平均模型的模型参数基于两轮以上历史迭代训练中的目标模型的模型参数获得；调整目标模型的模型参数，以减小真实样本对应的第一输出与对应标签之间的差异，同时减小增广样本对应的第一输出与第二输出之间的差异。
[0004]本说明书实施例之一提供一种基于样本模式增广的机器学习模型训练系统，用于利用真实样本以及增广样本对目标模型进行一轮以上迭代训练；真实样本包括特征值及标签，增广样本的特征值对照所述真实样本的特征值获取以具备...

【技术保护点】

【技术特征摘要】
1.一种基于样本模式增广的机器学习模型训练方法，包括利用真实样本以及增广样本对目标模型进行一轮以上迭代训练；真实样本包括特征值及标签，增广样本不具有标签且其特征值对照所述真实样本的特征值获取以具备与真实样本不同的模式；其中，一轮迭代训练包括：通过目标模型分别处理真实样本和增广样本的特征值，得到对应的第一输出；通过滑动平均模型至少处理增广样本的特征值，得到对应的第二输出；其中，滑动平均模型的模型参数基于两轮以上历史迭代训练中的目标模型的模型参数获得；调整目标模型的模型参数，以减小真实样本对应的第一输出与对应标签之间的差异，同时减小增广样本对应的第一输出与第二输出之间的差异。2.如权利要求1所述的方法，所述增广样本的特征值基于对真实样本的特征值进行变换得到，或者来自其他场景的真实样本；增广样本的特征值具备与真实样本不同的模式，包括增广样本的至少一个特征的特征值不同于真实样本的相应特征值。3.如权利要求1所述的方法，所述一轮迭代训练中的滑动平均模型的模型参数基于前一轮迭代训练中的滑动平滑模型的模型参数以及更新后的目标模型的模型参数运算获得；当所述一轮迭代训练为第二轮迭代训练时，所述前一轮迭代训练中的滑动平滑模型的模型参数为目标模型的初始模型参数。4.如权利要求1所述的方法，所述目标模型为因果效应评估模型，所述真实样本包括测试组中的第一真实样本和对照组中的第二真实样本，所述增广样本包括测试组中的第一增广样本和/或对照组中的第二增广样本。5.如权利要求4所述的方法，其中，测试组中的第一增广样本的特征值来自对照组中的第二真实样本，对照组中的第二增广样本的特征值来自测试组中的第一真实样本。6.如权利要求4所述的方法，所述一轮迭代训练还包括：通过目标模型处理真实样本的特征值，得到对应的中间结果；通过协同分类模型分别处理各中间结果，得到对应的分类输出；所述分类输出反映对应的中间结果属于测试组的概率和/或属于对照组的概率；调整所述目标模型的模型参数，以同时均衡中间结果属于测试组的概率和属于对照组的概率。7.如权利要求6所述的方法，其中，调整所述目标模型的模型参数，以均衡中间结果属于测试组的概率和属于对照组的概率，包括：基于分类输出确定测试组的典型中间结果，以及对照组的典型中间结果；当分类输出反映对应的中间结果属于测试组的概率大到...

【专利技术属性】
技术研发人员：韩彬，张雅淋，李龙飞，周俊，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人