一种基于梯度方向一致性动态动量反馈的元学习优化方法技术

技术编号：46600578 阅读：1 留言：0更新日期：2025-10-10 21:32

本申请涉及一种基于梯度方向一致性动态动量反馈的元学习优化方法，该方法将获取金融领域的各历史欺诈任务分别分成元学习的元训练任务、元验证任务，构建元学习框架；提取历史欺诈任务的元梯度方向，构建元动量向量，并基于元学习框架中外循环计算的元梯度更新元动量向量；提取出新型欺诈任务的实时元梯度方向以及第一元验证损失，基于实时元梯度方向以及第一元验证损失对新型欺诈任务进行双重验证，通过验证后，对元动量向量、元学习框架中输出层的参数进行二次更新；基于更新的实时元梯度方向以及第一元验证损失判断元学习框架的更新是否满足回滚条件，是，触发回滚机制；否，基于更新后的元学习框架对通过验证的新型欺诈任务进行欺诈评分。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及元学习优化，特别是涉及一种基于梯度方向一致性动态动量反馈的元学习优化方法。

技术介绍

1、在小样本金融反欺诈领域中采用元学习方法存在以下问题：

2、1、传统元学习方法内循环梯度更新的方向性冲突问题：一般在元学习的内循环会用固定学习率或动量系数，导致不同小样本欺诈任务间梯度方向存在显著差异，进而引发参数更新震荡。

3、2、不同欺诈任务间因数据特征差异导致的模型泛化能力不足：不同金融欺诈任务的数据分布差异导致模型泛化能力受限，传统方法的固定动量参数无法适配特征空间跨度较大的场景，易使模型在某些欺诈任务中陷入局部最优。

4、3、动态欺诈模式下的元知识增量优化迟滞：固定学习率与动量参数难以应对金融欺诈行为的快速演化，当新欺诈模式的关键特征尚未被充分学习时，传统方法因缺乏参数更新强度的动态调节能力，导致模型无法及时收敛至新特征空间。

技术实现思路

1、基于此，有必要提供一种基于梯度方向一致性动态动量反馈的元学习优化方法，包括：

2、s1：将获...

【技术保护点】

1.一种基于梯度方向一致性动态动量反馈的元学习优化方法，其特征在于，包括：

2.根据权利要求1所述的基于梯度方向一致性动态动量反馈的元学习优化方法，其特征在于，对元学习框架进行轻量化处理包括：

3.根据权利要求1所述的基于梯度方向一致性动态动量反馈的元学习优化方法，其特征在于，内外循环分离机制包括：

4.根据权利要求3所述的基于梯度方向一致性动态动量反馈的元学习优化方法，其特征在于，构建元动量向量的过程包括：

5.根据权利要求1所述的基于梯度方向一致性动态动量反馈的元学习优化方法，其特征在于，得到初步更新的元动量向量的过程包括：

...

【技术特征摘要】

1.一种基于梯度方向一致性动态动量反馈的元学习优化方法，其特征在于，包括：

2.根据权利要求1所述的基于梯度方向一致性动态动量反馈的元学习优化方法，其特征在于，对元学习框架进行轻量化处理包括：

3.根据权利要求1所述的基于梯度方向一致性动态动量反馈的元学习优化方法，其特征在于，内外循环分离机制包括：

4.根据权利要求3所述的基于梯度方向一致性动态动量反馈的元学习优化方法，其特征在于，构建元动量向量的过程包括：

5.根据权利要求1所述的基于梯度方向一致性动态动量反馈的元学习优化方法，其特征在于，得到初步更新的元动量向量的过程包括：

6.根据权利要求1所述的基于梯度方向一致性动态动量反馈的元学习优...

【专利技术属性】
技术研发人员：徐雪松，李昊东，霍杨杰，易自牧，曾伟豪，
申请(专利权)人：湖南工商大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人