当前位置: 首页 > 专利查询>中国人民解放军军事科学院战略评估咨询中心专利>正文

基于动量的数据评估方法、系统及存储介质技术方案

技术编号：34469053 阅读：12 留言：0更新日期：2022-08-10 08:42

本发明专利技术公开了一种基于动量的数据评估方法、系统与存储介质。输入机器学习中常见的流式数据；根据动量的变化来判断数据样本对分类模型的贡献大小，其中动量采用重球动量算法，根据相邻两步迭代去计算动量的变化值；动态的调整原始数据样本，根据所述的动量变化值对数据样本进行评估，设置一个阈值，对当前迭代输入的数据样本与之前数据样本进行加权，形成新的数据样本集；模型根据标签来判断分类是否正确，并输出分类结果。本发明专利技术更加适用于深度学习背景下的算法框架，可以针对数据的冗余性和不平衡性的进行有效评估，针对资源受限条件下的文本、视频、语音等训练样本数据进行有效评估，在数据集不平衡的情况下，动量算法的性能依然可以超越SGD。依然可以超越SGD。依然可以超越SGD。

全部详细技术资料下载

【技术实现步骤摘要】
基于动量的数据评估方法、系统及存储介质

[0001]本专利技术涉及一种数据评估方法和系统，更具体地说，涉及一种基于动量的数据评估方法、评估系统及存储介质。

技术介绍

[0002]数据、模型和训练优化算法是机器学习的三要素。目前，机器学习领域的评估研究主要围绕模型和训练优化算法层面展开，但对数据的评估问题却很少有学者研究。对模型的评估指标有正确率、F1值等；对算法的评估指标有收敛速度、迭代次数、CPU时间以及循环次数等。对于数据评估的研究还很少。
[0003]标准数据质量评估体系主要参考以下指标：完整性、准确性、有效性、时效性、一致性。由于机器学习的发展对数据评估提出了更高的要求，特别是数据的冗余性和不平衡性方面还缺乏有效的评估方法。从机器学习的角度来看，现有的数据评估的技术和系统主要是基于梯度的方法。当前随着深度学习技术的发展，自适应动量优化算法已经成为主流优化方法。基于梯度的评估方法已经不能满足对当前大规模训练样本数据进行有效评估，主要体现在动量变化比梯度变化能够更加准确衡量训练样本数据对目标函数的贡献大小，因此，动量可以看作基于深度学习技术的数据质量评估中的关键性因素。
[0004]当前，深度强化学习已经在围棋、德州扑克、星际争霸、王者荣耀取得成功，究其原因主要是游戏中数据样本众多，可以不计代价的获取数据。现实生活中一些领域的数据并非容易获取，特别是在军事领域，数据具有价值高、数量少等特点，无法不计代价的获取数据，因此在资源受限的条件下如何进行高效学习是亟待解决的重要问题。此外，现实应用中的数据。...

【技术保护点】

【技术特征摘要】
1.一种基于动量的数据评估方法，其特征在于：输入机器学习中常见的流式数据；根据动量的变化来判断数据样本对分类模型的贡献大小，其中动量采用重球动量算法，根据相邻两步迭代去计算动量的变化值；动态的调整原始数据样本，根据所述的动量变化值对数据样本进行评估，设置一个阈值，对当前迭代输入的数据样本与之前数据样本进行加权，形成新的数据样本集；模型根据标签来判断分类是否正确，并输出分类结果。2.根据权利要求1所述的基于动量的数据评估方法，其特征在于：所述的输入流式数据包括文本，图像，语音一种或多种。3.根据权利要求2所述的基于动量的数据评估方法，其特征在于：所述的根据动量的变化来判断数据样本对分类模型的贡献大小，采用通过自适应动量优化算法和在线学习模型进行训练。4.根据权利要求3所述的基于动量的数据评估方法，其特征在于：使用重球动量算法迭代，显示累积的梯度信息。5.根据权利要求1或4所述的基于动量的数据评估方法，其特征在于：步骤1、输入数据样本(文本，图像，语音等流式数据)；步骤2、通过自适应动量优化算法和在线学习模型进行训练，迭代次数t从1到T；使用重球动量算法：w
t+1
＝w
t
‑
αg
t
+β(w
t
‑
w
t
‑1)，其中α是学习率，β代表动量系数，w是优化变量，w
t
指优化算法迭代第t步的优化变量。可以看出M
t+1
＝β(w
t
‑

【专利技术属性】
技术研发人员：陶蔚，彭宝云，范晓宸，陇盛，邹军华，
申请(专利权)人：中国人民解放军军事科学院战略评估咨询中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人