用于优化地训练机器学习算法的方法和系统技术方案

技术编号：44203403 阅读：26 留言：0更新日期：2025-02-06 18:38

本申请涉及一种用于优化地训练机器学习算法的方法，该方法具有以下步骤：提供具有针对至少一个领域的领域参数和/或领域值的领域模型；提供具有训练数据集的数据模型，所述训练数据集具有针对至少一个领域的训练数据；根据至少一个领域参数和/或领域值从训练数据集中去除和/或隐藏和/或改变至少一个训练数据以提供缩减的训练数据集；基于缩减的训练数据集训练神经网络，以根据缩减的数据集确定模型性能；将所确定的模型性能与分配给训练数据集的模型性能进行比较并且根据缩减的数据集确定模型性能偏差；根据模型性能偏差从训练数据集中选择训练数据；基于所选择的训练数据来训练机器学习算法；以及提供经过训练的机器学习算法。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及用于优化地训练机器学习算法的方法和系统。本专利技术还涉及具有程序代码的计算机程序和具有计算机程序的程序代码的计算机可读数据载体。

技术介绍

1、本体形式的领域模型是特定知识范围的结构化的语义映射。在机器学习模型的范围中，这种领域模型的开发对于提高模型的理解和解释起着至关重要的作用。领域模型还可以实现专家、开发人员和应用人员之间的有效沟通。

2、以机器学习模型的本体的形式构建领域模型通常是一个迭代过程，该过程需要对相关知识进行系统采集和分类。首先，识别该领域中相关的不同概念和实体，例如数据源、模型、算法、度量和评估方法。在此基础上定义概念之间的关系，以采集概念的依赖性和关联。在此情况下，可以将分类、聚合、关联和层次结构用于设计本体的结构。概念的属性和特性的定义使得能够对各个元素进行详细的描述和表征。例如，这些属性可以包含关于机器学习模型的参数、特性或应用范围的信息。

3、为了验证和改进本体，优选让专家和从业者参与。他们的专业知识和经验有助于确保模型的完整性和正确性。使用现有的本体和标准也有助于保证一致

【技术保护点】

1.一种用于优化地训练机器学习算法的方法，该方法包括以下步骤：

2.根据权利要求1所述的方法，其中针对所述至少一个领域的训练数据均根据领域参数和/或领域值的至少一种组合来标识。

3.根据权利要求1或2所述的方法，其中所述数据模型的训练数据集具有至少一个预测领域标识符。

4.根据前述权利要求中任一项所述的方法，其中根据至少一个领域参数和/或领域值从所述训练数据集中去除和/或隐藏和/或改变(S3)至少一个训练数据是连续地和/或迭代地通过变动所述至少一个领域参数和/或领域值来进行的。

5.根据权利要求4所述的方法，其中训练相应的神经网络，确定相应...

【技术特征摘要】

1.一种用于优化地训练机器学习算法的方法，该方法包括以下步骤：

2.根据权利要求1所述的方法，其中针对所述至少一个领域的训练数据均根据领域参数和/或领域值的至少一种组合来标识。

3.根据权利要求1或2所述的方法，其中所述数据模型的训练数据集具有至少一个预测领域标识符。

4.根据前述权利要求中任一项所述的方法，其中根据至少一个领域参数和/或领域值从所述训练数据集中去除和/或隐藏和/或改变(s3)至少一个训练数据是连续地和/或迭代地通过变动所述至少一个领域参数和/或领域值来进行的。

5.根据权利要求4所述的方法，其中训练相应的神经网络，确定相应的模型性能以及比较模型性能是针对以这种方式连续地和/或迭代地缩减的每个训练数据集来进行的，以便以这种方式从所述训练数据集中选择子集，基于该子集来训练所述机器学习算法。

6.根据权利要求5所述的方法，其中来自所述训练数据集的子集具有其领域参数组合和/或领域值组合导致低于特定极限值的性能偏差的训练数据。

7.根据前述权利要求中任一项所述的方法，其中根据至少一个领域参数和/或领域值从所述训练数据集中去除和/或隐藏和/或改变(s3)至少一个训练数据包括：特别是连续地隐藏分配给特定的领域参数组合和/或领域值组合的训练数据，并且基于此特别是连续地确定所述模型性能偏差，以及特别是连续地与至少一个极限值进行比较。

8.根...

【专利技术属性】
技术研发人员：C·海因策曼，C·格拉迪施，M·赫尔曼，M·沃尔勒，
申请(专利权)人：罗伯特·博世有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人