基于元学习的神经网络训练方法及神经网络技术

技术编号：35050035 阅读：11 留言：0更新日期：2022-09-28 10:48

本发明专利技术提供了基于元学习的神经网络训练方法、由该方法训练得到的神经网络以及非瞬时性计算机可读存储介质。该方法包括：提供元模型神经网络；利用少样本训练数据集，通过元学习算法，对所述元模型神经网络进行训练，以得到经过少样本训练的元模型神经网络参数，其中所述少样本训练数据集仅包括已知类别的少样本训练数据；以及利用测试数据集，通过开放集识别方法，对经过训练的元模型神经网络进行优化，其中所述测试数据集既包括已知类别的测试数据，还包括未知类别的测试数据。还包括未知类别的测试数据。还包括未知类别的测试数据。

全部详细技术资料下载

【技术实现步骤摘要】
基于元学习的神经网络训练方法及神经网络

[0001]本申请涉及人工智能领域，具体涉及基于元学习的神经网络训练方法、由该方法训练得到的神经网络以及非瞬时性计算机可读存储介质。

技术介绍

[0002]少样本学习是实际应用机器学习算法时会遇到的问题。少样本学习主要解决当某一类别图像在训练时标注数据很少的情况下，如何训练模型区分出这一类图像的问题。针对少样本学习，现有的常用方法包括原型网络、关系网络和匹配网络。
[0003]开放集识别也是实际应用机器学习算法时会遇到的问题。开放集识别主要解决在模型部署时，遇到不在训练类别的输入时，如何区分出来这些图像的问题。针对开放集识别，现有的常用方法包括OpenMax和Counterfactual。
[0004]目前，现有技术中还没有技术方案能够在一个统一框架下解决这两个问题。也就是说，现有技术没有直接针对少样本和开放集两类设定同时出现的场景。由于之前针对少样本学习的方法无法处理开放集识别的问题，所以只能混合使用现有的少样本学习和开放集识别的方法处理这种新的场景。训练得到的模型在分类精度，以及开放集样本检测这两个指标上表现都不高。

技术实现思路

[0005]基于此，本专利技术提供了一种基于元学习的神经网络训练方法，其包括：
[0006]S101：提供元模型神经网络；
[0007]S102：利用少样本训练数据集，通过元学习算法，对所述元模型神经网络进行训练，以得到经过少样本训练的元模型神经网络参数，其中所述少样本训练数据集仅包括已知类别的少样...

【技术保护点】

【技术特征摘要】
1.一种基于元学习的神经网络训练方法，包括：S101：提供元模型神经网络；S102：利用少样本训练数据集，通过元学习算法，对所述元模型神经网络进行训练，以得到经过少样本训练的元模型神经网络参数，其中所述少样本训练数据集仅包括已知类别的少样本训练数据；以及S103：利用测试数据集，通过开放集识别方法，对经过训练的元模型神经网络进行优化，其中所述测试数据集既包括已知类别的测试数据，还包括未知类别的测试数据。2.如权利要求1所述的神经网络训练方法，还包括：重复执行步骤S102和S103，以得到多次迭代训练优化的元模型神经网络。3.如权利要求1所述的神经网络训练方法，其中步骤S103包括：将所述测试数据集中的测试数据输入经过训练的元模型神经网络，以得到所述测试数据的分类结果；根据分类结果，计算所述测试数据的损失函数；以及基于所述损失函数，对所述元模型神经网络的参数进行优化。4.如权利要求3所述的神经网络训练方法，其中根据分类结果，计算所述测试数据的损失函数包括：计算所述已知类别的测试数据在所述已知类别上的交叉熵作为第一损失函数；以及计算所述未知类别的测试数据在所...

【专利技术属性】
技术研发人员：李皓翔，刘博，康昊，华刚，
申请(专利权)人：虫极科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人