训练装置、方法、设备以及计算机可读存储介质制造方法及图纸

技术编号：35328601 阅读：37 留言：0更新日期：2022-10-26 11:44

本公开涉及训练装置、方法、设备以及计算机可读存储介质。该装置包括第一特征获取模块，被配置为基于正样本数据集，利用所述第一循环模型获得第一特征；第二特征获取模块，被配置为基于所述第一特征，利用所述第二循环模型获得第二特征；第三特征获取模块，被配置为基于负样本数据集，利用所述第二循环模型生成第三特征；以及训练模块，被配置为利用第一损失函数和第二损失函数对所述第一模型进行训练以获得目标模型，其中，所述第一损失函数是基于所述第一特征和所述第三特征、或基于所述第二特征和所述第三特征构建的，所述第二损失函数是基于所述第二特征与所述正样本数据集构建的。构建的。构建的。

全部详细技术资料下载

【技术实现步骤摘要】
训练装置、方法、设备以及计算机可读存储介质

[0001]本公开涉及模型训练领域，并且具体涉及一种训练装置方法、设备以及计算机可读存储介质。

技术介绍

[0002]深度神经网络是一种大规模、多参数优化的工具。依靠大量的训练数据，深度神经网络能够通过学习，确定数据中难以总结的隐藏特征，从而完成多项复杂的任务，如人脸检测、图像语义分割、物体检测、动作追踪、自然语言翻译等。
[0003]当前，为了获取用于目标检测的神经网络模型，需要预先使用大量已标注的训练数据对神经网络进行训练。因此，基于深度神经网络的目标检测的性能和效果很大程度依赖所提供的训练数据。通常，所提供的训练数据是正样本训练数据，特别是在循环神经网络(Recurrent Neural Network，RNN)中，很少使用负样本训练数据对神经网络进行训练。

技术实现思路

[0004]鉴于以上问题，本公开提供了一种训练装置方法、设备以及计算机可读存储介质。
[0005]根据本公开的一个方面，提供了一种训练装置，用于训练第一模型，所述第一模型包括第一循环模型和第二循环模型，所述装置包括：第一特征获取模块，被配置为基于正样本数据集，利用所述第一循环模型获得第一特征；第二特征获取模块，被配置为基于所述第一特征，利用所述第二循环模型获得第二特征；第三特征获取模块，被配置为基于负样本数据集，利用所述第二循环模型生成第三特征；以及训练模块，被配置为利用第一损失函数和第二损失函数对所述第一模型进行训练以获得目标模型，其中，所述第一损失函数是基于所述第...

【技术保护点】

【技术特征摘要】
1.一种训练装置，用于训练第一模型，所述第一模型包括第一循环模型和第二循环模型，所述装置包括：第一特征获取模块，被配置为基于正样本数据集，利用所述第一循环模型获得第一特征；第二特征获取模块，被配置为基于所述第一特征，利用所述第二循环模型获得第二特征；第三特征获取模块，被配置为基于负样本数据集，利用所述第二循环模型生成第三特征；以及训练模块，被配置为利用第一损失函数和第二损失函数对所述第一模型进行训练以获得目标模型，其中，所述第一损失函数是基于所述第一特征和所述第三特征、或基于所述第二特征和所述第三特征构建的，所述第二损失函数是基于所述第二特征与所述正样本数据集构建的。2.根据权利要求1所述的训练装置，其中，所述第三特征获取模块还被配置为基于所述正样本数据集和所述负样本数据集，利用所述第二循环模型生成所述第三特征。3.根据权利要求2所述的训练装置，其中，所述训练模块基于分类函数、利用第一损失函数对所述第一模型进行训练，使得所述第一特征远离基于所述负样本数据集的特征，并靠近所述正样本数据集的特征。4.一种训练方法，用于训练第一模型，所述第一模型包括第一循环模型和第二循环模型，所述方法包括：基于正样本数据集，利用所述第一循环模型获得第一特征；基于所述第一特征，利用所述第二循环模型获得第二特征；基于负样本数据集，利用所述第二循环模型生成第三特征；以及利用第一损失函数和第二损失函数对所述第一模型进行训练以获得目标模型，其中，所述第一损失函数是基于所述第一特征和所述第三特征、或基于所述第二特征和所述第三特征构建的，所述第二损失函数是基于所述第二特征与所述正样本数据集构建的。5.根据权利要求4所述的训练方法，其中，所述基于负样本数据集，利用所述第二循环模型生成第三特征还包括：基于所述正样...

【专利技术属性】
技术研发人员：郭垿宏，中村一成，刘巍，李安新，陈岚，藤本拓，吉村建，
申请(专利权)人：株式会社NTT都科摩，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人