一种基于自动示例选择的端到端多示例学习方法技术

技术编号：26971996 阅读：24 留言：0更新日期：2021-01-06 00:03

本发明专利技术公开了一种基于自动示例选择的端到端多示例学习方法，包括以下具体步骤：（一）、对多示例数据进行采集，并将数据分成若干个多示例数据包，多示例数据包包括若干个示例，且多示例数据包设置为由若干个示例组合成的一组示例集合，多示例数据包上具有标签，示例设置为一个多维向量；（二）、搭建深度多示例网络，深度多示例网络包括示例处理层、示例选择层和分类层；（三）、每个多示例数据包通过深度多示例网络进行处理，通过前向或反向传播进行训练，训练包括深度多示例网络训练和深度多示例网络测试，相比现有技术，本发明专利技术可以通过示例选择层自动地选择重要的示例，一方面使得整个深度网络的优化过程可以端到端地进行训练。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于自动示例选择的端到端多示例学习方法
本专利技术涉及使用深度网络处理多示例数据的机器学习
，具体涉及一种基于自动示例选择的端到端多示例学习方法。
技术介绍
传统机器学习技术经常假设样本和标签是一一对应的，比如：在文档分类任务中，一篇文档对应一个具体类别；在图像识别任务中，每张图片对应一个标签；在风机故障检测任务中，一个风机的一段时间内的采样信号具有同一个标签。然而，在实际任务中，文档包含很多句子，句子中又有很多短语，不同的句子可能描述的事物涉及了多个方面，只有某些核心句子所描述的事物才决定了该文档所属于的类别；每张图像可以包含多个物体，只有主要的物体才会被标注；风机的故障模式只会在某段时域或者频域范围内才出现。将一篇文档、一张图像、一段时序信号看做一组示例的集合，即多示例包，同时将文档中的多个句子、图像中的多个图像块、时序信号多个时域或者频域范围当做示例，使用多示例学习技术可以有效解决标记粒度的问题。多示例学习假设，多示例包中有一些重要示例决定了该示例包的类别，因此如何去自动选择出重要示例则是非常关键的技术。如何在深度网络中端到端地选择重要示例是一项难以实现的技术，主要是因为“示例选择”的过程是不可计算导数的，而深度网络的训练则主要是通过梯度传播进行优化的。因此，本专利技术赋予深度多示例网络“自动选择示例”的能力，使得整个优化过程可以端到端地进行。
技术实现思路
为解决现有技术的不足，本专利技术的目的在于提供一种既可以处理一组示例对应单个标签的场景，还可以在深度网络中有效实现示...

【技术保护点】
1.一种基于自动示例选择的端到端多示例学习方法，其特征在于，包括以下具体步骤：（一）、对多示例数据进行采集，并将数据分成若干个多示例数据包，所述多示例数据包包括若干个示例，且多示例数据包设置为由若干个示例组合成的一组示例集合，所述多示例数据包上具有标签，所述示例设置为一个多维向量；（二）、搭建深度多示例网络，所述深度多示例网络包括示例处理层、示例选择层和分类层；（三）、每个多示例数据包通过深度多示例网络进行处理，通过前向或反向传播进行训练，所述训练包括深度多示例网络训练和深度多示例网络测试。/n

【技术特征摘要】
1.一种基于自动示例选择的端到端多示例学习方法，其特征在于，包括以下具体步骤：（一）、对多示例数据进行采集，并将数据分成若干个多示例数据包，所述多示例数据包包括若干个示例，且多示例数据包设置为由若干个示例组合成的一组示例集合，所述多示例数据包上具有标签，所述示例设置为一个多维向量；（二）、搭建深度多示例网络，所述深度多示例网络包括示例处理层、示例选择层和分类层；（三）、每个多示例数据包通过深度多示例网络进行处理，通过前向或反向传播进行训练，所述训练包括深度多示例网络训练和深度多示例网络测试。

2.根据权利要求1所述的一种基于自动示例选择的端到端多示例学习方法，其特征在于，所述步骤（一）中，多示例数据采集包括以下具体步骤：
100、确定示例和多示例数据包在具体任务中指代的目标；
101、将任务中具体数据构造为多示例数据包；
102、为多示例数据包赋予标签；
103、将数据组织成多组“（多示例数据包，标签）”的形式。

3.根据权利要求1所述的一种基于自动示例选择的端到端多示例学习方法，其特征在于，所述步骤（二）中，深度多示例网络搭建包括以下具体步骤：
200、搭建示例处理层模块；
201、搭建示例选择层模块；
202、搭建...

【专利技术属性】
技术研发人员：詹德川，王魏，李新春，
申请(专利权)人：南京智谷人工智能研究院有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人