【技术实现步骤摘要】
一种基于自动示例选择的端到端多示例学习方法
本专利技术涉及使用深度网络处理多示例数据的机器学习
,具体涉及一种基于自动示例选择的端到端多示例学习方法。
技术介绍
传统机器学习技术经常假设样本和标签是一一对应的,比如:在文档分类任务中,一篇文档对应一个具体类别;在图像识别任务中,每张图片对应一个标签;在风机故障检测任务中,一个风机的一段时间内的采样信号具有同一个标签。然而,在实际任务中,文档包含很多句子,句子中又有很多短语,不同的句子可能描述的事物涉及了多个方面,只有某些核心句子所描述的事物才决定了该文档所属于的类别;每张图像可以包含多个物体,只有主要的物体才会被标注;风机的故障模式只会在某段时域或者频域范围内才出现。将一篇文档、一张图像、一段时序信号看做一组示例的集合,即多示例包,同时将文档中的多个句子、图像中的多个图像块、时序信号多个时域或者频域范围当做示例,使用多示例学习技术可以有效解决标记粒度的问题。多示例学习假设,多示例包中有一些重要示例决定了该示例包的类别,因此如何去自动选择出重要示例则是非常关键的技 ...
【技术保护点】
1.一种基于自动示例选择的端到端多示例学习方法,其特征在于,包括以下具体步骤:(一)、对多示例数据进行采集,并将数据分成若干个多示例数据包,所述多示例数据包包括若干个示例,且多示例数据包设置为由若干个示例组合成的一组示例集合,所述多示例数据包上具有标签,所述示例设置为一个多维向量;(二)、搭建深度多示例网络,所述深度多示例网络包括示例处理层、示例选择层和分类层;(三)、每个多示例数据包通过深度多示例网络进行处理,通过前向或反向传播进行训练,所述训练包括深度多示例网络训练和深度多示例网络测试。/n
【技术特征摘要】
1.一种基于自动示例选择的端到端多示例学习方法,其特征在于,包括以下具体步骤:(一)、对多示例数据进行采集,并将数据分成若干个多示例数据包,所述多示例数据包包括若干个示例,且多示例数据包设置为由若干个示例组合成的一组示例集合,所述多示例数据包上具有标签,所述示例设置为一个多维向量;(二)、搭建深度多示例网络,所述深度多示例网络包括示例处理层、示例选择层和分类层;(三)、每个多示例数据包通过深度多示例网络进行处理,通过前向或反向传播进行训练,所述训练包括深度多示例网络训练和深度多示例网络测试。
2.根据权利要求1所述的一种基于自动示例选择的端到端多示例学习方法,其特征在于,所述步骤(一)中,多示例数据采集包括以下具体步骤:
100、确定示例和多示例数据包在具体任务中指代的目标;
101、将任务中具体数据构造为多示例数据包;
102、为多示例数据包赋予标签;
103、将数据组织成多组“(多示例数据包,标签)”的形式。
3.根据权利要求1所述的一种基于自动示例选择的端到端多示例学习方法,其特征在于,所述步骤(二)中,深度多示例网络搭建包括以下具体步骤:
200、搭建示例处理层模块;
201、搭建示例选择层模块;
202、搭建...
【专利技术属性】
技术研发人员:詹德川,王魏,李新春,
申请(专利权)人:南京智谷人工智能研究院有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。