多示例学习分类器构建方法、系统及电子设备和存储介质技术方案

技术编号：21433482 阅读：30 留言：0更新日期：2019-06-22 12:18

本申请公开了一种多示例学习分类器构建方法、系统及一种电子设备和计算机可读存储介质，该方法包括：获取源任务和目标任务分别对应的训练集；其中，所述训练集包括多个多示例包，每个所述多示例包包括多个示例，每个所述示例对应一个示例标签；确定每个所述多示例包对应的标签集，初始化所述标签集中每个弱标签对应的权值，并根据所述标签集和所述权值计算每个所述多示例包的包标签；根据所述训练集和所有所述包标签计算所述源任务和所述目标任务分别对应的权向量和偏移量，得到所述源任务和所述目标任务分别对应的分类器函数。由此可见，本申请提供的多示例学习分类器构建方法实现了基于迁移学习的多示例学习分类器。

全部详细技术资料下载

【技术实现步骤摘要】
多示例学习分类器构建方法、系统及电子设备和存储介质
本申请涉及多示例学习
，更具体地说，涉及一种多示例学习分类器构建方法、系统及一种电子设备和一种计算机可读存储介质。
技术介绍
多示例学习是以多示例包(Bag)为训练单元的学习问题。在多示例学习中，训练集由一组具有分类标签(Label)的多示例包组成，每个多示例包中有若干个没有分类标签的示例(Instance)。如果多示例包中至少含有一个正示例(PositiveInstance)，则该包被标记为正类多示例包。如果多示例包的所有示例都是负示例(NegativeInstance)，则该包被标记为负类多示例包。多示例学习的目的是，通过对具有分类标签的多示例包的学习，构建多示例学习分类器，并将该分类器应用于未知多示例包的预测。迁移学习(TransferLearning)是一种机器学习技术，是通过从已学习的源任务(SourceTask)中迁移其知识来对需要学习的目标任务(TargetTask)进行提高。在现有技术中的基于迁移学习的多示例学习分类器构建方法中，源任务和目标任务的训练集中的多示例包均被真实地标记了，然而在实际情况下，由于需要标记的多示例包的数量大并且需要花费大量的人力及时间，往往很难获得足够数量的标记包。因此，如何基于弱标签的训练集实现基于迁移学习的多示例学习分类器构建是本领域技术人员需要解决的技术问题。
技术实现思路
本申请的目的在于提供一种多示例学习分类器构建方法、系统及一种电子设备和一种计算机可读存储介质，基于弱标签的训练集实现基于迁移学习的多示例学习分类器构建。为实现上述目的，本申请提供了一种多...

【技术保护点】
1.一种多示例学习分类器构建方法，其特征在于，包括：获取源任务和目标任务分别对应的训练集；其中，所述训练集包括多个多示例包，每个所述多示例包包括多个示例，每个所述示例对应一个示例标签；确定每个所述多示例包对应的标签集，初始化所述标签集中每个弱标签对应的权值，并根据所述标签集和所述权值计算每个所述多示例包的包标签；根据所述训练集和所有所述包标签计算所述源任务和所述目标任务分别对应的权向量和偏移量，得到所述源任务和所述目标任务分别对应的分类器函数。

【技术特征摘要】
1.一种多示例学习分类器构建方法，其特征在于，包括：获取源任务和目标任务分别对应的训练集；其中，所述训练集包括多个多示例包，每个所述多示例包包括多个示例，每个所述示例对应一个示例标签；确定每个所述多示例包对应的标签集，初始化所述标签集中每个弱标签对应的权值，并根据所述标签集和所述权值计算每个所述多示例包的包标签；根据所述训练集和所有所述包标签计算所述源任务和所述目标任务分别对应的权向量和偏移量，得到所述源任务和所述目标任务分别对应的分类器函数。2.根据权利要求1所述多示例学习分类器构建方法，其特征在于，所述根据所述训练集和所有所述包标签计算所述源任务和所述目标任务分别对应的权向量和偏移量，得到所述源任务和所述目标任务分别对应的分类器函数，包括：S1：将每个所述示例的示例标签设置为每个所述示例所属的多示例包的包标签；S2：根据所述训练集和所有所述包标签计算所述源任务和所述目标任务分别对应的权向量和偏移量，得到所述源任务和所述目标任务分别对应的分类器函数；S3：根据包标签确定正包，并利用所述分类器函数更新所述正包中所有示例的示例标签，判断所有所述示例标签是否均未变化；若是，则进入S4，若否，则进入S2；S4：根据所述源任务和所述目标任务分别对应的所述训练集、当前权向量和当前偏移量更新所有所述弱标签对应的权值，重新计算每个所述多示例包的包标签，判断所有所述多示例包的包标签是否均未变化；若是，则进入S5，若否，则进入S1；S5：根据所述源任务和所述目标任务分别对应的当前权向量和当前偏移量确定所述源任务和所述目标任务最终的分类器函数。3.根据权利要求2所述多示例学习分类器构建方法，其特征在于，所述根据所述训练集和所有所述包标签计算所述源任务和所述目标任务分别对应的权向量和偏移量，得到所述源任务和所述目标任务分别对应的分类器函数，包括：根据所述训练集、所有所述包标签、调节参数、所述源任务和所述目标任务分别对应的重要性参数计算所述源任务和所述目标任务分别对应的权向量和偏移量，得到所述源任务和所述目标任务分别对应的分类器函数；其中，所述调节参数为平衡间距和松弛变量的参数。4.根据权利要求3所述多示例学习分类器构建方法，其特征在于，所述源任务对应的分类器函数为f1＝ω1·K(xik)+b1，所述目标任务对应的分类器函数为f2＝ω2·K(xht)+b2；其中，K()为线性核函数，xik为所述源任务对应的训练集中第k个多示例包中的第i个示例，xht为所述目标任务对应的训练集中第t个多示例包中的第h个示例，ω1、ω2分别为所述源任务和所述目标任务对应的权向量，b1、b2分别为所述源任务和所述目标任务对应的偏移量。5.根据权利要求4所述多示例学习分类器构建方法，其特征在于，所述根据所述训练集、所有所述包标签、调节参数、所述源任务和所述目标任务分别对应的重要性参数计算所述源任务和所述目标任务分别对应的权向量和偏移量，得到所述源任务和所述...

【专利技术属性】
技术研发人员：梁飞，肖燕珊，刘波，尹子健，苌征，汪槐沛，郝志峰，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人