多示例学习分类器构建方法、系统及电子设备和存储介质技术方案

技术编号:21433482 阅读:30 留言:0更新日期:2019-06-22 12:18
本申请公开了一种多示例学习分类器构建方法、系统及一种电子设备和计算机可读存储介质,该方法包括:获取源任务和目标任务分别对应的训练集;其中,所述训练集包括多个多示例包,每个所述多示例包包括多个示例,每个所述示例对应一个示例标签;确定每个所述多示例包对应的标签集,初始化所述标签集中每个弱标签对应的权值,并根据所述标签集和所述权值计算每个所述多示例包的包标签;根据所述训练集和所有所述包标签计算所述源任务和所述目标任务分别对应的权向量和偏移量,得到所述源任务和所述目标任务分别对应的分类器函数。由此可见,本申请提供的多示例学习分类器构建方法实现了基于迁移学习的多示例学习分类器。

【技术实现步骤摘要】
多示例学习分类器构建方法、系统及电子设备和存储介质
本申请涉及多示例学习
,更具体地说,涉及一种多示例学习分类器构建方法、系统及一种电子设备和一种计算机可读存储介质。
技术介绍
多示例学习是以多示例包(Bag)为训练单元的学习问题。在多示例学习中,训练集由一组具有分类标签(Label)的多示例包组成,每个多示例包中有若干个没有分类标签的示例(Instance)。如果多示例包中至少含有一个正示例(PositiveInstance),则该包被标记为正类多示例包。如果多示例包的所有示例都是负示例(NegativeInstance),则该包被标记为负类多示例包。多示例学习的目的是,通过对具有分类标签的多示例包的学习,构建多示例学习分类器,并将该分类器应用于未知多示例包的预测。迁移学习(TransferLearning)是一种机器学习技术,是通过从已学习的源任务(SourceTask)中迁移其知识来对需要学习的目标任务(TargetTask)进行提高。在现有技术中的基于迁移学习的多示例学习分类器构建方法中,源任务和目标任务的训练集中的多示例包均被真实地标记了,然而在实际情况下,由于需要标记的多示例包的数量大并且需要花费大量的人力及时间,往往很难获得足够数量的标记包。因此,如何基于弱标签的训练集实现基于迁移学习的多示例学习分类器构建是本领域技术人员需要解决的技术问题。
技术实现思路
本申请的目的在于提供一种多示例学习分类器构建方法、系统及一种电子设备和一种计算机可读存储介质,基于弱标签的训练集实现基于迁移学习的多示例学习分类器构建。为实现上述目的,本申请提供了一种多示例学习分类器构建方法,包括:获取源任务和目标任务分别对应的训练集;其中,所述训练集包括多个多示例包,每个所述多示例包包括多个示例,每个所述示例对应一个示例标签;确定每个所述多示例包对应的标签集,初始化所述标签集中每个弱标签对应的权值,并根据所述标签集和所述权值计算每个所述多示例包的包标签;根据所述训练集和所有所述包标签计算所述源任务和所述目标任务分别对应的权向量和偏移量,得到所述源任务和所述目标任务分别对应的分类器函数。其中,所述根据所述训练集和所有所述包标签计算所述源任务和所述目标任务分别对应的权向量和偏移量,得到所述源任务和所述目标任务分别对应的分类器函数,包括:S1:将每个所述示例的示例标签设置为每个所述示例所属的多示例包的包标签;S2:根据所述训练集和所有所述包标签计算所述源任务和所述目标任务分别对应的权向量和偏移量,得到所述源任务和所述目标任务分别对应的分类器函数;S3:根据包标签确定正包,并利用所述分类器函数更新所述正包中所有示例的示例标签,判断所有所述示例标签是否均未变化;若是,则进入S4,若否,则进入S2;S4:根据所述源任务和所述目标任务分别对应的所述训练集、当前权向量和当前偏移量更新所有所述弱标签对应的权值,重新计算每个所述多示例包的包标签,判断所有所述多示例包的包标签是否均未变化;若是,则进入S5,若否,则进入S1;S5:根据所述源任务和所述目标任务分别对应的当前权向量和当前偏移量确定所述源任务和所述目标任务最终的分类器函数。其中,所述根据所述训练集和所有所述包标签计算所述源任务和所述目标任务分别对应的权向量和偏移量,得到所述源任务和所述目标任务分别对应的分类器函数,包括:根据所述训练集、所有所述包标签、调节参数、所述源任务和所述目标任务分别对应的重要性参数计算所述源任务和所述目标任务分别对应的权向量和偏移量,得到所述源任务和所述目标任务分别对应的分类器函数;其中,所述调节参数为平衡间距和松弛变量的参数。其中,所述源任务对应的分类器函数为f1=ω1·K(xik)+b1,所述目标任务对应的分类器函数为f2=ω2·K(xht)+b2;其中,K()为线性核函数,xik为所述源任务对应的训练集中第k个多示例包中的第i个示例,xht为所述目标任务对应的训练集中第t个多示例包中的第h个示例,ω1、ω2分别为所述源任务和所述目标任务对应的权向量,b1、b2分别为所述源任务和所述目标任务对应的偏移量。其中,所述根据所述训练集、所有所述包标签、调节参数、所述源任务和所述目标任务分别对应的重要性参数计算所述源任务和所述目标任务分别对应的权向量和偏移量,得到所述源任务和所述目标任务分别对应的分类器函数,包括:根据计算公式计算所述源任务和所述目标任务分别对应的权向量和偏移量;其中,所述计算公式具体为:s.t.YSK(ω1xik+b1)≥1-ξik,ξik≥0YTt(ω2xht+b2)≥1-ξht,ξht≥0其中,ω1=ω0+v1,ω2=ω0+v2,ω0为所述源任务和所述目标任务对应的权向量的公共参数,v1、v2分别为所述源任务和所述目标任务对应的权向量的特殊参数,C为所述调节参数,C1、C2分别所述源任务和所述目标任务分别对应的重要性参数,P为所述源任务的训练集中的多示例包总数,YSK为所述源任务的训练集中第k个多示例包的包标签,ξik为所述第k个多示例包中的第i个示例对应的松弛变量;Q为所述目标任务的训练集中的多示例包总数,YSK为所述目标任务的训练集中第t个多示例包的包标签,ξht为所述第t个多示例包中的第h个示例对应的松弛变量。其中,所述根据所有所述示例的当前松弛变量、所述源任务和所述目标任务分别对应的所述训练集、当前权向量和当前偏移量更新所有所述弱标签对应的权值,包括:根据权值更新公式更新所有所述弱标签对应的权值;其中,所述权值更新公式具体为:其中,rj、rl分别为所述第j个弱标签和所述第l个弱标签对应的权值,ykj为所述源任务的训练集中第k个多示例包对应的标签集中的第j个弱标签,ytl为所述目标任务的训练集中第t个多示例包对应的标签集中的第l个弱标签。其中,所述利用所述分类器函数更新所述正包中所有示例的示例标签,包括:将每个所述示例带入每个所述示例所属的训练集对应的分类器函数中得到分类值,并将所述分类值带入标签函数得到更新值,将每个所述示例的示例标签更新为对应的所述更新值;确定每个所述正包中最大的所述分类值对应的目标示例,并将所述目标示例的示例标签更新为示例标签的最大边界值。为实现上述目的,本申请提供了一种多示例学习分类器构建系统,包括:获取模块,用于获取源任务和目标任务分别对应的训练集;其中,所述训练集包括多个多示例包,每个所述多示例包包括多个示例,每个所述示例对应一个示例标签;确定模块,用于确定每个所述多示例包对应的标签集,初始化所述标签集中每个弱标签对应的权值,并根据所述标签集和所述权值计算每个所述多示例包的包标签;计算模块,用于根据所述训练集和所有所述包标签计算所述源任务和所述目标任务分别对应的权向量和偏移量,得到所述源任务和所述目标任务分别对应的分类器函数。为实现上述目的,本申请提供了一种电子设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如上述多示例学习分类器构建方法的步骤。为实现上述目的,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述多示例学习分类器构建方法的步骤。通过以上方案可知,本申请提供的一种多示例学习分类器构本文档来自技高网...

【技术保护点】
1.一种多示例学习分类器构建方法,其特征在于,包括:获取源任务和目标任务分别对应的训练集;其中,所述训练集包括多个多示例包,每个所述多示例包包括多个示例,每个所述示例对应一个示例标签;确定每个所述多示例包对应的标签集,初始化所述标签集中每个弱标签对应的权值,并根据所述标签集和所述权值计算每个所述多示例包的包标签;根据所述训练集和所有所述包标签计算所述源任务和所述目标任务分别对应的权向量和偏移量,得到所述源任务和所述目标任务分别对应的分类器函数。

【技术特征摘要】
1.一种多示例学习分类器构建方法,其特征在于,包括:获取源任务和目标任务分别对应的训练集;其中,所述训练集包括多个多示例包,每个所述多示例包包括多个示例,每个所述示例对应一个示例标签;确定每个所述多示例包对应的标签集,初始化所述标签集中每个弱标签对应的权值,并根据所述标签集和所述权值计算每个所述多示例包的包标签;根据所述训练集和所有所述包标签计算所述源任务和所述目标任务分别对应的权向量和偏移量,得到所述源任务和所述目标任务分别对应的分类器函数。2.根据权利要求1所述多示例学习分类器构建方法,其特征在于,所述根据所述训练集和所有所述包标签计算所述源任务和所述目标任务分别对应的权向量和偏移量,得到所述源任务和所述目标任务分别对应的分类器函数,包括:S1:将每个所述示例的示例标签设置为每个所述示例所属的多示例包的包标签;S2:根据所述训练集和所有所述包标签计算所述源任务和所述目标任务分别对应的权向量和偏移量,得到所述源任务和所述目标任务分别对应的分类器函数;S3:根据包标签确定正包,并利用所述分类器函数更新所述正包中所有示例的示例标签,判断所有所述示例标签是否均未变化;若是,则进入S4,若否,则进入S2;S4:根据所述源任务和所述目标任务分别对应的所述训练集、当前权向量和当前偏移量更新所有所述弱标签对应的权值,重新计算每个所述多示例包的包标签,判断所有所述多示例包的包标签是否均未变化;若是,则进入S5,若否,则进入S1;S5:根据所述源任务和所述目标任务分别对应的当前权向量和当前偏移量确定所述源任务和所述目标任务最终的分类器函数。3.根据权利要求2所述多示例学习分类器构建方法,其特征在于,所述根据所述训练集和所有所述包标签计算所述源任务和所述目标任务分别对应的权向量和偏移量,得到所述源任务和所述目标任务分别对应的分类器函数,包括:根据所述训练集、所有所述包标签、调节参数、所述源任务和所述目标任务分别对应的重要性参数计算所述源任务和所述目标任务分别对应的权向量和偏移量,得到所述源任务和所述目标任务分别对应的分类器函数;其中,所述调节参数为平衡间距和松弛变量的参数。4.根据权利要求3所述多示例学习分类器构建方法,其特征在于,所述源任务对应的分类器函数为f1=ω1·K(xik)+b1,所述目标任务对应的分类器函数为f2=ω2·K(xht)+b2;其中,K()为线性核函数,xik为所述源任务对应的训练集中第k个多示例包中的第i个示例,xht为所述目标任务对应的训练集中第t个多示例包中的第h个示例,ω1、ω2分别为所述源任务和所述目标任务对应的权向量,b1、b2分别为所述源任务和所述目标任务对应的偏移量。5.根据权利要求4所述多示例学习分类器构建方法,其特征在于,所述根据所述训练集、所有所述包标签、调节参数、所述源任务和所述目标任务分别对应的重要性参数计算所述源任务和所述目标任务分别对应的权向量和偏移量,得到所述源任务和所述...

【专利技术属性】
技术研发人员:梁飞肖燕珊刘波尹子健苌征汪槐沛郝志峰
申请(专利权)人:广东工业大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1