用于融合模型的方法和装置制造方法及图纸

技术编号:25891275 阅读:30 留言:0更新日期:2020-10-09 23:33
本申请公开了用于融合模型的方法和装置,涉及人工智能深度学习和图像处理领域。具体实现方案为:获取至少2个模型;获取预设的样本集;对样本集进行随机删除,得到至少2种不同的候选样本集;对于至少2个模型中的每个模型,使用至少2种不同的候选样本集中的一种候选样本集进行模型训练,得到训练完成的模型;将通过不同候选样本集训练出的模型进行融合得到融合后的模型。该实施方式能够加快模型训练速度,并提升了图像识别的精度。

【技术实现步骤摘要】
用于融合模型的方法和装置
本公开的实施例涉及计算机
,具体涉及人工智能深度学习和图像处理领域。
技术介绍
图像识别技术是通过机器学习的手段提取图像的特征、通过提取的特征来区分不同图像的技术。图像识别技术广泛应用于各类视觉任务中,如植物分类、菜品识别、地标识别等。在图像识别领域中,如何提高已有模型的精度,一直是学术界和工业界最值得探索点之一。现有技术通过模型融合来提高模型的精度。模型融合的方式是多个模型在统一的数据集上训练得到的,而数据本身会决定模型的好坏和趋向性,所以多个模型在统一的数据集上训练会导致多个模型保持了一致的趋向性,融合后的结果也会有一定的趋向性,所以这种融合对结果的提升有限。
技术实现思路
本公开提供了一种用于融合模型的装置、装置、设备以及存储介质。根据本公开的第一方面,提供了一种用于融合模型的方法,包括:获取至少2个模型;获取预设的样本集;对样本集进行随机删除,得到至少2种不同的候选样本集;对于至少2个模型中的每个模型,使用至少2种不同的候选样本集中的一种候选样本集进行模型训练,得到训练完成的模型;将通过不同候选样本集训练出的模型进行融合得到融合后的模型根据本公开的第二方面,提供了一种用于融合模型的装置,包括:模型获取单元,被配置成获取至少2个模型;样本获取单元,被配置成获取预设的样本集;删除单元,被配置成对样本集进行随机删除,得到至少2种不同的候选样本集;训练单元,被配置成对于至少2个模型中的每个模型,使用至少2种不同的候选样本集中的一种候选样本集进行模型训练,得到训练完成的模型;融合单元,被配置成将通过不同候选样本集训练出的模型进行融合得到融合后的模型。根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行第一方面中任一项的装置。根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,计算机指令用于使计算机执行第一方面中任一项的装置。根据本申请的技术解决了多个模型在统一的数据集上训练会导致多个模型保持了一致的趋向性的问题,以及融合后的结果也会有一定的趋向性的问题,提升了融合结果。因此可以使用较少的硬件设备就能达到较高的识别准确性,从而在提高了图像处理的准确性和速度的同时,减少GPU等硬件设备的使用,降低成本。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是本公开的一个实施例可以应用于其中的示例性系统架构图;图2是根据本公开的用于融合模型的方法的一个实施例的流程图;图3是根据本公开的用于融合模型的方法的一个应用场景的示意图;图4是根据本公开的用于融合模型的方法的又一个实施例的流程图;图5是根据本公开的用于融合模型的装置的一个实施例的结构示意图;图6是用来实现本申请实施例的用于融合模型的装置的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。图1示出了可以应用本申请实施例的用于融合模型的方法、用于融合模型的装置的示例性系统架构100。如图1所示,系统架构100可以包括终端101、102,网络103、数据库服务器104和服务器105。网络103用以在终端101、102,数据库服务器104与服务器105之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户110可以使用终端101、102通过网络103与服务器105进行交互,以接收或发送消息等。终端101、102上可以安装有各种客户端应用,例如模型训练类应用、图像识别类应用、购物类应用、支付类应用、网页浏览器和即时通讯工具等。这里的终端101、102可以是硬件,也可以是软件。当终端101、102为硬件时,可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(MovingPictureExpertsGroupAudioLa6erIII,动态影像专家压缩标准音频层面3)、膝上型便携计算机和台式计算机等等。当终端101、102为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。当终端101、102为硬件时,其上还可以安装有图像采集设备。图像采集设备可以是各种能实现采集图像功能的设备,如摄像头、传感器等等。用户110可以利用终端101、102上的图像采集设备,来采集图像。数据库服务器104可以是提供各种服务的数据库服务器。例如数据库服务器中可以存储有样本集。样本集中包含有大量的样本。其中,样本可以包括样本图像和类别标注信息。这样,用户110也可以通过终端101、102,从数据库服务器104所存储的样本集中选取样本。服务器105也可以是提供各种服务的服务器,例如对终端101、102上显示的各种应用提供支持的后台服务器。后台服务器可以利用终端101、102发送的样本集中的样本,对初始模型进行训练,并可以将训练结果(如生成的图像识别模型)发送给终端101、102。这样,用户可以应用生成的图像识别模型进行图像识别。这里的数据库服务器104和服务器105同样可以是硬件,也可以是软件。当它们为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当它们为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。需要说明的是,本申请实施例所提供的用于融合模型的方法一般由服务器105执行。相应地,用于融合模型的装置一般也设置于服务器105中。需要指出的是,在服务器105可以实现数据库服务器104的相关功能的情况下,系统架构100中可以不设置数据库服务器104。应该理解,图1中的终端、网络、数据库服务器和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端、网络、数据库服务器和服务器。继续参见图2,其示出了根据本申请的用于融合模型的方法的一个实施例的流程200。该用于融合模型的方法可以包括以下步骤:步骤201,获取至少2个模型。在本实施例中,用于融合模型的方法的执行主体(例如图1所示的服务器105)可从第三方服务器获取至少2个模型。模型可以是基于机器本文档来自技高网...

【技术保护点】
1.一种用于融合模型的方法,包括:/n获取至少2个模型;/n获取预设的样本集;/n对所述样本集进行随机删除,得到至少2种不同的候选样本集;/n对于所述至少2个模型中的每个模型,使用所述至少2种不同的候选样本集中的一种候选样本集进行模型训练,得到训练完成的模型;/n将通过不同候选样本集训练出的模型进行融合得到融合后的模型。/n

【技术特征摘要】
1.一种用于融合模型的方法,包括:
获取至少2个模型;
获取预设的样本集;
对所述样本集进行随机删除,得到至少2种不同的候选样本集;
对于所述至少2个模型中的每个模型,使用所述至少2种不同的候选样本集中的一种候选样本集进行模型训练,得到训练完成的模型;
将通过不同候选样本集训练出的模型进行融合得到融合后的模型。


2.根据权利要求1所述的方法,其中,所述对所述样本集进行随机删除,包括:
将所述样本集中的样本按类别分组;
对于每组样本,从该组样本中随机删除样本。


3.根据权利要求2所述的方法,其中,所述对于每组样本,从该组样本中随机删除样本,包括:
按每组样本中的样本个数从大到小排序;
按照删除比例由大到小的顺序依次从排序后的每组样本中随机删除样本。


4.根据权利要求1所述的方法,其中,所述将通过不同候选样本集训练出的模型进行融合得到融合后的模型,包括:
对不同候选样本集训练出的模型的全连接层进行模型层面的融合。


5.根据权利要求1所述的方法,其中,所述将通过不同候选样本集训练出的模型进行融合得到融合后的模型,包括:
对不同候选样本集训练出的每个模型在目标数据集生成的结果进行投票融合。


6.根据权利要求1-5中任一项所述的方法,其中,所述至少2个模型具有相同或不同的模型结构。


7.一种用于融合模型的装置,包括:
模型获取单元,被配置成获取至少2个模型;
样本获取单元,被配置成获取预设的样本集;
删除单元,被配置成对所述样本集进行随机删除,得到至少2种不同的候选样...

【专利技术属性】
技术研发人员:崔程杨敏魏凯
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1