检测模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:32270583 阅读:8 留言:0更新日期:2022-02-12 19:34
本公开提供了一种检测模型的训练方法、装置、电子设备及存储介质,涉及人工智能领域,具体涉及计算机视觉和深度学习技术,可用于智慧城市和智能交通场景下。具体实现方案为:获取样本数据,并获取参考教师模型,根据参考教师模型生成多个待训练教师模型,不同待训练教师模型不相同,将样本数据分别输入至多个待训练教师模型之中,以得到多个待训练教师模型分别输出的多个结果数据,根据样本数据、多个结果数据训练初始的学生检测模型,以得到目标检测模型,能够实现有效地提升学生检测模型的训练效果,有效地提升目标检测模型的检测性能,提升目标检测模型的检测准确性。升目标检测模型的检测准确性。升目标检测模型的检测准确性。

【技术实现步骤摘要】
检测模型的训练方法、装置、电子设备及存储介质


[0001]本公开涉及人工智能
,具体涉及计算机视觉和深度学习技术,可用于智慧城市和智能交通场景下,尤其涉及一种检测模型的训练方法、装置、电子设备及存储介质。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术,以及机器学习、深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]相关技术中,通常是直接利用已有教师模型在无标注数据上进行估计计算,利用已有教师模型在无标注数据上的输出和无标注数据直接训练学生模型。

技术实现思路

[0004]本公开提供了一种检测模型的训练方法、检测方法、装置、电子设备、存储介质及计算机程序产品。
[0005]根据本公开的第一方面,提供了一种检测模型的训练方法,包括:获取样本数据,并获取参考教师模型;根据所述参考教师模型生成多个待训练教师模型,不同所述待训练教师模型不相同;将所述样本数据分别输入至所述多个待训练教师模型之中,以得到所述多个待训练教师模型分别输出的多个结果数据;根据所述样本数据、所述多个结果数据训练初始的学生检测模型,以得到目标检测模型。
[0006]根据本公开的第二方面,提供了一种检测方法,包括:获取待检测数据;将所述待检测数据输入至如本公开第一方面的检测模型的训练方法训练得到的目标检测模型之中,以得到所述目标检测模型输出的目标结果数据。
[0007]根据本公开的第三方面,提供了一种检测模型的训练装置,包括:第一获取模块,用于获取样本数据,并获取参考教师模型;第一生成模块,用于根据所述参考教师模型生成多个待训练教师模型,不同所述待训练教师模型不相同;第一处理模块,用于将所述样本数据分别输入至所述多个待训练教师模型之中,以得到所述多个待训练教师模型分别输出的多个结果数据;训练模块,用于根据所述样本数据、所述多个结果数据训练初始的学生检测模型,以得到目标检测模型。
[0008]根据本公开的第四方面,提供了一种检测装置,包括:第二获取模块,用于获取待检测数据;第二处理模块,用于将所述待检测数据输入至如本公开第三方面的所述的检测模型的训练装置训练得到的目标检测模型之中,以得到所述目标检测模型输出的目标结果数据。
[0009]根据本公开的第五方面,提供了一种电子设备,包括:至少一个处理器;以及与至
少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开第一方面提出的检测模型的训练方法,或者实现如本公开第二方面提出的检测方法。
[0010]根据本公开的第六方面,提出了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行本公开第一方面提出的检测模型的训练方法,或者实现如本公开第二方面提出的检测方法。
[0011]根据本公开的第七方面,提出了一种计算机程序产品,包括计算机程序,当计算机程序由处理器执行时实现本公开第一方面提出的检测模型的训练方法,或者实现如本公开第二方面提出的检测方法。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其他特征将通过以下的说明书而变得容易理解。
附图说明
[0013]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0014]图1是根据本公开第一实施例的示意图;
[0015]图2是根据本公开第二实施例的示意图;
[0016]图3是根据本公开第三实施例的示意图;
[0017]图4是根据本公开实施例的模型检测流程示意图;
[0018]图5是根据本公开第四实施例的示意图;
[0019]图6是根据本公开第五实施例的示意图;
[0020]图7是根据本公开第六实施例的示意图;
[0021]图8示出了可以用来实施本公开的实施例的检测模型的训练方法的示例电子设备的示意性框图。
具体实施方式
[0022]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0023]图1是根据本公开第一实施例的示意图。
[0024]其中,需要说明的是,本实施例的检测模型的训练方法的执行主体为检测模型的训练装置,该装置可以由软件和/或硬件的方式实现,该装置可以配置在电子设备中,电子设备可以包括但不限于终端、服务器端等。
[0025]本公开实施例涉及人工智能
,具体涉及计算机视觉和深度学习技术,可用于智慧城市和智能交通场景下。
[0026]其中,人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
[0027]深度学习,是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。深度学习的最终目标是让机器能够
像人一样具有分析学习能力,能够识别文字、图像和声音等数据。
[0028]计算机视觉,计算机视觉是用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。
[0029]而智慧城市,是指利用各种信息技术或创新概念,将城市的系统和服务打通、集成,以提升资源运用的效率,优化城市管理和服务,以及改善市民生活质量;智能交通,是指是将先进的科学技术(信息技术、计算机技术、数据通信技术、传感器技术、电子控制技术、自动控制理论、运筹学、人工智能等)有效地综合运用于交通运输、服务控制和车辆制造,加强车辆、道路、使用者三者之间的联系,从而形成一种保障安全、提高效率、改善环境、节约能源的综合运输策略。
[0030]当将本公开实施例提供的检测模型的训练方法和检测方法应用于智慧城市和智能交通场景时,能够有效地保障智慧城市和智能交通场景中相关分类、检测、图像识别、目标追踪等算法中所涉及模型的检测性能,从而能够有效地提升目标检测模型在智慧城市和智能交通场景的应用效果。
[0031]如图1所示,该检测模型的训练方法,包括:
[0032]S101:获取样本数据,并获取参考教师模型。
[0033]其中,用于对模型进行训练的数据可以被称为样本数据,该样本数据可以是无标注数据。
[0034]举例而言,样本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种检测模型的训练方法,包括:获取样本数据,并获取参考教师模型;根据所述参考教师模型生成多个待训练教师模型,不同所述待训练教师模型不相同;将所述样本数据分别输入至所述多个待训练教师模型之中,以得到所述多个待训练教师模型分别输出的多个结果数据;根据所述样本数据、所述多个结果数据训练初始的学生检测模型,以得到目标检测模型。2.根据权利要求1所述的方法,其中,所述获取参考教师模型,包括:获取与所述样本数据对应的初始标注数据;根据所述样本数据和所述初始标注数据训练初始的教师模型,以得到所述参考教师模型。3.根据权利要求1所述的方法,其中,所述根据所述参考教师模型生成多个待训练教师模型,不同所述待训练教师模型不相同,包括:确定多个模型更新速率,不同所述模型更新速率不相同;分别采用所述多个模型更新速率对所述参考教师模型进行调整,以得到所述多个待训练教师模型,所述多个待训练教师模型分别对应多个权重更新速率,所述多个权重更新速率分别对应所述多个模型更新速率。4.根据权利要求1所述的方法,在所述将所述样本数据分别输入至所述多个待训练教师模型之中,以得到所述多个待训练教师模型分别输出的多个结果数据之后,还包括:根据所述多个结果数据生成目标标注数据;其中,所述根据所述样本数据、所述多个结果数据训练初始的学生检测模型,以得到目标检测模型,包括:将所述样本数据输入至所述初始的学生检测模型之中,以得到所述学生检测模型输出的预测结果数据;根据所述预测结果数据和所述目标标注数据确定模型损失值;如果所述模型损失值满足设定条件,则将训练得到的所述学生检测模型作为所述目标检测模型。5.根据权利要求4所述的方法,其中,所述根据所述多个结果数据生成目标标注数据,包括:确定与所述多个待训练教师模型分别对应的多个模型权重信息;根据所述多个模型权重信息分别对相应所述多个结果数据进行加权,以得到多个加权结果数据;融合所述多个加权结果数据,以得到所述目标标注数据。6.根据权利要求1所述的方法,所述多个待训练教师模型包括:第一待训练教师模型和第二待训练教师模型,其中,所述将所述样本数据分别输入至所述多个待训练教师模型之中,以得到所述多个待训练教师模型分别输出的多个结果数据,包括:将所述样本数据输入至所述第一待训练教师模型之中,以得到所述第一待训练教师模型输出的第一结果数据;将所述样本数据输入至所述第二待训练教师模型之中,以得到所述第二待训练教师模
型输出的第二结果数据,所述第一结果数据和所述第二结果数据被共同作为所述结果数据。7.一种检测方法,包括:获取待检测数据;将所述待检测数据输入至如上述权利要求1

6任一项所述的检测模型的训练方法训练得到的目标检测模型之中,以得到所述目标检测模型输出的目标结果数据。8.一种检测模型的训练装置,包括:第一获取模块,用于获取样本数据,并获取参考教师模型;第一生成模块,用于根据所述参考教师模型生成多个待训练教师模型,不同所述待训练教师模型不相同;第一处理模块,用于将所述样本数据分别输入至所述多个待训练教师模型之中,以得到所述多个待训练教师模型分别输出的多个结果数据;训练...

【专利技术属性】
技术研发人员:蒋旻悦谭啸孙昊
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1