一种训练集中的图片处理方法及装置制造方法及图纸

技术编号:21834022 阅读:22 留言:0更新日期:2019-08-10 18:30
本发明专利技术实施例提供一种训练集中的图片处理方法及装置,所述方法包括:获取预设模型针对原始图片的识别结果;若判断获知存在不正确的第一识别结果,则获取所有正确的第二识别结果;将所有第二识别结果对应的第二目标图片导入与相应图片标签对应的类别集合中,并进行再次训练;从再次训练完成后的类别集合中剔除最终目标图片;所述最终目标图片是与每个第一识别结果对应的第一目标图片的相似程度大于预设阈值的图片标签中的图片。所述装置执行上述方法。本发明专利技术实施例提供的训练集中的图片处理方法及装置,能够提高训练图片的处理效率,进而提高模型识别图片的准确度。

A Method and Device for Picture Processing in Training Set

【技术实现步骤摘要】
一种训练集中的图片处理方法及装置
本专利技术实施例涉及图片处理
,尤其涉及一种训练集中的图片处理方法及装置。
技术介绍
胶囊内镜具有无痛、无伤、拍摄图像信息量大等优点,具备广泛的应用价值。现有技术采用人工方式识别通过胶囊内镜拍摄的原始图片、并对原始图片进行分类,为了更加准确、高效地识别原始图片,需要构建模型,但是模型在使用之前通常需要进行训练,在训练完成之后,才可以使用模型对原始图片进行识别。但是,由于原始图片的复杂性,会导致模型的识别结果不够准确,例如:会出现一些错分的图片,现有技术的方法是:将错分的图片放入图片标签集(即训练集)中进行再训练,以确保当再遇到类似的图片时,模型不会再犯同样的错误,当需要训练的图片量较少的情况下,这样做的效率还可以,但是,当需要训练的图片量较多的情况下时,现有技术的方法效率非常低下。因此,如何避免上述缺陷,提高训练图片的处理效率,进而提高模型识别图片的准确度,成为亟须解决的问题。
技术实现思路
针对现有技术存在的问题,本专利技术实施例提供一种训练集中的图片处理方法及装置。本专利技术实施例提供一种训练集中的图片处理方法,包括:获取预设模型针对原始图片的识别结果;若判断获知存在不正确的第一识别结果,则获取所有正确的第二识别结果;将所有第二识别结果对应的第二目标图片导入与相应图片标签对应的类别集合中,并进行再次训练;从再次训练完成后的类别集合中剔除最终目标图片;所述最终目标图片是与每个第一识别结果对应的第一目标图片的相似程度大于预设阈值的图片标签中的图片。本专利技术实施例提供一种训练集中的图片处理装置,包括:获取单元,用于获取预设模型针对原始图片的识别结果;若判断获知存在不正确的第一识别结果,则获取所有正确的第二识别结果;再训练单元,用于将所有第二识别结果对应的第二目标图片导入与相应图片标签对应的类别集合中,并进行再次训练;剔除单元,用于从再次训练完成后的类别集合中剔除最终目标图片;所述最终目标图片是与每个第一识别结果对应的第一目标图片的相似程度大于预设阈值的图片标签中的图片。本专利技术实施例提供一种电子设备,包括:处理器、存储器和总线,其中,所述处理器和所述存储器通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:获取预设模型针对原始图片的识别结果;若判断获知存在不正确的第一识别结果,则获取所有正确的第二识别结果;将所有第二识别结果对应的第二目标图片导入与相应图片标签对应的类别集合中,并进行再次训练;从再次训练完成后的类别集合中剔除最终目标图片;所述最终目标图片是与每个第一识别结果对应的第一目标图片的相似程度大于预设阈值的图片标签中的图片。本专利技术实施例提供一种非暂态计算机可读存储介质,包括:所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如下方法:获取预设模型针对原始图片的识别结果;若判断获知存在不正确的第一识别结果,则获取所有正确的第二识别结果;将所有第二识别结果对应的第二目标图片导入与相应图片标签对应的类别集合中,并进行再次训练;从再次训练完成后的类别集合中剔除最终目标图片;所述最终目标图片是与每个第一识别结果对应的第一目标图片的相似程度大于预设阈值的图片标签中的图片。本专利技术实施例提供的训练集中的图片处理方法及装置,通过对正确的识别结果对应的图片再次进行训练,形成特征高度纯化的图片集合,在此基础上再从特征高度纯化的图片集合中剔除与错分图片相似的图片,能够提高训练图片的处理效率,进而提高模型识别图片的准确度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术训练集中的图片处理方法实施例流程图;图2为本专利技术训练集中的图片处理装置实施例结构示意图;图3为本专利技术实施例提供的电子设备实体结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术训练集中的图片处理方法实施例流程图,如图1所示,本专利技术实施例提供的一种训练集中的图片处理方法,包括以下步骤:S101:获取预设模型针对原始图片的识别结果;若判断获知存在不正确的第一识别结果,则获取所有正确的第二识别结果。具体的,装置获取预设模型针对原始图片的识别结果;若判断获知存在不正确的第一识别结果,则获取所有正确的第二识别结果。需要说明的是:该原始图片是通过胶囊内镜拍摄的,对胶囊内镜的工作过程作如下说明:·胶囊内镜从口腔进入消化道,再从肛门自然排出体外。·胶囊内镜的电池续航力有限,其有效工作区间为口腔、食道、胃、十二指肠、小肠和大肠一部分。·胶囊内镜的每次活动都产生域内检查图片和域外检查图片。·域内检查图片是对消化道某一段所进行的拍摄结果。·域外检查图片是除了域内检查图片以外,胶囊内镜顺便拍到的图片。·全部图片均可自动识别,无需任何人工介入(包括图像预处理)。·识别图像后,将胶囊内镜拍摄的图片分为六个大类(125个小类),自动保存于125个图片文件夹中,其中,六个大类可以为:第一大类:一类域外分类标签(10个类别)。第二大类:二类域外分类标签(13个类别)。第三大类:基于局部结构特征的图片分类标签(14个类别)。第四大类:洞状结构图片分类标签(8个类别)。第五大类:基于全局结构特征的图片分类标签(24个类别)。第六大类:异常特征图片分类标签(56个类别)。·能够自动识别口腔、食道、胃、十二指肠、小肠和大肠等消化道的不同部位。每粒胶囊内镜每次可以拍摄的原始图片的数量可以为2000~3000张,即胶囊内镜获取到的图片集中的图片数量。可以从医院信息系统中导出、未经任何处理的胶囊内镜拍摄的原始图片(JPG格式)。对原始图片的识别结果可以包括:干扰图片、拍摄物外表面不包含异常特征的图片、拍摄物外表面包含所述异常特征的图片,所述异常特征可以包括凸起特征和/或指定颜色特征。干扰图片可以理解为无法用于图片识别的图片。凸起特征可以包括肿胀、颗粒状物凸起。指定颜色特征可以包括红色、白色,不作具体限定。需要说明的是:该异常特征可以作为某些疾病诊断过程中的中间参考特征,仅仅依赖该异常特征还不足以诊断出疾病。举例说明如下:预设模型对A、B、C、D共计四张原始图片进行识别,识别结果分别为a、b、c、d,再分别对a、b、c、d进行验证,如果模型输出的a、b、c、d都是干扰图片,而验证结果为a、b、c都是干扰图片,而d不是干扰图片(可以是上述不包含异常特征的图片,或包含所述异常特征的图片),即存在一个不正确的第一识别结果d(可以为至少一个),则获取所有正确的第二识别结果a、b、c。S102:将所有第二识别结果对应的第二目标图片导入与相应图片标签对应的类别集合中,并进行再次训练。具体的本文档来自技高网...

【技术保护点】
1.一种训练集中的图片处理方法,其特征在于,包括:获取预设模型针对原始图片的识别结果;若判断获知存在不正确的第一识别结果,则获取所有正确的第二识别结果;将所有第二识别结果对应的第二目标图片导入与相应图片标签对应的类别集合中,并进行再次训练;从再次训练完成后的类别集合中剔除最终目标图片;所述最终目标图片是与每个第一识别结果对应的第一目标图片的相似程度大于预设阈值的图片标签中的图片。

【技术特征摘要】
1.一种训练集中的图片处理方法,其特征在于,包括:获取预设模型针对原始图片的识别结果;若判断获知存在不正确的第一识别结果,则获取所有正确的第二识别结果;将所有第二识别结果对应的第二目标图片导入与相应图片标签对应的类别集合中,并进行再次训练;从再次训练完成后的类别集合中剔除最终目标图片;所述最终目标图片是与每个第一识别结果对应的第一目标图片的相似程度大于预设阈值的图片标签中的图片。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:从再次训练完成后的类别集合中定期剔除最终目标图片。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:从再次训练完成后的类别集合中替换最终目标图片。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:从再次训练完成后的类别集合中定期替换最终目标图片。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:在再次训练的过程中,若达到预设条件,则终止进行再次训练;其中,所述预设条件包括再次训练的迭代次数达到预设次数;或再次训练的收敛精度达到预设数值。6.根...

【专利技术属性】
技术研发人员:朱喻
申请(专利权)人:广州思德医疗科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1