图像识别方法、装置、电子设备及计算可读存储介质制造方法及图纸

技术编号:25440852 阅读:20 留言:0更新日期:2020-08-28 22:28
本公开实施例提供了一种图像识别方法、装置、电子设备及计算可读存储介质,图像识别方法,包括:获取待识别图像并输入训练后的图像检测模型,确定包括至少一个第一检测框的待识别图像;根据预设比例,以第一检测框为中心,扩展第一检测框在待识别图像上的范围,确定第二检测框;将第二检测框中的待识别图像输入训练后的图像识别模型,确定图像识别结果。本公开提供的图像识别方法利用第一检测框粗略定位包含目标对象的待识别图像区域,再通过将第一检测框扩展,确保待识别图像区域中完全包括可能存在的目标对象,再通过训练后的图像识别模型,集中识别出扩展后得到的第二检测框中的目标对象,实现对目标对象的精确识别。

【技术实现步骤摘要】
图像识别方法、装置、电子设备及计算可读存储介质
本公开涉及图像识别
,具体而言,本公开涉及一种图像识别方法、装置、电子设备及计算可读存储介质。
技术介绍
图像处理当中,一个重要的处理是对于特定目标对象的处理,例如对于人像的处理,应用于人像识别或者图像美化等方面。在某些画面当中,人像在整个画面中占比较小,并且可能存在多个人的影像,现有技术进行人像识别或者抠图处理会存在清晰度不够,识别不准确,或者抠图误差较大,将无关或者并非目标对象(人像)的图区分割出来。本公开能够解决在人像识别和分割的准确性问题,即使人像占比较小,也能达到较为准确的识别的效果。
技术实现思路
本公开针对现有方式的缺点,提出一种图像识别方法、装置、电子设备及计算可读存储介质,用以解决现有技术存在的人像识别和分割准确率低的技术问题。第一个方面,一种图像识别方法,包括下列步骤:获取待识别图像并输入训练后的图像检测模型,确定包括至少一个第一检测框的待识别图像;根据预设比例,以第一检测框为中心,扩展第一检测框在待识别图像上的范围,确定第二检测框;将第二检测框中的待识别图像输入训练后的图像识别模型,确定图像识别结果。第二个方面,本公开提供了一种图像识别装置,包括:获取模块,用于获取待识别图像并输入训练后的图像检测模型,确定包括至少一个第一检测框的待识别图像;扩展模块,用于根据预设比例,以第一检测框为中心,扩展第一检测框在待识别图像上的范围,确定第二检测框;输出模块,用于将第二检测框中的待识别图像输入训练后的图像识别模型,确定图像识别结果。第三个方面,本公开提供了一种电子设备,包括:处理器;存储器,与处理器电连接;至少一个程序,被存储在存储器中并被配置为由处理器执行,至少一个程序被配置用于:实现如本公开第一个方面提供的图像识别方法。第四个方面,本公开提供了一种计算机可读存储介质,计算机可读存储介质存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如本公开第一个方面提供的图像识别方法。本公开实施例提供的技术方案带来的有益技术效果是:本公开提供的图像识别方法通过训练后的图像检测模型在待识别图像中,利用第一检测框粗略定位包含目标对象的待识别图像区域,再通过将第一检测框扩展,确保待识别图像区域中完全包括可能存在的目标对象,再通过训练后的图像识别模型,集中识别出扩展后得到的第二检测框中的目标对象,实现对目标对象的精确识别,本公开提供的图像识别方法能够实现完整并且准确地识别图像中特定目标对象的效果。本公开附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本公开的实践了解到。附图说明本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本公开实施例的图像识别方法的流程示意图;图2为本公开实施例的图像检测模型训练的流程示意图;图3为本公开实施例的图像识别模型训练的流程示意图;图4为本公开实施例的图像识别装置的基本结构示意图;图5为本公开实施例的图像识别装置的详细结构示意图;图6为本公开另一实施例的图像识别装置的详细结构示意图;图7为本公开实施例的电子设备的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对装置、模块或单元进行区分,并非用于限定这些装置、模块或单元一定为不同的装置、模块或单元,也并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。计算机视觉是一项在现实生活中广泛应用的技术,该技术应用中不可避免地要涉及到图像处理,对图片或者视频等图像中的内容进行识别,选找出目标对象,例如在电视电影的文艺作品领域,需要针对图片中特定对象进行修饰,像人物化妆,特效加载等;或者在人物身份识别的领域,例如为寻找犯罪嫌疑人,需要对图片中的人物进行精细识别。然而,现实当中获取到的图片素材质量参差不齐,目标对象大小不一,在识别过程中往往会遗漏目标或者混淆目标,识别范围有限,准确度不足,难以达到让人满意的程度。为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。本公开实施例提供的图像识别方法、装置、电子设备及计算可读存储介质,旨在解决现有技术的如上技术问题。下面以具体地实施例对本公开实施例的技术方案以及本公开实施例的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本公开的实施例进行描述。本公开的实施例中提供了一种图像识别方法,如图1所示,包括下列步骤:S100:获取待识别图像并输入训练后的图像检测模型,确定包括至少一个第一检测框的待识别图像。S200:根据预设比例,以第一检测框为中心,扩展第一检测框在待识别图像上的范围,确定第二检测框。S300:将第二检测框中的待识别图像输入训练后的图像识别模型,确定图像识别结果。通过S100初步对待识别的图像进行分析,利用训练后的图像检测模型,自动在输入图像检测模型的待识别的图像上增加第一检测框,也即在待识别的图像信息中新增与待识别图像相关的第一检测框信息。为确保检测框能够完全包括待识别的内容,因此通过S200,将第一检测框按照一定的规律扩展,尽量精确但范围更广地囊括待识别图像中的信息,即通过覆盖范围更大的第二检测框标记选择待识别图像。在获取到目标范围较清晰的识别内容之后,S300中通过训练后的图本文档来自技高网...

【技术保护点】
1.一种图像识别方法,其特征在于,包括下列步骤:/n获取待识别图像并输入训练后的图像检测模型,确定包括至少一个第一检测框的待识别图像;/n根据预设比例,以所述第一检测框为中心,扩展所述第一检测框在所述待识别图像上的范围,确定第二检测框;/n将所述第二检测框中的待识别图像输入训练后的图像识别模型,确定图像识别结果。/n

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括下列步骤:
获取待识别图像并输入训练后的图像检测模型,确定包括至少一个第一检测框的待识别图像;
根据预设比例,以所述第一检测框为中心,扩展所述第一检测框在所述待识别图像上的范围,确定第二检测框;
将所述第二检测框中的待识别图像输入训练后的图像识别模型,确定图像识别结果。


2.根据权利要求1所述的图像识别方法,其特征在于,预先训练所述图像检测模型的方式,包括:
获取多个第一样本图像以及分别对应的检测框标注信息,任一检测框标注信息对应的第一检测框包含至少一个所述目标对象;
根据多个第一样本图像以及分别对应的检测框标注信息,通过对初始的图像检测模型进行参数调整来进行模型训练,当达到预设的第一训练条件时,得到训练后的图像检测模型。


3.根据权利要求2所述的图像识别方法,其特征在于,所述获取多个第一样本图像以及分别对应的检测框标注信息的步骤,包括:
获取所述第一样本图像上目标对象的识别概率信息;
当所述识别概率信息满足预设概率范围,确定所述目标对象的数量和位置;
根据所述目标对象的数量和位置,确定所述检测框标注信息。


4.根据权利要求2或3所述的图像识别方法,其特征在于,所述获取多个第一样本图像以及分别对应的检测框标注信息的步骤,包括:
当所述第一样本图像上目标对象的数量为两个或两个以上时,判断相邻两个目标对象的间距;
当所述间距满足预设距离阈值时,将所述目标对象放入同一个所述第一检测框内,所述第一检测框为围绕所述目标对象的最小检测框。


5.根据权利要求2所述的图像识别方法,其特征在于,所述第一检测框为矩形框;所述第一样本图像左上角为坐标系原点,所述第一检测框的位置包括所述矩形框左上角的坐标信息、所述矩形框的长度值、宽度值。


6.根据权利要求1所述的图像识别方法,其特征在于,所述确定第二检测框的步骤,包括:
以所述第一检测框的几何中心点为原点,以所述预设比例,放射扩展所述第一检测框,扩展后的所述第一检测框为所述第二检测框。


7.根据权利要求1所述的图像识别方法,其特征在于,预先训练图像识别模型的方式,包括:
获取多个第二样本图像以及样本...

【专利技术属性】
技术研发人员:李华夏
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1