图像识别方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:23892431 阅读:17 留言:0更新日期:2020-04-22 07:01
本发明专利技术提供一种图像识别方法、装置、设备及计算机可读存储介质,方法包括:获取待训练数据集,其中,所述待训练数据集中包括多张待训练图像;针对所述待训练数据集中的各待训练图像,提取所述待训练图像的全局特征向量以及背景特征向量;通过所述全局特征向量以及背景特征向量构造增量样本数据;根据所述增量样本数据确定损失函数,并通过所述损失函数对预设的待训练模型进行训练,获得图像识别模型;采用所述图像识别模型对预设的目标物体进行识别操作。通过增量样本数据实现对待训练模型的训练,无需额外引入新的数据集,对数据集的要求较低,且训练得到的图像识别模型识别精度较高。

【技术实现步骤摘要】
图像识别方法、装置、设备及计算机可读存储介质
本专利技术涉及图像识别领域,尤其涉及一种图像识别方法、装置、设备及计算机可读存储介质。
技术介绍
再识别(re-identification,简称Re-id)任务作为计算机视觉中的一个重要分支,在智慧城市,智慧交通等领域存在广泛应用。实际应用中,一个移动目标可能先后出现在不同的摄像头中,该目标可以是一个人或是一辆车,需要采用Re-id任务对其进行识别。为了实现通过再识别任务对目标物体的识别,现有技术中一般都是通过预设的神经网络模型提取全局和局部特征,来实现对两张图片的判断。但是,采用上述方法进行再识别时,往往需要关键点检测、语义分割等操作,需要引入额外的数据集,对模型训练时的数据集要求较高。
技术实现思路
本专利技术提供一种图像识别方法、装置、设备及计算机可读存储介质,用于解决现有的再识别方法在模型训练过程中,需要引入额外的数据集,对模型训练时的数据集要求较高的技术问题。本专利技术的第一个方面是提供一种图像识别方法,包括:获取待训练数据集,其中,所述待训练数据集中包括多张待训练图像;针对所述待训练数据集中的各待训练图像,提取所述待训练图像的浅层特征向量、全局特征向量以及背景特征向量;通过所述全局特征向量以及背景特征向量构造增量样本数据;根据所述增量样本数据确定损失函数,并通过所述损失函数对预设的待训练模型进行训练,获得图像识别模型;采用所述图像识别模型对预设的目标物体进行识别操作。本专利技术的第二个方面是提供一种图像识别装置,包括:获取模块,用于获取待训练数据集,其中,所述待训练数据集中包括多张待训练图像;提取模块,用于针对所述待训练数据集中的各待训练图像,提取所述待训练图像的浅层特征向量、全局特征向量以及背景特征向量;样本构造模块,用于通过所述全局特征向量以及背景特征向量构造增量样本数据;确定模块,用于根据所述增量样本数据确定损失函数,并通过所述损失函数对预设的待训练模型进行训练,获得图像识别模型;识别模块,用于采用所述图像识别模型对预设的目标物体进行识别操作。本专利技术的第三个方面是提供一种图像识别设备,包括:存储器,处理器;存储器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为由所述处理器执行如第一方面所述的图像识别方法。本专利技术的第四个方面是提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面所述的图像识别方法。本专利技术提供的图像识别方法、装置、设备及计算机可读存储介质,通过提取待训练图像中的全局特征向量以及背景特征向量,从而能够根据全局特征向量以及背景特征向量确定目标物体的特征向量,进而能够根据该目标物体的特征向量以及背景特征向量的随机组合实现训练样本数据的生成。通过增量样本数据实现对待训练模型的训练,无需额外引入新的数据集,对数据集的要求较低,且训练得到的图像识别模型识别精度较高。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1为本专利技术基于的网络架构示意图;图2为本专利技术实施例一提供的图像识别方法的流程示意图;图3为本专利技术实施例提供的网络模型的网络结构图;图4为本专利技术实施例二提供的图像识别方法的流程示意图;图5为本专利技术实施例提供的又一网络模型的网络结构图;图6为本专利技术实施例三提供的图像识别方法的流程示意图;图7为本专利技术实施例四提供的图像识别装置的结构示意图;图8为本专利技术实施例五提供的图像识别设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例所获得的所有其他实施例,都属于本专利技术保护的范围。针对上述提及的现有的再识别方法在模型训练过程中,需要引入额外的数据集,对模型训练时的数据集要求较高的技术问题,本专利技术提供了一种图像识别方法、装置、设备及计算机可读存储介质。为了避免在模型训练过程中过多的引入新的数据集,可以利用现有的数据集进行增量数据的构造,通过增量样本数据对待训练模型进行训练,能够在保证模型识别精准度的基础上,减少数据集的使用。需要说明的是,本申请提供图像识别方法、装置、设备及计算机可读存储介质可运用在对各中应用软件进行测试的场景中。图1为本专利技术基于的系统架构示意图,如图1所示,本专利技术基于的系统架构至少包括:图像识别装置1以及数据服务器2。其中,图像识别装置1采用C/C++、Java、Shell或Python等语言编写;数据服务器2则可为云端服务器或服务器集群,其内存储有大量的数据。图像识别装置1与数据服务器2通信连接,从而图像识别装置1能够从数据服务器2中获取数据。图2为本专利技术实施例一提供的图像识别方法的流程示意图,如图2所示,所述方法包括:步骤101、获取待训练数据集,其中,所述待训练数据集中包括多张待训练图像。本实施例的执行主体为图像识别装置,该图像识别装置与数据服务器通信连接,从而图像识别装置能够从数据服务器中获取待训练数据集。在通过图像识别模型对预设的目标物体进行再识别之前,首先需要建立图像识别模型。具体地,为了实现对图像识别模型的建立,首先需要从数据服务器中获取待训练数据集,其中,该待训练数据集中包括多张待训练图像。该待训练数据集具体可以为开源的图像数据集,可选地,待训练图像可以为已标注的目标物体信息、背景信息的图像,该待训练图像可以为多个图像采集装置采集到的。可选地,在上述实施例的基础上,步骤102之前,还包括:对各所述待训练图像进行尺寸调整以及通道去均值处理。在本实施例中,获取到待训练图像之后,为了提高后续对待训练图像的处理效率,可以对待训练图像进行预处理操作。具体地,可以对各待训练图像进行尺寸调整以及通道去均值处理。此外,还可以根据实际需求对待训练图像采用其他的预处理手段进行处理,本专利技术对此不做限制。例如,为了增加待训练图像,还可以使用数据增强的方式,比如对采集到的图像添加随机噪声,或者对采集到的图像进行随机反转等方式。步骤102、针对所述待训练数据集中的各待训练图像,提取所述待训练图像的全局特征向量以及背景特征向量。在本实施方式中,获取到待训练数据集之后,为了能够通过待训练数据集对待训练模型进行训练,首先需要提取待训练数据集中待训练图像的特征信息。具体地,针对每一待训练图像,可以分别提取待训练图像的全局特征向量以及背景特征向量。可选地,可以一次性读取多张待训练图像进行特征提取本文档来自技高网...

【技术保护点】
1.一种图像识别方法,其特征在于,包括:/n获取待训练数据集,其中,所述待训练数据集中包括多张待训练图像;/n针对所述待训练数据集中的各待训练图像,提取所述待训练图像的全局特征向量以及背景特征向量;/n通过所述全局特征向量以及背景特征向量构造增量样本数据;/n根据所述增量样本数据确定损失函数,并通过所述损失函数对预设的待训练模型进行训练,获得图像识别模型;/n采用所述图像识别模型对预设的目标物体进行识别操作。/n

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:
获取待训练数据集,其中,所述待训练数据集中包括多张待训练图像;
针对所述待训练数据集中的各待训练图像,提取所述待训练图像的全局特征向量以及背景特征向量;
通过所述全局特征向量以及背景特征向量构造增量样本数据;
根据所述增量样本数据确定损失函数,并通过所述损失函数对预设的待训练模型进行训练,获得图像识别模型;
采用所述图像识别模型对预设的目标物体进行识别操作。


2.根据权利要求1所述的方法,其特征在于,所述提取所述待训练图像的全局特征向量以及背景特征向量,包括:
通过预设的第一特征提取层提取所述待训练图像的浅层特征向量;
通过预设的第二特征提取层提取所述浅层特征向量的全局特征向量;
通过预设的第三特征提取层提取所述浅层特征向量的背景特征向量;
其中,所述第二特征提取层与所述第三特征提取层为所述第一特征提取层下的两个支路特征提取层。


3.根据权利要求1或2所述的方法,其特征在于,所述通过所述全局特征向量以及背景特征向量构造增量样本数据,包括:
计算所述全局特征向量以及背景特征向量的差值,获得目标物体的特征向量;
将所述目标物体的特征向量分别与所述待训练数据集中各待训练图像的背景特征向量进行组合,获得所述目标物体在不同背景中的增量样本数据。


4.根据权利要求3所述的方法,其特征在于,所述待训练数据集中包括所述待训练图像对应的图像标识以及拍摄所述待训练图像的图像采集装置标识;
相应地,所述根据所述增量样本数据确定损失函数,包括:
通过拍摄所述待训练图像的图像采集装置标识对背景特征向量进行监督学习,获得第一分类损失函数;
通过预设的目标物体的标识对所述目标物体的特征向量进行监督学习,获得第二分类损失函数。


5.根据权利要求4所述的方法,其特征在于,所述通过所述损失函数对预设的待训练模型进行训练,包括:
对所述第一分类损失函数与所述第二分类损失函数进行加权计算,...

【专利技术属性】
技术研发人员:周康明戚风亮
申请(专利权)人:上海眼控科技股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1