图像识别方法和装置制造方法及图纸

技术编号:21141950 阅读:21 留言:0更新日期:2019-05-18 05:24
本发明专利技术公开了一种图像识别方法和装置。其中,该方法包括:获取待识别图像;获取预先建立好的图像识别模型,其中,图像识别模型是通过多个训练集对初始模型进行训练得到的,初始模型是基于分支训练算法建立的识别模型,同一个训练集是从同一个数据集中提取得到的,不同训练集是从不同数据集中提取得到的;利用图像识别模型对待识别图像进行识别,得到识别结果。本发明专利技术解决了现有技术中图像识别方法的识别准确率低的技术问题。

Image Recognition Method and Device

【技术实现步骤摘要】
图像识别方法和装置
本专利技术涉及图像识别领域,具体而言,涉及一种图像识别方法和装置。
技术介绍
在现有的图像识别领域,特别主流的人脸识别领域中,主要通过图像识别模型进行识别,图像识别模型都是基于深度学习算法模型进行训练得到,深度学习模型训练的好坏对识别准确度的影响至关重要。而在整个深度学习模型训练过程中,用于训练的数据集又是重中之重,会对深度学习模型的最终算法性能产生决定性影响。目前,深度学习模型基本都是在单个训练数据集上进行,比如人脸识别领域中,训练数据集可以是在某个场景下采集到的人脸数据或者是从网上下载的公开人脸数据库。由于不同数据集之间可能覆盖到相同的人,而又由于不同数据集之间命名规则不统一,所以很难根据其文件名合并相同的人的人脸图片。而在进行人脸识别分类训练时,必须要求相同的人的人脸图片共享相同的标签类别号,所以导致无法同时利用多个可能出现人员交集的人脸数据集。仅仅基于单个训练数据集训练得到的深度学习模型,在图像识别中准确度低,无法满足不同应用场合的需求。针对现有技术中图像识别方法的识别准确率低的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种图像识别方法和装置,以至少解决现有技术中图像识别方法的识别准确率低的技术问题。根据本专利技术实施例的一个方面,提供了一种图像识别方法,包括:获取待识别图像;获取预先建立好的图像识别模型,其中,图像识别模型是通过多个训练集对初始模型进行训练得到的,初始模型是基于分支训练算法建立的识别模型,同一个训练集是从同一个数据集中提取得到的,不同训练集是从不同数据集中提取得到的;利用图像识别模型对待识别图像进行识别,得到识别结果。进一步地,上述方法还包括:获取多个数据集;对多个数据集中的每张图像进行分类,得到每张图像的标签,其中,标签用于表征每张图像的分类结果,多个数据集中包含的至少两张张图像的标签相同;从分类后的每个数据集中提取样本图像,得到多个训练集。进一步地,在从分类后的每个数据集中提取样本图像,得到多个训练集之前,上述方法还包括:提取分类后的每个数据集中的每张图像的预设特征;基于每张图像的预设特征,对每张图像进行对齐操作;从操作后的每个数据集中提取样本图像,得到多个训练集。进一步地,在每张图像为人脸图像的情况下,预设特征至少包括如下之一:眼睛、眉毛、鼻尖和嘴角。进一步地,从操作后的每个数据集中提取样本图像,得到多个训练集,包括:从操作后的每个数据集中随机提取样本图像;获取样本图像的存储路径和标签,得到多个训练集。进一步地,获取多个数据集,包括:获取采集设备采集到的视频图像和预设数据集;对视频图像和预设数据集进行检测,得到多个数据集。进一步地,上述方法还包括:基于分支训练算法建立初始模型,其中,初始模型至少包括:多个损失函数,多个损失函数与多个训练集是一一对应的;将多个训练集并行输入初始模型中,对初始模型进行训练;判断训练得到的模型是否满足预设条件;如果训练得到的模型满足预设条件,则确定训练得到的模型为图像识别模型。进一步地,将多个训练集并行输入初始模型中,对初始模型进行训练,包括:将多个训练集并行输入初始模型中,得到多个损失函数的函数值;根据多个损失函数的函数值和链式求导算法,得到初始模型中每个参数的梯度值;根据随机梯度下降算法对每个参数的梯度值进行更新,得到训练得到的模型。进一步地,判断训练得到的模型是否满足预设条件,包括:获取验证集;利用验证集对训练得到的模型进行验证,得到训练得到的模型的精度;判断训练得到的模型的精度与历史精度是否相同,其中,历史精度为训练得到的模型在上一次验证过程中得到的精度;如果训练得到的模型的精度与历史精度相同,则确定训练得到的模型满足预设条件。进一步地,如果训练得到的模型的精度与历史精度不同,则确定训练得到的模型的精度为历史精度,并继续对初始模型进行训练。进一步地,精度用于表征验证集中所有验证样本的验证结果之和与所有验证样本总数的比例。进一步地,获取验证集,包括:获取多个数据集中样本图像之外的其他图像;从其他图像中随机提取图像验证对,得到验证集。进一步地,图像验证对包括:正样本对和负样本对,正样本对包含两张标签相同的图像,负样本对包含两张标签不同的图像。进一步地,损失函数为平方损失函数。根据本专利技术实施例的另一方面,还提供了一种图像识别装置,包括:第一获取模块,用于获取待识别图像;第二获取模块,用于获取预先建立好的图像识别模型,其中,图像识别模型是通过多个训练集对初始模型进行训练得到的,初始模型是基于分支训练算法建立的识别模型,同一个训练集是从同一个数据集中提取得到的,不同训练集是从不同数据集中提取得到的;识别模块,用于利用图像识别模型对待识别图像进行识别,得到识别结果。根据本专利技术实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述的图像识别方法。根据本专利技术实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述的图像识别方法。在本专利技术实施例中,可以基于分支训练算法建立初始模型,并通过不同数据集生成的多个训练集对初始模型进行训练,得到图像识别模型,进一步通过图像识别模型对用户输入的待识别图像进行识别,得到最终的识别结果。与现有技术相比,结合了多个数据集的分支训练的图像识别模型比现有的基于单个数据集训练的图像识别模型的准确率更高,达到了提高识别准确率的技术效果,进而解决了现有技术中图像识别方法的识别准确率低的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种图像识别方法的流程图;图2是根据本专利技术实施例的一种可选的人脸图片的示意图;图3是根据本专利技术实施例的一种可选的对齐后的人脸图片的示意图;图4是根据本专利技术实施例的一种可选的基于单个数据集输入的人脸识别深度神经网络模型的示意图;图5是根据本专利技术实施例的一种可选的基于多个数据集输入的人脸识别深度神经网络模型的示意图;图6是根据本专利技术实施例的一种可选的图像识别方法的流程图;以及图7是根据本专利技术实施例的一种图像识别装置的示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。实施本文档来自技高网
...

【技术保护点】
1.一种图像识别方法,其特征在于,包括:获取待识别图像;获取预先建立好的图像识别模型,其中,所述图像识别模型是通过多个训练集对初始模型进行训练得到的,所述初始模型是基于分支训练算法建立的识别模型,同一个训练集是从同一个数据集中提取得到的,不同训练集是从不同数据集中提取得到的;利用所述图像识别模型对所述待识别图像进行识别,得到识别结果。

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:获取待识别图像;获取预先建立好的图像识别模型,其中,所述图像识别模型是通过多个训练集对初始模型进行训练得到的,所述初始模型是基于分支训练算法建立的识别模型,同一个训练集是从同一个数据集中提取得到的,不同训练集是从不同数据集中提取得到的;利用所述图像识别模型对所述待识别图像进行识别,得到识别结果。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取多个数据集;对所述多个数据集中的每张图像进行分类,得到所述每张图像的标签,其中,所述标签用于表征所述每张图像的分类结果,所述多个数据集中包含的至少两张张图像的标签相同;从分类后的每个数据集中提取样本图像,得到所述多个训练集。3.根据权利要求2所述的方法,其特征在于,在从分类后的每个数据集中提取所述样本图像,得到所述多个训练集之前,所述方法还包括:提取所述分类后的每个数据集中的每张图像的预设特征;基于所述每张图像的预设特征,对所述每张图像进行对齐操作;从操作后的每个数据集中提取所述样本图像,得到所述多个训练集。4.根据权利要求3所述的方法,其特征在于,在所述每张图像为人脸图像的情况下,所述预设特征至少包括如下之一:眼睛、眉毛、鼻尖和嘴角。5.根据权利要求3所述的方法,其特征在于,从操作后的每个数据集中提取所述样本图像,得到所述多个训练集,包括:从所述操作后的每个数据集中随机提取所述样本图像;获取所述样本图像的存储路径和标签,得到所述多个训练集。6.根据权利要求2所述的方法,其特征在于,获取多个数据集,包括:获取采集设备采集到的视频图像和预设数据集;对所述视频图像和所述预设数据集进行检测,得到所述多个数据集。7.根据权利要求2所述的方法,其特征在于,所述方法还包括:基于所述分支训练算法建立所述初始模型,其中,所述初始模型至少包括:多个损失函数,所述多个损失函数与所述多个训练集是一一对应的;将所述多个训练集并行输入所述初始模型中,对所述初始模型进行训练;判断训练得到的模型是否满足预设条件;如果所述训练得到的模型满足所述预设条件,则确定所述训练得到的模型为所述图像识别模型。8.根据权利要求7所述的方法,其特征在于,将所述多个训练集并行输入所述初始模型中,对所述初始模型进行训练,包括:将所述多个训练集并行输入所...

【专利技术属性】
技术研发人员:张玉兵
申请(专利权)人:广州视源电子科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1