图像识别方法技术

技术编号:39500737 阅读:10 留言:0更新日期:2023-11-24 11:31
本申请公开了图像识别方法

【技术实现步骤摘要】
图像识别方法、识别模型的训练方法、装置、设备、介质


[0001]本申请一般涉及计算机
,具体涉及图像识别
,尤其涉及一种图像识别方法

识别模型的训练方法

装置

设备

介质


技术介绍

[0002]随着计算机网络的不断发展,图像识别技术渗透于日常生活的方方面面

在图像识别的过程中,由于某些物体自身属性的原因,使得在图像中呈现出的边界十分的模糊,这就对该物体的图像识别造成了一定的难度,同时也对识别方法提出了更高的要求

[0003]现有的技术方案通常是将图像中需要识别的对象作为一个整体来直接识别,但由于其难以有效区分出对象的边界,导致识别出的对象往往无法准确表现出物体在图像中所呈现出的实际形状


技术实现思路

[0004]鉴于现有技术中的上述缺陷或不足,期望提供一种图像识别方法

识别模型的训练方法

装置

设备

介质,能够有效区分出图像中待识别对象的边界

[0005]第一方面,本申请提供了一种图像识别方法,该方法包括:获取待识别图像,利用识别模型,对待识别图像进行特征提取,得到待识别图像中待识别对象的表达特征;表达特征包括图像中对象的语义特征以及纹理特征;根据待识别对象的语义特征确定待识别对象的内部特征,根据待识别对象的纹理特征确定待识别对象的边界特征;边界特征用于表征图像中对象的轮廓,内部特征用于表征轮廓内的区域;根据待识别对象的表达特征

内部特征和边界特征,得到对待识别对象的识别结果

[0006]第二方面,本申请提供了一种识别模型的训练方法,该方法包括:获取训练样本集,训练样本集中包含具有目标对象的多个样本图像;针对每一图像样本,利用初始识别模型,对样本图像进行特征提取,得到目标对象的表达特征;表达特征包括图像中对象的语义特征以及纹理特征;根据目标对象的语义特征确定目标对象的内部特征,根据目标对象的纹理特征确定目标对象的边界特征;边界特征用于表征对象的轮廓,内部特征用于表征轮廓内的区域;根据目标对象的表达特征

内部特征和边界特征,得到对目标对象的识别结果;根据目标对象的内部特征

边界特征和识别结果,以损失函数最小为目的,对初始识别模型进行迭代训练,得到识别模型

[0007]第三方面,本申请提供了一种图像识别装置,该图像识别装置包括:
[0008]获取模块,用于获取待识别图像

[0009]特征提取模块,用于利用识别模型,对待识别图像进行特征提取,得到待识别图像中待识别对象的表达特征;表达特征包括图像中对象的语义特征以及纹理特征

[0010]融合模块,用于根据待识别对象的语义特征确定待识别对象的内部特征,根据待识别对象的纹理特征确定待识别对象的边界特征;边界特征用于表征图像中对象的轮廓,内部特征用于表征轮廓内的区域

[0011]识别模块,用于根据待识别对象的表达特征

内部特征和边界特征,得到对待识别对象的识别结果

[0012]第四方面,本申请实施例提供了一种识别模型的训练装置,该识别模型的训练装置包括:
[0013]获取模块,用于获取训练样本集,训练样本集中包含具有目标对象的多个样本图像

[0014]特征提取模块,用于针对每一图像样本,利用初始识别模型,对样本图像进行特征提取,得到目标对象的表达特征;表达特征包括图像中对象的语义特征以及纹理特征

[0015]融合模块,用于根据目标对象的语义特征确定目标对象的内部特征,根据目标对象的纹理特征确定目标对象的边界特征;边界特征用于表征对象的轮廓,内部特征用于表征轮廓内的区域

[0016]识别模块,用于根据目标对象的表达特征

内部特征和边界特征,得到对目标对象的识别结果

[0017]迭代训练模块,用于根据目标对象的内部特征

边界特征和识别结果,以损失函数最小为目的,对初始识别模型进行迭代训练,得到识别模型

[0018]第五方面,本申请实施例提供了一种计算机设备,包括存储器

处理器以及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现如本申请实施例描述的方法

[0019]第六方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例描述的方法

[0020]第七方面,本申请实施例提供一种计算机程序产品,该计算机程序产品包括指令,当该指令被运行时,使得如本申请实施例描述的方法被执行

[0021]本申请提出的图像识别方法

识别模型的训练方法

装置

设备

介质,为了解决现有技术中难以有效区分图像中需要识别的对象的边界问题,引入了对象的轮廓信息这一思想,在对图像的对象进行识别的过程中,主要分为两个任务,一是确定该对象的轮廓,二是确定轮廓内的区域

具体是利用识别模型对获取到的图像
(
即待识别图像
)
进行特征提取,得到该图像中对象
(
即待识别对象
)
的表达特征,通过该对象的表达特征所包含的语义特征确定其内部特征,以及通过该对象的表达特征所包含的纹理特征确定其边界特征,由于边界特征能够表征该对象在图像中的轮廓,而内部特征能够表征该对象的轮廓内的区域

因此,可通过边界特征和内部特征来缓解图像中靠近对象边界处的像素点难以识别的问题,以便为图像中对象的边界识别提供可靠的依据,同时为后续的图像识别任务提供强有力的数据支持

最后,利用表达特征

边界特征以及内部特征这一多特征结合的方式,综合对图像中的对象进行识别,以得到该对象的识别结果

因此,可以看出,本申请能够有效的区分出需要识别对象的边界,提高了对象识别的准确性,使得识别出的对象能够更加贴合物体在图像中所呈现出的实际形状

[0022]本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到

附图说明
[0023]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征

目的和优点将会变得更明显:
[0024]图1为本申请实施例提供的一种图像识别系统的结构示意图;
[0025]图2为本申请实施例提供的一种图像识别方法的流程示意图;
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种图像识别方法,其特征在于,包括:获取待识别图像,利用识别模型,对所述待识别图像进行特征提取,得到所述待识别图像中待识别对象的表达特征;所述表达特征包括图像中对象的语义特征以及纹理特征;根据所述待识别对象的所述语义特征确定所述待识别对象的内部特征,根据所述待识别对象的所述纹理特征确定所述待识别对象的边界特征;所述边界特征用于表征图像中对象的轮廓,所述内部特征用于表征所述轮廓内的区域;根据所述待识别对象的所述表达特征

所述内部特征和所述边界特征,得到对所述待识别对象的识别结果
。2.
根据权利要求1所述的图像识别方法,其特征在于,所述表达特征还包括所述待识别对象的多尺度特征,所述多尺度特征是基于不同的感受野对所述待识别图像进行特征提取获得的,所述根据所述待识别对象的所述语义特征确定所述待识别对象的内部特征,根据所述待识别对象的所述纹理特征确定所述待识别对象的边界特征,包括:对所述待识别对象的所述语义特征和所述多尺度特征进行融合,得到所述内部特征;对所述待识别对象的所述纹理特征和所述多尺度特征进行融合,得到所述边界特征
。3.
根据权利要求2所述的图像识别方法,其特征在于,所述对所述待识别图像进行特征提取,得到所述待识别图像中待识别对象的表达特征,包括:对所述待识别图像进行表面特征提取,得到所述待识别对象的纹理特征;对所述待识别对象的纹理特征进行深度特征提取,得到所述待识别对象的语义特征以及所述多尺度特征
。4.
根据权利要求3所述的图像识别方法,其特征在于,所述对所述待识别对象的纹理特征进行深度特征提取,得到所述待识别对象的语义特征以及所述多尺度特征,包括:对所述待识别对象的纹理特征进行语义特征提取,得到所述待识别对象的所述语义特征;根据至少两个空洞率确定至少两个感受野,基于所述至少两个感受野对所述待识别对象的语义特征进行多尺度特征提取,得到所述待识别对象的所述多尺度特征
。5.
根据权利要求1‑4任一项所述的图像识别方法,其特征在于,所述根据所述待识别对象的所述表达特征

所述内部特征和所述边界特征,得到对所述待识别对象的识别结果,包括:对所述待识别对象的所述内部特征和所述边界特征进行融合处理,得到所述待识别对象的第一预测图;所述第一预测图为标注图像中对象的二值化图像;对所述待识别对象的所述表达特征

所述内部特征和所述边界特征进行融合处理,得到所述待识别对象的第二预测图;所述第二预测图用于表征所述图像中对象的类别;根据所述待识别对象的所述第一预测图和所述第二预测图,得到对所述待识别对象的所述识别结果
。6.
根据权利要求1‑5任一项所述的图像识别方法,其特征在于,所述识别模型的训练过程包括:基于训练样本集,以损失函数最小为目标进行模型训练,得到所述识别模型;所述训练样本集中包含具有目标对象的多个样本图像;其中,所述损失函数包括:内部损失

边界损失

识别损失;所述内部损失用于表征利用
初始识别模型对所述样本图像进行特征提取得到的所述目标对象的内部特征与内部标签特征之间的差异;所述边界损失用于表征利用所述初始识别模型对所述样本图像进行特征提取得到的所述目标对象的边界特征与边界标签特征之间的差异;所述识别损失用于表征利用所述初始识别模型输出的所述目标对象的识别结果与识别标签之间的差异;所述初始识别模型为未训练好的识别模型
。7.
根据权利要求6所述的图像识别方法,其特征在于,所述损失函数还包括:二值化损失;所述二值化损失用于表征利用所述初始识别模型对所述目标对象的所述内部损失和所述边界损失进行融合处理得到的所述目标对象的第一预测图与二值化标签图之间的差异
。8.
根据权利要求7所述的图像识别方法,其特征在于,所述方法还包括:根据所述目标对象的所述二值化标签图中的前景和背景,得到所述目标对象的所述边界标签特征和所述内部标签特征;所述前景用于表征所述样本图像中所述目标对象所在的区域
。9.
根据权利要求8所述的图像识别方法,其特征在于,所述根据所述目标对象的所述二值化标签图中前景和背景,得到所述目标对象的所述边界标签特征和所述内部标签特征;包括:针对所述前景中的每一前景像素点,确定与所述前景像素点距离最近的背景像素点,并将所述距离作为所述前景像素点新的像素值;对所有前景像素点新的像素值与所述二值化标签图进行融合处理,得到所述目标对象的所述边界标签特征和所述内部标签特征
。10.
根据权利要求6‑9任一项所述的图像识别方法,其特征在于,所述目标对象对应的实体对象具有反光属性
。11.
一种识别模型的训练方法,其特征在于,包括:获取训练样本集,所述训练样本集中包含具有目标对象的多个样本图像;针对每一图像样本,利用初始识别模型,对所述样本图像进行特征提取,得到所述目标对象的表达特征;所述表达特征包括所述图像中对象的语义特征以及纹理特征;根据所述目标对象的所述语义...

【专利技术属性】
技术研发人员:王昌安
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1