图像检测方法和装置制造方法及图纸

技术编号:33351470 阅读:16 留言:0更新日期:2022-05-08 09:58
本公开提供了一种图像检测方法和装置,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于图像处理、图像检测等场景。实现方案为:将目标图像划分为多个图像块,其中,多个图像块中的目标图像块位于目标图像的目标区域中;对于多个图像块中的每一个图像块,获得该图像块对应于多个图像块的多个注意力关系值,该多个注意力关系值中的每一个注意力关系值指示该图像块与多个图像块中相应的图像块之间的相关程度;调整多个图像块中的每一个图像块对应的多个注意力关系值;以及基于调整后的多个图像中的每一个图像块对应的多个注意力关系值,获得目标图像对应的检测结果。结果。结果。

【技术实现步骤摘要】
图像检测方法和装置


[0001]本公开涉及人工智能
,尤其涉及具体为深度学习、计算机视觉
,可应用于图像处理、图像检测等场景,具体涉及一种图像检测方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术:人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]基于人工智能的图像处理技术,已经渗透到各个领域。其中,基于人工智能的人脸检测技术,根据用户输入的包含人脸的图像,识别该包含人脸的图像所对应的人。
[0004]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

[0005]本公开提供了一种图像检测方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0006]根据本公开的一方面,提供了一种图像检测方法,包括:将目标图像划分为多个图像块,其中,所述多个图像块中的目标图像块位于所述目标图像的目标区域中;对于所述多个图像块中的每一个图像块,获得该图像块对应于所述多个图像块的多个注意力关系值,该多个注意力关系值中的每一个注意力关系值指示该图像块与所述多个图像块中相应的图像块之间的相关程度;调整所述多个图像块中的每一个图像块对应的多个注意力关系值,以使该图像块对应的多个注意力关系值中的第一注意力关系值与第二注意力关系值之间的差距增大,所述第一注意力关系值与所述目标图像块对应,所述第二注意力关系值与所述多个图像块中的第一图像块对应,所述第一图像块位于所述目标图像中的区别于所述目标区域的第一区域中;以及基于调整后的所述多个图像中的每一个图像块对应的多个注意力关系值,获得所述目标图像对应的检测结果。
[0007]根据本公开的另一方面,提供了一种图像检测装置,包括:图像处理单元,被配置用于将目标图像划分为多个图像块,其中,所述多个图像块中的目标图像块位于所述目标图像的目标区域中;注意力关系值获取单元,被配置用于对于所述多个图像块中的每一个图像块,获得该图像块对应于所述多个图像块的多个注意力关系值,该多个注意力关系值中的每一个注意力关系值指示该图像块与所述多个图像块中相应的图像块之间的相关程度;注意力关系值调整单元,被配置用于调整所述多个图像块中的每一个图像块对应的多
个注意力关系值,以使该图像块对应的多个注意力关系值中的第一注意力关系值与第二注意力关系值之间的差距增大,所述第一注意力关系值与所述目标图像块对应,所述第二注意力关系值与所述多个图像块中的第一图像块对应,所述第一图像块位于所述目标图像中的区别于所述目标区域的第一区域中;以及分类单元,被配置用于基于调整后的所述多个图像中的每一个图像块对应的多个注意力关系值,获得所述目标图像对应的检测结果。
[0008]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器实现根据上述的方法。
[0009]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机实现根据上述的方法。
[0010]根据本公开的另一方面,提供了一种计算机程序产品包括计算机程序,其中,所述计算机程序在被处理器执行时实现根据上述的方法。
[0011]根据本公开的一个或多个实施例,在对目标图像进行检测的过程中,通过将目标图像划分为多个图像块,并基于多个图像块获得每一个图像与多个图像中的任一图像块之间的注意力(attention)关系值,并且调整每一个图像块对应的多个注意力关系值,使与目标区域的图像块相关的注意力关系值和与非目标区域中的图像块相关的注意力关系值之间的差距扩大,从而使获得目标图像对应的检测结果时,对所关注的区域可以分配更多的关注度,从而使检测结果更加准确。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
[0014]图1示出了根据本公开的实施例的可以在其中实施本文描述的各种方法的示例性系统的示意图;
[0015]图2示出了根据本公开的实施例的图像检测方法的流程图;
[0016]图3示出了根据本公开的实施例的图像检测方法中获得图像块对应于多个图像块的多个注意力关系值的过程的流程图;
[0017]图4示出了根据本公开的实施例的图像检测方法中调整多个图像块中的每一个图像块对应的多个注意力关系值的过程的流程图;
[0018]图5示出了根据一些实施例采用图像检测模型实现图像检测方法的示意图;
[0019]图6示出了根据本公开的实施例的用于训练图像检测模型的装置的结构框图;以及
[0020]图7示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。
具体实施方式
[0021]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0022]在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个元件与另一元件区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。
[0023]在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。
[0024]下面将结合附图详细描述本公开的实施例。
[0025]图1示出了根据本公开的实施例可以将本文描述的各种方法和装置本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像检测方法,包括:将目标图像划分为多个图像块,其中,所述多个图像块中的目标图像块位于所述目标图像的目标区域中;对于所述多个图像块中的每一个图像块,获得该图像块对应于所述多个图像块的多个注意力关系值,该多个注意力关系值中的每一个注意力关系值指示该图像块与所述多个图像块中相应的图像块之间的相关程度;调整所述多个图像块中的每一个图像块对应的多个注意力关系值,以使该图像块对应的多个注意力关系值中的第一注意力关系值与第二注意力关系值之间的差距增大,所述第一注意力关系值与所述目标图像块对应,所述第二注意力关系值与所述多个图像块中的第一图像块对应,所述第一图像块位于所述目标图像中的区别于所述目标区域的第一区域中;以及基于调整后的所述多个图像中的每一个图像块对应的多个注意力关系值,获得所述目标图像对应的检测结果。2.根据权利要求1所述的方法,其中,所述获得该图像块对应于所述多个图像块的多个注意力关系值包括:获得所述多个图像块中的每一个图像块的特征向量;计算该图像块的特征向量与所述多个图像块中的每一个图像块的特征向量之间的相似度值;以及基于该图像块对应的多个相似度值,获得该图像块对应的多个注意力关系值。3.根据权利要求2所述的方法,其中,所述调整所述多个图像块中的每一个图像块对应的多个注意力关系值包括:基于所述多个图像块中的每一个图像块对应的多个相似度值,获得相似度矩阵,所述相似度矩阵的行数和列数均与所述对个图像块的数量对应,所述相似度矩阵中的第i行的第j个元素V
ij
指示将所述多个图像块按顺序排列时,第i个图像块与第j个图像块之间的相似度值,其中,1≤i≤N,1≤j≤N,N指示所述多个图像的数量,并且i和j为正整数;以及基于预设比例值,缩放位于所述相似度矩阵的预设行和预设列中的多个元素的值,其中,所述预设行和预设列对应于将所述多个图像块按顺序排列时所述目标图像块在所述多个图像块中的排列顺序。4.根据权利要求3所述的方法,其中,所述目标区域与所述检测结果的相关程度较所述第一区域与所述检测结果的相关程度小,所述预设比例值大于0并且小于1。5.根据权利要求1

4任一项所述的方法,其中,所述目标图像为包括人脸的图像,所述目标图像块与所述目标图像中的人脸戴口罩时的口罩区域对应。6.根据权利要求3所述的方法,其中,所述目标区域与所述检测结果的相关程度较所述第一区域与所述检测结果的相关程度大,所述预设比例值大于1。7.一种图像检测装置,包括:图像处理单元,被配置用于将目标图像划分为多个图像块,其中,所述多个图像块中的目标图像块位于所述目标图像的目标区域中;注意力关系值获取单元,被配置用于对于所述多个图像块中的每一个图像块,获得该图像块对应于所述多个图像块的多个注意力关系值,该多个注意力关系值中的每一个注意
力关系值指示该图像块与所述多个图像块中相应的图像块之间的相关程度;注意力关...

【专利技术属性】
技术研发人员:王健韩钧宇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1