图像生成、图像分割方法、装置、设备、车载终端及介质制造方法及图纸

技术编号:37149386 阅读:10 留言:0更新日期:2023-04-06 22:03
本公开提供了一种图像生成、图像分割方法、装置、设备、车载终端及介质,涉及人工智能技术领域,具体为计算机视觉、图像处理、深度学习等技术领域,可应用于自动驾驶、智慧城市等场景。具体实现方案为:根据在多视角下采集的环视图像,生成与每个视角分别对应的多尺度特征图;将每个视角下的第一特征图进行跨视角转换,生成第一俯视图;在每个视角下的至少一个第二分辨率下的第二特征图中,采样得到第一俯视图中每个网格单元在至少一个第二分辨率下的采样点特征;根据第一俯视图和各采样点特征,融合得到第二俯视图。本公开的技术方案可以在低计算成本的前提下,生成高精度的俯视图。图。图。

【技术实现步骤摘要】
图像生成、图像分割方法、装置、设备、车载终端及介质


[0001]本公开涉及人工智能
,具体涉及计算机视觉、图像处理、深度学习等
,可应用于自动驾驶、智慧城市等场景,尤其涉及一种图像生成方法、图像分割方法、图像生成装置、图像分割装置、电子设备、车载终端及非瞬时计算机可读存储介质。

技术介绍

[0002]自动驾驶中的感知识别任务本质上是对物理世界的三维几何重建。随着自动驾驶汽车装备传感器的多样性和数量越来越复杂,以统一的视角表示不同视角的特征变得至关重要。
[0003]鸟瞰图(BEV,Bird's Eye View),也称为俯视图,作为一种自然而直接的统一表示方式,在自动驾驶的感知和预测领域的应用越来越广泛。
[0004]相关技术在获取高分辨率的鸟瞰图时,需要耗费昂贵的计算代价,无法满足人们对低成本和即时感知两方面的双重要求。

技术实现思路

[0005]本公开提供了一种图像生成方法、图像分割方法、图像生成装置、图像分割装置、电子设备、车载终端及非瞬时计算机可读存储介质。
[0006]根据本公开的一方面,提供了一种图像生成方法,包括:根据在多视角下采集的环视图像,生成与每个视角分别对应的多尺度特征图,多尺度特征图包括第一分辨率下的第一特征图,和至少一个第二分辨率下的第二特征图,第二分辨率高于第一分辨率;将每个视角下的第一特征图进行跨视角转换,生成第一俯视图;在每个视角下的至少一个第二分辨率下的第二特征图中,采样得到第一俯视图中每个网格单元在至少一个第二分辨率下的采样点特征;根据第一俯视图和各采样点特征,融合得到第二俯视图。
[0007]根据本公开的另一方面,提供了一种图像分割方法,包括:通过多个环视相机采集多视角下的多张环视图像;通过如本公开任意实施例所述的图像生成方法,将多张环视图像融合得到第二俯视图;对第二俯视图进行语义分割,获取第二俯视图中每个网格单元的类别识别结果。
[0008]根据本公开的另一方面,提供了一种图像生成装置,包括:多尺度特征图获取模块,用于根据在多视角下采集的多张环视图像,生成与每个视角分别对应的多尺度特征图,多尺度特征图包括第一分辨率下的第一特征图,和至少一个第二分辨率下的第二特征图,第二分辨率高于第一分辨率;第一俯视图生成模块,用于将每个视角下的第一特征图进行跨视角转换,生成第一俯视图;
采样模块,用于在每个视角下的至少一个第二分辨率下的第二特征图中,采样得到第一俯视图中每个网格单元在至少一个第二分辨率下的采样点特征;第二俯视图融合模块,用于根据第一俯视图和各采样点特征,融合得到第二俯视图。
[0009]根据本公开的另一方面,提供了一种图像分割装置,包括:环视图像获取模块,用于通过多个环视相机采集多视角下的多张环视图像;融合模块,用于通过如本公开任意实施例所述的图像生成方法,将多张环视图像融合得到第二俯视图;识别模块,用于对第二俯视图进行语义分割,获取第二俯视图中每个网格单元的类别识别结果。
[0010]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如本公开任一项所述的图像生成方法。
[0011]根据本公开的另一方面,提供了一种车载终端,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如本公开任一项所述的图像分割方法根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行本公开任一项所述的图像生成方法,或者,执行本公开任一项所述的图像分割方法。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]附图用于更好地理解本方案,不构成对本公开的限定。其中:图1是根据本公开实施例提供的一种图像生成方法的示意图;图2a是根据本公开实施例提供的另一种图像生成方法的示意图;图2b是本公开实施例所适用的一种采用多头注意力机制,迭代生成第一俯视图的流程图;图3是根据本公开实施例提供的又一种图像生成方法的示意图;图4a是根据本公开实施例提供的再一种图像生成方法的示意图;图4b是本公开实施例所适用的一种解码模块集合的串接示意图;图4c是本公开实施例所适用的一种解码模块内的逻辑运算示意图;图5a是本公开实施例提供的一种图像分割方法的示意图;图5b是可以实现本公开实施例提供的一种图像分割方法的功能模块图;图6是根据本公开实施例提供的一种图像生成装置的结构图;
图7是根据本公开实施例提供的一种图像分割装置的结构图;图8是用来实现本公开实施例的一种图像生成方法的电子设备的框图,或者,用来实现本公开实施例的一种图像分割方法的车载终端的框图。
具体实施方式
[0014]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0015]图1是根据本公开实施例提供的一种图像生成方法的流程图。本公开实施例可适用于使用多张环视视角下采集的环视图像生成俯视视角下的俯视图的情况。该方法可以由图像生成装置来执行,该装置可采用硬件和/或软件的方式实现,并一般可以集成在具有数据处理功能的终端或者服务器中。
[0016]如图1所示,本公开实施例提供的一种图像生成方法包括以下具体步骤:S110、根据在多视角下采集的环视图像,生成与每个视角分别对应的多尺度特征图。
[0017]其中,多尺度特征图包括第一分辨率下的第一特征图,和至少一个第二分辨率下的第二特征图,第二分辨率高于第一分辨率。
[0018]在本实施例中,环视图像为在多个环视的视角下分别采集到的多张图像,其中,多个环视的视角可以理解为以设定的定点为中心,在该定点的前、后、左、右等连续的方向上选择多个视角点进行拍摄,以获取等同于从该定点环视360度的多张环视图像。相应的,在一个视角下,可以采集得到一张设定环视范围的环视图像。
[0019]多尺度特征图可以理解为对一张环视图像进行图多尺度像特征的提取,得到多个不同分辨率下的特征图。
[0020]其中,多尺度特征图可以进一步细分为第一分辨率下的第一特征图,和至少一个第二分辨率下的第二特征图。其中,第一分辨率可以理解为多尺度特征图中所包含的各分辨率下的最低分辨率。第二分辨率可以理解为多尺度特征图中所包含的各分辨率下的高于该最低分辨率的全部分辨率。
[0021]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像生成方法,包括:根据在多视角下采集的环视图像,生成与每个视角分别对应的多尺度特征图,多尺度特征图包括第一分辨率下的第一特征图,和至少一个第二分辨率下的第二特征图,第二分辨率高于第一分辨率;将每个视角下的第一特征图进行跨视角转换,生成第一俯视图;在每个视角下的至少一个第二分辨率下的第二特征图中,采样得到第一俯视图中每个网格单元在至少一个第二分辨率下的采样点特征;根据第一俯视图和各采样点特征,融合得到第二俯视图。2.根据权利要求1所述的方法,其中,根据在多视角下采集的环视图像,生成与每个视角分别对应的多尺度特征图,包括:获取在多视角下分别采集到的多张环视图像;对每个视角下的环视图像分别进行多尺度特征提取,获取每张环视图像在多个分辨率下的特征图,作为与每个视角分别对应的多尺度特征图。3.根据权利要求1所述的方法,将每个视角下的第一特征图进行跨视角转换,生成第一俯视图,包括:生成与每个视角下的第一特征图分别对应的第一全局特征和第二全局特征;根据各第一全局特征、各第二全局特征和用于描述图像空间和俯视空间之间位置关系的位置编码值,采用多头注意力机制,迭代生成第一俯视图。4.根据权利要求3所述的方法,其中,生成与每个视角下的第一特征图分别对应的第一全局特征和第二全局特征,包括:通过第一全连接网络,生成与每个视角下的第一特征图分别对应的第一全局特征;通过第二全连接网络,生成与每个视角下的第一特征图分别对应的第二全局特征。5.根据权利要求3所述的方法,其中,根据各第一全局特征、各第二全局特征和用于描述图像空间和俯视空间之间位置关系的位置编码值,采用多头注意力机制,迭代生成第一俯视图,包括:根据与每个视角分别对应的第一全局特征、与每个视角分别对应的相机编码值和预设的像素位置编码值,确定应用于多头注意力网络中的各目标键名参数;根据与每个视角分别对应的第二全局特征,确定应用于多头注意力网络中的各目标键值参数;根据各目标键名参数、各目标键值参数、预设的俯视空间中的网格单元位置编码值,采用多头注意力网络,迭代生成第一俯视图。6.根据权利要求5所述的方法,其中,根据各目标键名参数、各目标键值参数、预设的俯视空间中的网格单元位置编码值,采用多头注意力网络,迭代生成第一俯视图,包括:在每个迭代轮次下,获取前一轮次迭代得到的第一俯视图作为历史俯视图;根据历史俯视图和俯视空间中的网格单元位置编码值,计算得到应用于多头注意力网络中的目标查询参数;采用多头注意力网络,根据各目标键名参数、各目标键值参数和目标查询参数,计算得到当前迭代轮次下的第一俯视图。7.根据权利要求1所述的方法,其中,在每个视角下的至少一个第二分辨率下的第二特
征图中,采样得到第一俯视图中每个网格单元在至少一个第二分辨率下的采样点特征,包括:获取与第一俯视图中每个网格单元分别对应的地理区域范围,并在每个地理区域范围内分别选取多个关键点;将每个地理区域范围内的各关键点投影至各视角下的至少一个第二分辨率下的第二特征图中,得到每个关键点在至少一个第二分辨率下的采样点特征;汇总隶属于同一网格单元的各关键点在同一第二分辨率下的采样点特征,得到第一俯视图中每个网格单元在至少一个第二分辨率下的采样点特征。8.根据权利要求7所述的方法,其中,获取与第一俯视图中每个网格单元分别对应的地理区域范围,包括:获取第一俯视图中的每个网格单元的平面矩形位置范围;根据各平面矩形位置范围和预设的高度值,形成与每个网格单元分别对应的立方体区域范围。9.根据权利要求8所述的方法,其中,在每个地理区域范围内分别选取多个关键点,包括:在每个地理区域范围内,选取预设数量的球状邻域点作为关键点。10.根据权利要求7所述的方法,其中,将每个地理区域范围内的各关键点投影至各视角下的至少一个第二分辨率下的第二特征图中,得到每个关键点在至少一个第二分辨率下的采样点特征,包括:获取当前处理地理区域范围内的当前关键点的地理位置坐标;根据所述地理位置坐标,识别能够拍摄到当前关键点的至少一个目标视角;根据当前关键点在各目标视角下的至少一个第二分辨率下的第二特征图中的当前投影位置,得到当前关键点在至少一个第二分辨率下的采样点特征。11.根据权利要求10所述的方法,其中,根据所述地理位置坐标,识别能够拍摄到当前关键点的至少一个目标视角,包括:根据所述地理位置信息和各视角的相机投影矩阵,获取当前关键点在各视角下的投影位置;如果当前关键点在当前视角下的投影位置位于当前视角的图像范围内,则将当前视角确定为目标视角。12.根据权利要求10所述的方法,其中,根据当前关键点在各目标视角下的至少一个第二分辨率下的第二特征图中的当前投影位置,得到当前关键点在至少一个第二分辨率下的采样点特征,包括:如果当前关键点在当前目标视角下的当前第二分辨率下的当前第二特征图中的当前投影位置命中当前第二特征图中的当前特征点,则将当前特征点的特征,作为当前关键点在当前第二分辨率下的备选特征;如果当前关键点在当前第二特征图中的当前投影位置未命中当前第二特征图中的任一特征点,则插值得到当前投影位置处的特征,作为当前关键点在当前第二分辨率下的备选特征;根据当前关键点在各目标视角下获取的备选特征,得到当前关键点在当前第二分辨率
下的采样点特征。13.根据权利要求12所述的方法,其中,根据当前关键点在各目标视角下获取的备选特征,得到当前关键点在当前第二分辨率下的采样点特征,包括:如果获取的备选特征的数量为多个,则对各备选特征进行池化处理,得到当前关键点在当前第二分辨率下的采样点特征。14.根据权利要求1所述的方法,其中,根据第一俯视图和各采样点特征,融合得到第二俯视图,包括:将第一俯视图和至少一个第二分辨率下的各采样点特征,共同输入至解码模块集合中;其中,解码模块集合中串接设定数量的解码模块,且解码模块的串接数量与第二分辨率的数量相匹配;通过每个解码模块,根据当前输入俯视图和当前输入的目标第二分辨率下的各采样点特征,融合得到新的俯视图并输出;获取末位的解码模块的输出俯视图作为第二俯视图。15.根据权利要求14所述的方法,其中,将第一俯视图和至少一个第二分辨率下的各采样点特征,共同输入至解码模块集合中,包括:将第一俯视图输入至解码模块集合中的首个解码模块;将每个第二分辨率下的各采样点特征,按照第二分辨率由低到高的顺序,沿解码模块串接方向分别输入至不同的解码模块中。16.根据权利要求15所述的方法,其中,通过每个解码模块,根据当前输入俯视图和当前输入的目标第二分辨率下的各采样点特征,融合得到新的俯视图并输出,包括:通过每个解码模块对当前输入俯视图按照目标第二分辨率进行尺度调整,得到调整后俯视图;根据调整后俯视图,生成第一权重图;根据第一权重图对当前输入的目标第二分辨率下的各采样点特征进行加权处理,得到采样点加权特征;将调整后俯视图与采样点加权特征进行融合,得到新的俯视图并输出。17.根据权利要求16所述的方法,其中,通过每个解码模块对当前输入俯视图按照目标第二分辨率进行尺度调整,得到调整后俯视图,包括:按照目标第二分辨率对当前输入俯视图进行卷积和插值处理,得到调整后俯视图。18.根据权利要求16所述的方法,其中,根据调整后俯视图,生成第一权重图,包括:将调整后俯视图依次输入至第一目标全连接网络和第一逻辑回归网络,生成第一权重图。19.根据权利要求16所述的方法,在根据第一权重图对当前输入的目标第二分辨率下的各采样点特征进行加权处理,得到采样点加权特征之后,还包括:按照调整后俯视图的特征通道数量,对采样点加权特征的特征通道数量进行调整。20.根据权利要求19所述的方法,其中,将调整后俯视图与采样点加权特征进行融合,得到新的俯视图并输出,包括:生成与调整后俯视图对应的第一键名参数和第一键值参数;
生成与采样点加权特征对应的第二键名参数和第二键值参数;根据第一键名参数和第二键名参数,生成第二权重图和第三权重图;根据第二权重图和第三权重图,对第一键值参数和第二键值参数进行加权求和,并采用预设的激活函数对加权求和结果进行处理,得到新的俯视图并输出。21.根据权利要求20所述的方法,其中,生成与调整后俯视图对应的第一键名参数和第一键值参数,包括:将调整后俯视图依次输入至第二目标全连接网络、第一贝叶斯网络和第一激活网络,生成第一键名参数;将调整后俯视图依次输入至第三目标全连接网络和第二贝叶斯网络,生成第一键值参数;生成与采样点加权特征对应的第二键名参数和第二键值参数,包括:将采样点加权特征依次输入至第四目标全连接网络、第三贝叶斯网络和第二激活网络,生成第二键名参数;将采样点加权特征依次输入至第五目标全连接网络和第四贝叶斯网络,生成第二键值参数。22.根据权利要求20所述的方法,其中,根据第一键名参数和第二键名参数,生成第二权重图和第三权重图,包括:对第一键名参数和第二键名参数进行特征拼接,得到拼接键名参数;将拼接键名参数依次输入至第六目标全连接网络和第二逻辑回归网络,生成组合权重图;在组合权重图中分别提取第二权重图和第三权重图。23.根据权利要求1

22任一项所述的方法,在根据第一俯视图和各采样点特征,融合得到第二俯视图之后,还包括:对第二俯视图进行语义分割,获取第二俯视图中每个网格单元的类别识别结果。24.一种图像分割方法,包括:通过多个环视相机采集多视角下的多张环视图像;通过如权利要求1
‑<...

【专利技术属性】
技术研发人员:龚石叶晓青蒋旻悦谭啸王海峰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1