图像处理方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号：31767890 阅读：44 留言：0更新日期：2022-01-05 16:53

本申请提供了一种图像处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品，应用于地图领域；方法包括：分别对第一图像和第二图像进行目标识别处理，得到第一图像中的多个检测框、以及第二图像中的多个检测框；针对第一图像和第二图像，交替进行相同图像中不同检测框的融合处理以及不同图像中不同检测框的融合处理，得到第一图像中每个检测框的特征以及第二图像中每个检测框的特征；基于第一图像中每个检测框的特征以及第二图像中每个检测框的特征，确定第一图像中任意一个检测框与第二图像中任意一个检测框的相似度；根据相似度生成对象识别结果。通过本申请，能够提高不同图像中待识别对象匹配的精度和效率。高不同图像中待识别对象匹配的精度和效率。高不同图像中待识别对象匹配的精度和效率。

全部详细技术资料下载

【技术实现步骤摘要】
图像处理方法、装置、电子设备及计算机可读存储介质

[0001]本申请涉及互联网和智慧交通
，尤其涉及一种图像处理方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着位置服务和导航应用的发展，能否提供实时准确的路网数据已经成为衡量地图服务水平高低的重要指标。例如，在一对拍摄地点相近，但拍摄时间、拍摄视角不同的道路场景图像中，找到同时出现的对象（例如交通元素，包括限速牌、交限牌、红绿灯、车道数、道路铺设状态等），是一个非常重要的任务。在基于视觉的道路数据自动化更新、高精地图、自动驾驶等领域中，可以依靠该技术减少人工核查工作量，达到降低成本、节约开支等效果。
[0003]然而，相关技术提供的方案通常是采用关键点检测与匹配的方式，计算投影矩阵等基于人工策略的方案来估计两张图像中出现的对象是否为同一个，该方案非常依赖于人工经验，存在匹配效率低、以及不灵活、不易调整等问题。

技术实现思路

[0004]本申请实施例提供一种图像处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品，能够...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法，其特征在于，所述方法包括：分别对第一图像和第二图像进行目标识别处理，得到所述第一图像中的多个检测框、以及所述第二图像中的多个检测框，其中，每个所述检测框包括待识别的对象；针对所述第一图像和所述第二图像，交替进行相同图像中不同检测框的融合处理以及不同图像中不同检测框的融合处理，得到所述第一图像中每个检测框的特征以及所述第二图像中每个检测框的特征；基于所述第一图像中每个检测框的特征以及所述第二图像中每个检测框的特征，确定所述第一图像中任意一个检测框与所述第二图像中任意一个检测框的相似度；根据所述相似度生成对象识别结果，其中，所述对象识别结果表征所述第一图像中任意一个检测框与所述第二图像中任意一个检测框是否包括相同的对象。2.根据权利要求1所述的方法，其特征在于，所述交替进行相同图像中不同检测框的融合处理以及不同图像中不同检测框的融合处理，得到所述第一图像中每个检测框的特征以及所述第二图像中每个检测框的特征，包括：迭代执行以下处理：将所述第一图像中每个检测框的特征与所述第一图像中其他检测框的特征进行融合处理，得到所述第一图像中每个检测框的更新的特征，并将所述第二图像中每个检测框的特征与所述第二图像中其他检测框的特征进行融合处理，得到所述第二图像中每个检测框的更新的特征；将所述第一图像中每个检测框的更新的特征与所述第二图像中每个检测框的更新的特征进行融合处理，得到所述第一图像中每个检测框的再次更新的特征，并将所述第二图像中每个检测框的更新的特征与所述第一图像中每个检测框的更新的特征进行融合处理，得到所述第二图像中每个检测框的再次更新的特征；其中，第一次迭代处理所使用的所述第一图像中每个检测框的特征，是从所述第一图像中每个检测框提取得到的初始特征，第一次迭代处理所使用的所述第二图像中每个检测框的特征，是从所述第二图像中每个检测框提取得到的初始特征；后续的迭代处理所使用的所述第一图像中每个检测框的特征是上一次迭代处理后更新的特征，后续的迭代处理所使用的所述第二图像中每个检测框的特征是上一次迭代处理后更新的特征。3.根据权利要求2所述的方法，其特征在于，所述方法还包括：通过以下方式获取第一次迭代处理所使用的所述第一图像中每个检测框的特征：提取所述第一图像的全局特征；提取所述第一图像中每个检测框的局部特征；基于所述第一图像的全局特征以及所述第一图像中每个检测框的局部特征进行连接处理，将得到的所述第一图像中每个检测框的初始特征，作为第一次迭代处理所使用的所述第一图像中每个检测框的特征。4.根据权利要求3所述的方法，其特征在于，所述基于所述第一图像的全局特征以及所述第一图像中每个检测框的局部特征进行连接处理，包括：针对所述第一图像中的每个检测框，执行以下处理：提取所述检测框在所述第一图像中的位置特征；提取所述检测框包括的待识别的对象的类别特征；
将所述检测框的局部特征、所述第一图像的全局特征、所述检测框在所述第一图像中的位置特征、以及所述检测框包括的待识别的对象的类别特征进行连接处理，得到所述检测框的初始特征。5.根据权利要求2所述的方法，其特征在于，所述将所述第一图像中每个检测框的特征与所述第一图像中其他检测框的特征进行融合处理，包括：针对所述第一图像中的每个检测框，执行以下处理：对所述检测框的特征进行全连接处理，得到对应的一个键向量和一个查询向量；基于所述检测框对应的键向量和查询向量、以及所述第一图像中其他检测框对应的键向量和查询向量，对所述检测框的特征和所述第一图像中其他检测框的特征进行加权求和处理，并将求和结果与偏置向量进行求和处理，得到所述检测框的更新的特征。6.根据权利要求5所述的方法，其特征在于，所述基于所述检测框对应的键向量和查询向量、以及所述第一图像中其他检测框对应的键向量和查询向量，对所述检测框的特征和所述第一图像中其他检测框的特征进行加权求和处理，包括：基于所述检测框对应的键向量和查询向量、以及所述第一图像中其他检测框对应的键向量和查询向量进行基于自注意力机制的编码处理，得到所述检测框、以及所述第一图像中其他检测框分别对应的权重；基于所述检测框、以及所述第一图像中其他检测框分别对应的...

【专利技术属性】
技术研发人员：佘加辉，谭川奇，唐逸之，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人