【技术实现步骤摘要】
一种基于复杂背景图像的三维模型跨域检索方法及系统
本专利技术涉及计算机图形学和计算机视觉领域,特别是涉及一种基于复杂背景图像的三维模型跨域检索方法及系统。
技术介绍
信息时代的到来为计算机硬件的发展提供了强大的助力,各种媒体数据如音频、视频、图像、三维数据等呈井喷式增长。如今,三维模型被广泛应用于计算机图形学和计算机视觉等领域,如3D打印、计算机辅助设计、影视动画、医学诊断等。为了与众多应用涉及的庞大且不断增长的三维数据相适应,设计快速有效的三维模型检索方法成为了目前的热点问题。目前的检索工作大多属于基于实例的三维模型检索,这种方法需要提供一个待查询的三维模型,通过将三维模型用体素、点云、网格或者多视图的方法进行表示,提取特征描述符,并与三维模型库中的模型特征描述符进行相似度比较返回相似的三维模型。基于实例的三维模型检索属于同域检索问题,由于三维模型包含更多的特征信息,因此其准确率要更高一些。但是在现实生活中,用于查询的三维模型往往并不容易获取,相比之下,二维图像的获取在实际应用中较为方便,因此,基于单个二维图像检索三维模型具有重要的研究意义和使用价值。基于二维图像检索三维模型属于跨域检索问题,其输入可以是RGB图像、手绘草图和RGB-D图像,输出为与图像对应的三维模型。目前的相关研究可以分为传统的基于手工特征的模型检索方法和基于深度学习特征的模型检索方法。基于手工特征方法的思想是分别对图像和三维模型通过手工设计的方式获取其底层描述符,再通过计算距离等方式进行相似性度量。如基于特征袋模型的方法(Bro ...
【技术保护点】
1.一种基于复杂背景图像的三维模型跨域检索方法,其特征在于,所述方法包括如下步骤:/n步骤1)构建原始数据集D,所述原始数据集包括若干不同的三维模型M与具有复杂背景的图像I,所述原始数据集D以三元组T=(I
【技术特征摘要】
1.一种基于复杂背景图像的三维模型跨域检索方法,其特征在于,所述方法包括如下步骤:
步骤1)构建原始数据集D,所述原始数据集包括若干不同的三维模型M与具有复杂背景的图像I,所述原始数据集D以三元组T=(IA,Mpos,Mneg)表示,其中IA表示作为Anchor的图像,Mpos表示与所述图像IA同类的正类三维模型,Mneg表示与所述图像IA异类的反类三维模型;
步骤2)对所述三元组T中的所述图像IA进行预处理得到处理后的图像I′A,对所述三元组T中的所述正类三维模型Mpos与所述反类三维模型Mneg分别进行投影处理得到所述正类三维模型投影视图组Vpos与所述反类三维模型投影视图组Vneg,再分别进行预处理得到处理后的正类三维模型投影视图组V′pos与反类三维模型投影视图组V′neg,得到处理后的三元组T′=(I′A,V′pos,V′neg)表示的标准数据集D′;
步骤3)针对所述处理后的三元组T′,构建跨域检索三元组深度网络模型N,所述跨域检索三元组深度网络包含3个分支网络,分别为1个图像精确特征提取网络NI与结构相同、权值共享的2个三维模型分组视图特征提取网络NM,其中所述图像精确特征提取网络NI的输入为所述处理后的三元组T′中的所述处理后的图像I′A,输出为图像特征向量所述三维模型分组视图特征提取网络NM的输入分别为所述处理后的三元组T′中的所述处理后的正类三维模型投影视图组V′pos与反类三维模型投影视图组V′neg,输出分别为正类三维模型特征向量与反类三维模型特征向量
所述图像精确特征提取网络为包含注意力块的AlexNet网络,所述网络包含5个卷积层和3个全连接层,所述注意力块位于每两个前后连接的卷积层之间,由1个通道注意力模块和1个空间注意力模块串联组成;
所述三维模型分组视图特征提取网络以AlexNet网络的卷积结构为基础网络并包含分组子网络,所述三维模型分组视图特征提取网络包含AlexNet网络的全部卷积层共5个,在最后1个所述卷积层后连接所述分组子网络,在最后1个所述卷积层输出视图特征向量后,所述分组子网络将所述视图特征向量融合为组级特征向量、再将所述组级特征向量融合为形状级特征向量、最后将所述形状级特征向量融合为所述三维模型特征向量并输出;
步骤4)对所述图像特征向量所述正类三维模型特征向量与所述反类三维模型特征向量进行正则化处理,得到所述正则化后的图像特征向量所述正类三维模型特征向量与所述反类三维模型特征向量定义所述跨域检索三元组深度网络模型N的损失函数L;
步骤5)使用所述处理后的三元组T′,迭代训练跨域检索三元组深度网络模型N的参数,直至所述损失函数L小于设定阈值停止训练,得到已训练的跨域检索三元组深度网络模型N′,完成所述图像IA与所述三维模型M的特征联合嵌入空间构建,所述已训练的跨域检索三元组深度网络模型N′包含3个已训练的分支网络,分别为一个已训练的图像精确特征提取网络N′I与两个已训练的三维模型分组视图特征提取网络N′M;
步骤6)执行检索任务时,给定查询图像q与目标三维模型集S,对所述查询数据q进行所述预处理得到处理后的查询图像q′,对所述目标三维数据集S中的每个目标三维模型Si进行所述投影处理得到所述三维模型投影视图组SVi,再进行所述预处理得到处理后的三维模型投影视图组SV′i,将所述处理后的查询图像q′输入已训练的图像精确特征提取网络N′I中,输出得到所述查询图像q对应的图像特征向量Fq,进行正则化处理后得到正则化后的图像特征向量F′q,将所述处理后的投影视图组SV′i输入已训练的三维模型分组视图特征提取网络N′M中,输出得到目标三维模型Si对应的三维模型特征向量进行正则化处理后得到正则化后的三维模型特征向量计算所述正则化后的图像特征向量F′q与所述正则化后的三维模型特征向量之间的距离D(q,Si),以所述距离D(q,Si)衡量所述查询图像q与每个所述目标三维模型Si之间的相似度并降序排序,选择若干排序靠前的目标三维模型Stop作为与所述查询图像q相似的检索结果并输出。
2.根据权利要求1所述的一种基于复杂背景图像的三维模...
【专利技术属性】
技术研发人员:李海生,杜雨佳,李勇,姚春莲,李楠,
申请(专利权)人:北京工商大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。