【技术实现步骤摘要】
基于笔画点序列特征增强的三维模型草图检索方法
[0001]本专利技术涉及三维模型草图检索的
,尤其是指一种基于笔画点序列特征增强的三维模型草图检索方法。
技术介绍
[0002]近年来,三维建模技术被广泛应用于机械制造、医疗诊断以及计算机辅助设计等领域,三维模型的数量也随之飞速增长。在实际生产应用中,约80%的场景是直接重用现有模型或仅对模型微调后使用,因此通过有效的检索方法快速且准确的找到所需要的三维模型成为了一项重要的工作。同时,随着便携式触屏设备的普及,草图逐渐成为一种方便快捷且应用广泛的新型信息交流载体。上述两个因素共同催生出了大量关于三维模型草图检索的工作。
[0003]然而,三维模型草图检索仍然是困难的。三维模型是对真实物体的客观表征,拥有具体和复杂等特性;而草图是人类对想法的主观表达,具有抽象和简单等特性;三维模型和草图间存在着明显的域间差异性,这给三维模型草图检索任务带来了巨大的挑战。针对上述问题,现有的基于深度学习的方法从特征提取和损失建立两个角度出发,将草图和三维模型同时表征成一个或一组二维图像,通过同构或异构的卷积神经网络(convolutional neural networks,CNN)分别提取特征并使用跨域度量损失缩小草图和三维模型的域间差异,取得了较好的跨域检索效果。
[0004]但是,仔细分析三维模型草图检索任务不难发现,除域间差异性外,该任务同时面临着草图线条表征的稀疏性及各域数据的类内差异性,然而,现有的深度学习方法对以上两点却考虑不足:1、将草图视作普通的二维
【技术保护点】
【技术特征摘要】
1.基于笔画点序列特征增强的三维模型草图检索方法,其特征在于,包括以下步骤:1)数据输入及初始特征提取,输入分为三个部分,第一个部分以单张手绘草图图像为输入,经过草图分支网络得到手绘草图初始特征;第二个部分以手绘草图图像数据集的笔画点序列为输入,经过笔画点序列分支网络得到笔画点序列初始特征;第三个部分以三维模型数据集的二维多视图为输入,然后经过三维模型分支网络得到三维模型多视图初始特征;2)将手绘草图初始特征、笔画点序列初始特征和三维模型多视图初始特征输入到共享语义嵌入网络中,得到手绘草图共享语义特征、笔画点序列共享语义特征和三维模型多视图共享语义特征;3)将手绘草图初始特征、笔画点序列初始特征和三维模型多视图初始特征经过单域多类中心损失模块进行约束,使得各个特征能够表达各域数据的类内差异;4)将得到的手绘草图共享语义特征、笔画点序列共享语义特征和三维模型多视图共享语义特征送入域间对比损失模块和跨域度量损失模块进行约束,捕获手绘草图共享语义特征、笔画点序列共享语义特征和三维模型多视图共享语义特征间的关联关系以及实现各个共享语义特征在共享语义空间中的良好对齐,最终完成度量学习。2.根据权利要求1所述的基于笔画点序列特征增强的三维模型草图检索方法,其特征在于,在步骤1)中,手绘草图初始特征、笔画点序列初始特征和三维模型多视图初始特征的提取过程具体情况如下:a、以单张二维图像的形式表征手绘草图图像,手绘草图图像数据集其中:S
tr
为手绘草图图像数据集中的训练集,S
te
为手绘草图图像数据集中的测试集,N=N
tr
+N
te
为手绘草图图像的总数,N
tr
为训练集中手绘草图图像的数量,N
te
为测试集中手绘草图图像的数量;a
i
表示第i个手绘草图图像,b
i
∈{1,2,3,...,C}为手绘草图图像a
i
对应的类别标签;C=C
tr
+C
te
为类别标签总数,C
tr
为训练集类别标签数,C
te
为测试集类别标签数;输入训练集中的手绘草图图像以及类别标签,表示为输入训练集中的手绘草图图像以及类别标签,表示为为训练集中第i个手绘草图图像,为手绘草图图像对应的类别标签;将手绘草图图像输入至草图分支网络,提取手绘草图图像的初始特征分支网络,提取手绘草图图像的初始特征为特征的向量表示;其中,所述草图分支网络采用的是ResNet
‑
50的第1到4个阶段以及Average Pooling操作;b、三维模型数据集三维模型数据集不区分训练集和测试集,即所有数据同时运用于测试和训练过程,N
′
为三维模型的总数;e
i
表示第i个三维模型,f
i
∈{1,2,3,...,D}为三维模型e
i
对应的类别标签;D为类别标签总数;将三维模型表征为多视图形式,有I
v,i
表示三维模型e
i
的第v个视图,N
v
=12表示三维模型的多视图的数量;输入数据集中三维模型多视图以及类标签,表示输入数据集中三维模型多视图以及类标签,表示为数据集中第i组三
维模型多视图,f
ti
为三维模型多视图对应的类别标签;将三维模型多视图输入三维模型分支网络,提取每一个视图的初始视觉特征并进行特征融合得到三维模型多视图初始特征征为特征的向量表示;其中,所述三维模型分支网络采用的是Resnet
‑
50的第1到3个阶段构成与视图数对应且权重相同的网络支流提取三维模型各个视图的初始视觉特征,然后通过View
‑
Max Pooling操作完成各视图初始视觉特征的初步融合,再使用ResNet
‑
50的第4个阶段模块处理初步融合后的特征,获得三维模型多视图初始特征;c、笔画点序列数据集其中:P
tr
为笔画点序列数据集中的训练集,P
te
为笔画点序列数据集中测试集,N
″
=N
″
tr
+N
″
te
为笔画点序列的总数,N
″
tr
为训练集中笔画点序列的数量,N
″
te
为测试集中笔画点序列的数量;g
i
表示第i个笔画点序列,j
i
∈{1,2,3,...,E}为笔画点序列g
i
对应的类别标签;E=E
tr
+E
te
为总体的类别标签总数,E
tr
为训练集类别标签数,E
te
为测试集类别标签数;将笔画点序列表征为二维坐标集合的形式,有g
i
=(p1,p2,...,p
i
,p
i+1
,...,p
m
),p
i
表示笔画点序列g
i
中的第i个点的坐标,m表示笔画点序列中坐标点的数量;输入训练集中的笔画点序列以及类标签,表示输入训练集中的笔画点序列以及类标签,表示为训练集中第i个笔画点序列,为笔画点序列对应的类别标签;将笔画点序列输入笔画点序列分支网络,提取笔画点序列的初始特征络,提取笔画点序列的初始特征为特征的向量表示;所述笔画点序列分支网络首先采用三组多层感知器获得包含输入的笔画点序列中每个点信息的表示特征,每组多层感知器后使用ReLU激活函数和批归一化操作,然后对表示特征的第二个维度进行Max Pooling操作,获得笔画点序列在此维度上响应最大的特征,即笔画点序列初始特征。3.根据权利要求2所述的基于笔画点序列特征增强的三维模型草图检索方法,其特征在于,在步骤2)中,所述共享语义嵌入网络的具体情况如下:共享语义嵌入网络旨在将手绘草图初始特征、笔画点序列初始特征和三维模型多视图初始特征嵌入到同一个共享语义空间中,经过草图分支网络、笔画点序...
【专利技术属性】
技术研发人员:白静,杨瞻源,白少进,彭斌,李文静,郑虎,
申请(专利权)人:北方民族大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。