多媒体模型检索方法、装置及系统制造方法及图纸

技术编号:2917863 阅读:308 留言:0更新日期:2012-04-11 18:40
一种多媒体模型检索方法,包括如下步骤:获取待检索的多媒体模型参数;根据多媒体模型参数对多媒体模型进行投影描述得到投影描述结果;对投影描述结果进行特征抽取;根据特征抽取后的结果与存储的模型多媒体文件信息进行匹配得到检索结果;根据用户对检索结果标注的多媒体模型训练得到支持向量机SVM,并通过该SVM对多媒体模型进行基于概率的分类,利用分类结果更新检索结果。同时,提供一种多媒体模型检索装置。本发明专利技术实施例具有良好的适应性及鲁棒性,可作为生物分子、机械制造、地形匹配、游戏及动画制作等领域的三维模型检索系统来使用,帮助用户对这些领域的海量模型数据进行快速精确的检索。

【技术实现步骤摘要】

本专利技术涉及多媒体检索
,尤其涉及一种多媒体模型检索方法及装置。
技术介绍
随着多媒体技术和网络技术发展,多媒体模型检索技术也日益发展,多媒体模型检索系统也成为业界研发的重点,所谓多媒体包括:文本、图片、音频、视频、三维/多维模型或者其组合。其中,基于内容的多媒体检索是利用多媒体的信息特征进行相似性检索。传统的多媒体模型检索方法包括如下步骤:读取多媒体模型信息的参数,该步骤中包括使得不同格式或特性的多媒体模型具有一致性。抽取多媒体模型的特征,该步骤中抽取多媒体信息中可以用来比较的部分,即特征,并将其量化。计算模型之间的相似度,该步骤中根据模型的特征,计算待检索模型与数据库模型之间的相似度。根据用户的手工标注,使用神经网络的机器学习的方法对数据库中的各组数据进行分类,从而得到检索结果。专利技术人在研究多媒体检索技术的过程中发现,上述传统的多媒体模型检索方法中至少存在如下缺点:现有技术实现的多媒体信息检索反馈系统,需要在学习与分类的步骤中对大量模型进行手工标注,标注的数量取决于数据库的大小及特征抽取方法的精度,有时甚至需要手工标注上千或上万个数据,严重影响反馈速度。并且,上述方法的适用性和鲁棒性较差。
技术实现思路
有鉴于此,实有必要提供一种反馈次数少,适用性和鲁棒性好的多媒体模型检索方法。-->同时,提供一种反馈次数少,适用性和鲁棒性好的多媒体模型检索装置。一种多媒体模型检索方法,该方法包括如下步骤:获取待检索的多媒体模型参数;根据所述多媒体模型参数对所述多媒体模型进行投影描述得到投影描述结果;对所述投影描述结果进行特征抽取;根据特征抽取后的结果与存储的模型多媒体文件信息进行匹配得到检索结果;及根据用户对检索结果标注的多媒体模型训练得到支持向量机,并通过该支持向量机对多媒体模型进行基于概率的分类,利用分类结果更新检索结果。一种多媒体模型检索装置,该装置包括:模型文件初始化模块,用于获取待检索的多媒体模型参数;投影模块,用于根据所述多媒体模型参数对所述多媒体模型进行投影描述得到投影描述结果;特征抽取模块,用于对所述投影描述结果进行特征抽取;相似度匹配模块,用于根据特征抽取后的结果与存储的模型多媒体文件信息进行匹配得到检索结果;及反馈模块,根据用户对检索结果标注的多媒体模型训练得到支持向量机,并通过该支持向量机对多媒体模型进行基于概率的分类,利用分类结果更新检索结果。本专利技术实施例通过根据用户对检索结果标注的多媒体模型训练得到支持向量机,并通过该支持向量机对多媒体模型进行基于概率的分类,利用分类结果更新检索结果。使得多媒体模型检索时,通过较少的模型样本得到较高检索精度的检索结果,减少了反馈的次数,具有良好的适应性及鲁棒性,可作为生物分子、机械制造、地形匹配、游戏及动画制作等领域的三维模型检索系统来使用,帮助用户对这些领域的海量模型数据进行快速精确的检索。-->附图说明图1为本专利技术一实施例多媒体模型检索装置示意图。图2为本专利技术另一实施例多媒体模型检索装置示意图。图3为本专利技术实施例Zernike矩和球面坐标系的θ、α关系图。图4为本专利技术实施例一个三角片细分示意图。图5为本专利技术实施例三维模型顶点投影示意图。图6为本专利技术实施例检索实例bunny模型示意图。图7为本专利技术实施例加入噪声后的bunny模型示意图。图8为本专利技术实施例鲁棒性实验结果示意图。图9为本专利技术实施例与传统的检索精度比较示意图。图10为本专利技术实施例第1轮反馈后查全率-查准率对比曲线示意图。图11为本专利技术实施例第5轮反馈后查全率-查准率对比曲线示意图。图12为本专利技术实施例多媒体模型检索方法流程图。具体实施方式请参看图1,一种较佳的多媒体模型检索装置实施方式包括模型检索装置102和数据库管理系统199。数据库管理系统199用于存储多媒体模型文件信息。模型检索装置102用于获取待检索的多媒体模型参数,根据多媒体模型参数对多媒体模型进行投影描述得到投影描述结果,对投影描述结果进行特征抽取,根据特征抽取后的结果与数据库管理系统199存储的多媒体文件信息进行匹配得到检索结果,根据用户对检索结果标注的多媒体模型训练得到支持向量机(Support Vector Machines,SVM),并通过该SVM对多媒体模型进行基于概率的分类,利用分类结果更新检索结果。数据库管理系统199存储的多媒体文件信息可以是多媒体模型文件也可以是多媒体模型的特征提取参数,例如Zernike矩提取特征的模型。本实施例中,模型检索装置102包括:模型文件初始化模块104、预处理模块106、球面投影模块112、数据库处理模块116、特征抽取模块118、-->相似度排序模块130、结果输出模块132和反馈模块120。模型文件初始化模块104,用于获取待检索的多媒体模型参数,例如,接收用户选定的用作匹配源的三维模型文件,模型文件初始化模块104独立于模型的文件格式,可以接收各种格式三维模型的文件,如.3ds格式的文件等。读取所述模型文件信息,包括模型参数,所述模型文件信息包括顶点数量、顶点坐标、法线向量和三角片顶点索引等数据。所述模型文件信息的文件格式可以是可存储文本的文件格式,如.txt文件格式等。其中,读取所述模型文件信息的细节在本实施例中可以包括如下步骤:1)打开所述模型文件。2)读取文件的前9个bit为顶点部分的开始标识,跳过。读取4个Byte并存储成一个int(整型)型变量,作为顶点个数。根据所述顶点个数循环执行步骤3)和步骤4)。3)读取顶点的x,y,z坐标。4)读取法线向量的x,y,z坐标。5)继续读取11个bit,作为三角片部分开始标识,跳过。读取4个Byte并存储成为一个int型变量,作为三角片个数。根据所述三角片个数,循环执行步骤6)和步骤7)。6)读取当前三角片三个顶点的索引值,根据索引值确定所述三个顶点的坐标值。7)根据所述三个顶点的坐标值,计算并保存每个三角片的面积及总面积(m_myTotalArea),同时计算并保存所有顶点中距离原点的最小距离(m_fMinR)。上述读取过程中若模型为二维模型,仅读取模型的x,y坐标即可,多维模型不再赘述。预处理模块106,用于对获取的待检索的多媒体模型参数预处理。请结合参看图2,本实施例中,预处理模块106包括:各向同性变换单元108和顶点采样单元110。其中,各向同性变换单元108,用于对获取的多媒体模型进行各向同性变换。-->请结合参看图3,由于球面图像的三维Zernike矩和球面坐标系的θ、α相关,且用户给出的三维模型坐标系可能不一致,三维模型的顶点分布也可能不均匀或顶点密度太小,所以,本实施例中利用各向同性变换单元108先进行三维模型各向同性变换,利用顶点采样单元110进行顶点采样,统一三维模型的坐标。输出经各向同性变换后的模型结构变量。在各向同性变换矩阵中加入面积加权系数,公式如下:CP=[Σi,j=1N(sipi-sjqj)(sipi-sjqj)t]-12Q=CPP---(1)]]>其中,P={p1,Kpn本文档来自技高网...

【技术保护点】
一种多媒体模型检索方法,其特征在于,该方法包括如下步骤: 获取待检索的多媒体模型参数; 根据所述多媒体模型参数对所述多媒体模型进行投影描述得到投影描述结果; 对所述投影描述结果进行特征抽取; 根据特征抽取后的结果与存储的模型多媒体文件信息进行匹配得到检索结果;及 根据用户对检索结果标注的多媒体模型训练得到支持向量机,并通过所述支持向量机对多媒体模型进行基于概率的分类,利用分类结果更新检索结果。

【技术特征摘要】
1.一种多媒体模型检索方法,其特征在于,该方法包括如下步骤:获取待检索的多媒体模型参数;根据所述多媒体模型参数对所述多媒体模型进行投影描述得到投影描述结果;对所述投影描述结果进行特征抽取;根据特征抽取后的结果与存储的模型多媒体文件信息进行匹配得到检索结果;及根据用户对检索结果标注的多媒体模型训练得到支持向量机,并通过所述支持向量机对多媒体模型进行基于概率的分类,利用分类结果更新检索结果。2.如权利要求1所述的多媒体模型检索方法,其特征在于,所述对投影描述结果进行特征抽取包括:利用Zernike矩对所述多媒体模型进行特征抽取。3.如权利要求1或2所述的多媒体模型检索方法,其特征在于,该方法还包括对所述获取待检索的多媒体模型参数进行预处理。4.如权利要求3所述的多媒体模型检索方法,其特征在于,所述预处理包括:对所述获取的多媒体模型进行各向同性变换;及根据各向同性变换后的多媒体模型进行顶点采样。5.如权利要求1所述的多媒体模型检索方法,其特征在于,所述根据用户对检索结果标注的多媒体模型训练得到支持向量机,并通过所述支持向量机对多媒体模型进行基于概率的分类具体包括:将用户手工标注作为训练样本,根据所述训练样本训练得到所述支持向量机;利用所述支持向量机对数据库中的模型进行预测。6.如权利要求5所述的多媒体模型检索方法,其特征在于,所述用户手工标注为相关模型的权重标注为1,不相关模型的权重标注为-1。7.如权利要求5所述的多媒体模型检索方法,其特征在于,所述利用支持向量机对数据库中的模型进行预测包括:对数据库中的每个模型进行预测,得到每个模型归属到的相关的或不相关的概率值,并用所述概率值对相似度值进行修正。8.如权利要求1所述的多媒体模型检索方法,其特征在于,所述根据多媒体模型参数对所述多媒体模型进行投影描述包括:对三维多媒体模型进行球面投影,计算球面投影图像。9.如权利要求1所述的多媒体模型检索方法,其特征在于,该方法进一步包括:对所述匹配得到的检索结果或所述更新检索结果进行排序。10.如权利要求1所述的多媒体模型检索方法,其特征在于,所述获取待检索的多媒体模型参数的文件格式...

【专利技术属性】
技术研发人员:马彦平张勤伟
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1