【技术实现步骤摘要】
一种高精度提取和快速分类的三维模型数据解析方法
本专利技术属于计算机信息处理
,尤其涉及三维模型数据解析方法。
技术介绍
三维数据模型是一种半结构化的数据,用户可任意地设定元素标记和它们间的嵌套关系,以dae为例,dae文件的数据模式是一份非常重要的信息,只有获取了一份dae文件的数据模式,才有利于识别文件的真实含义,为后续的数据分类、聚类和数据挖掘等工作提供了良好的基础。到目前为止,已经有很多研究针对三维模型数据的提取提出了各种各样的算法,为相关研究提供了重要的思路。Jun-KiMin等人提出一种基于元素内容模型的提取方法,该方法对元素内容模型进行限制,在元素的内容模型中,子元素只能出现一次。该方法中使用自底向上的方法,先得到子元素的模式,再根据子元素的模式提出父元素的模式。SvetlozarNestorov等人提出从半结构化数据中提取模式信息的方法。该方法用有向标记图来描述半结构化数据,使用一元datalog程序的最大不动点的语义定义半结构化数据的数据类型。但这些算法也存在着相应的缺点,主要体现在两方面:①不够精确。②算法复杂度高。利用最优级正则表达式固然可以得到很精确的模式,但是正则表达式生成给系统带来很大的开销。这很大程度上是因为其语言的半结构化特点,使其模式缺乏强制性,给数据的提取工作带来了很大的困难。而二叉树是一种折中的方式,即使是在二叉树步数较大时,仍可以精确地获得理论数据。故本文采用一种二叉树的算法来提取数据,对于复杂度很大的三维模型文件,能迅速得到其有效的数据;同时,对于文档中有可选和重复标记等情况,也能够给出准确的判别和处理。而在 ...
【技术保护点】
1.一种高精度提取和快速分类的三维模型数据解析方法,其特征在于,包括以下步骤:1)、首先读取三维模型数据,抽取出三维模型数据中的所有元素标记,所述元素标记包括开始标记和结束标记,每一个标记用一个标记结点来表示;将标记结点按顺序逐一编号从而生成标记链;2)、建立二叉树结点模型,通过步骤1)得到的标记链以及其中标记结点的编号,将同一名称的开始标记和结束标记配成二叉树中的两颗子树,同时将他们对应的标记结点配对为一组,再根据比较标记结点的编号数值大小来分析各元素标记的嵌套关系;3)、极限学习机是单隐层神经网络,本算法中改进极限学习机采用双层模型,加快训练速度,然后使用这种改进极限学习机方法,训练步骤2)中的二叉树结点模型判断和删除标记二叉树中的冗余数据,从而得到三维模型文件的最简文档。
【技术特征摘要】
1.一种高精度提取和快速分类的三维模型数据解析方法,其特征在于,包括以下步骤:1)、首先读取三维模型数据,抽取出三维模型数据中的所有元素标记,所述元素标记包括开始标记和结束标记,每一个标记用一个标记结点来表示;将标记结点按顺序逐一编号从而生成标记链;2)、建立二叉树结点模型,通过步骤1)得到的标记链以及其中标记结点的编号,将同一名称的开始标记和结束标记配成二叉树中的两颗子树,同时将他们对应的标记结点配对为一组,再根据比较标记结点的编号数值大小来分析各元素标记的嵌套关系;3)、极限学习机是单隐层神经网络,本算法中改进极限学习机采用双层模型,加快训练速度,然后使用这种改进极限学习机方法,训练步骤2)中的二叉树结点模型判断和删除标记二叉树中的冗余数据,从而得到三维模型文件的最简文档。2.根据权利要求1所述的高精度提取和快速分类的三维模型数据解析方法,其特征在于,所述步骤1)是通过自动状态机来抽取三维模型数据中所有的元素标记,所述元素标记包括开始标记和结束标记,并将所得的元素标记通过链表结点来表示。3.根据权利要求2所述的高精度提取和快速分类的三维模型数据解析方法,其特征在于,所述将所得的元素标记通过链表结点来表示,具体包括:首先将文档中所有的开始和结束标记抽取出来,并用一个标记结点ElementNode表示,所述标记结点的格式为:(charElemstring,intNum,intMatchNum,ElementNode*next),其中,ElemString用来记录标记字符串;Num表示当前标记结点在链表中的编号;MatchNum表示:如果当前结点是元素的开始标记,记录链表中与当前结点相配对的结束标记结点的编号;如果结点本身是结束标记,则该项置为空;next是指向下一个结点的指针。4.根据权利要求3所述的高精度提取和快速分类的三维模型数据解析方法,其特征在于,所述步骤2)建立二叉树结点模型的步骤包括:所述二叉树结点模型由NodeString,TreeNode*LeftChild,Tree-Node*RightChild三类组成,其中NodeString表示当前开始标记结点所包含的标记字符串;LeftChild:左子树结点指针,如果当前结点的LeftChild不为空,则表示LeftChild指向的结点嵌套于当前结点,它们互为父子关系;RightChild:右子树结点指针,如果当前结点的RightChild不为空,则表示RightChild指向的结点和当前结点嵌套于同一个标记,它们互为兄弟关系。5.根据权利要求4所述的高精度提取和快速分类的三维...
【专利技术属性】
技术研发人员:罗志勇,耿琦琦,于秀明,罗蓉,王月,苏伟,蔡婷,杨梦培,贾超,
申请(专利权)人:重庆邮电大学,中国电子技术标准化研究院,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。