一种高精度提取和快速分类的三维模型数据解析方法技术

技术编号：20390756 阅读：25 留言：0更新日期：2019-02-20 03:11

本发明专利技术请求保护一种高精度提取和快速分类的三维模型数据解析方法，属于计算机信息处理技术领域。该方法包括：针对三维模型，设计一种基于二叉树的数据解析方案，搜索模型的元素标记，分析数据的嵌套关系，形成最简文档。当接收到一份三维dae格式的模型时，读取模型数据，提供一种分析算法流程，通过搜索模型的每一个元素标记，逐步分析数据的嵌套关系，剔除重复冗余数据，再使用改进极限学习机进行分类，最终形成最简文档。本发明专利技术通过二叉树与改进极限学习机同时使用解析三维模型数据，减少了冗余数据的堆叠，加快了数据的处理速度，提高解析效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种高精度提取和快速分类的三维模型数据解析方法
本专利技术属于计算机信息处理
，尤其涉及三维模型数据解析方法。
技术介绍
三维数据模型是一种半结构化的数据，用户可任意地设定元素标记和它们间的嵌套关系，以dae为例，dae文件的数据模式是一份非常重要的信息，只有获取了一份dae文件的数据模式，才有利于识别文件的真实含义，为后续的数据分类、聚类和数据挖掘等工作提供了良好的基础。到目前为止，已经有很多研究针对三维模型数据的提取提出了各种各样的算法，为相关研究提供了重要的思路。Jun-KiMin等人提出一种基于元素内容模型的提取方法，该方法对元素内容模型进行限制，在元素的内容模型中，子元素只能出现一次。该方法中使用自底向上的方法，先得到子元素的模式，再根据子元素的模式提出父元素的模式。SvetlozarNestorov等人提出从半结构化数据中提取模式信息的方法。该方法用有向标记图来描述半结构化数据，使用一元datalog程序的最大不动点的语义定义半结构化数据的数据类型。但这些算法也存在着相应的缺点，主要体现在两方面：①不够精确。②算法复杂度高。利用最优级正则表达式固然可以得到很精确的模式，但是正则表达式生成给系统带来很大的开销。这很大程度上是因为其语言的半结构化特点，使其模式缺乏强制性，给数据的提取工作带来了很大的困难。而二叉树是一种折中的方式，即使是在二叉树步数较大时，仍可以精确地获得理论数据。故本文采用一种二叉树的算法来提取数据，对于复杂度很大的三维模型文件，能迅速得到其有效的数据；同时，对于文档中有可选和重复标记等情况，也能够给出准确的判别和处理。而在...

【技术保护点】
1.一种高精度提取和快速分类的三维模型数据解析方法，其特征在于，包括以下步骤：1)、首先读取三维模型数据，抽取出三维模型数据中的所有元素标记，所述元素标记包括开始标记和结束标记，每一个标记用一个标记结点来表示；将标记结点按顺序逐一编号从而生成标记链；2)、建立二叉树结点模型，通过步骤1)得到的标记链以及其中标记结点的编号，将同一名称的开始标记和结束标记配成二叉树中的两颗子树，同时将他们对应的标记结点配对为一组，再根据比较标记结点的编号数值大小来分析各元素标记的嵌套关系；3)、极限学习机是单隐层神经网络，本算法中改进极限学习机采用双层模型，加快训练速度，然后使用这种改进极限学习机方法，训练步骤2)中的二叉树结点模型判断和删除标记二叉树中的冗余数据，从而得到三维模型文件的最简文档。

【技术特征摘要】
1.一种高精度提取和快速分类的三维模型数据解析方法，其特征在于，包括以下步骤：1)、首先读取三维模型数据，抽取出三维模型数据中的所有元素标记，所述元素标记包括开始标记和结束标记，每一个标记用一个标记结点来表示；将标记结点按顺序逐一编号从而生成标记链；2)、建立二叉树结点模型，通过步骤1)得到的标记链以及其中标记结点的编号，将同一名称的开始标记和结束标记配成二叉树中的两颗子树，同时将他们对应的标记结点配对为一组，再根据比较标记结点的编号数值大小来分析各元素标记的嵌套关系；3)、极限学习机是单隐层神经网络，本算法中改进极限学习机采用双层模型，加快训练速度，然后使用这种改进极限学习机方法，训练步骤2)中的二叉树结点模型判断和删除标记二叉树中的冗余数据，从而得到三维模型文件的最简文档。2.根据权利要求1所述的高精度提取和快速分类的三维模型数据解析方法，其特征在于，所述步骤1)是通过自动状态机来抽取三维模型数据中所有的元素标记，所述元素标记包括开始标记和结束标记，并将所得的元素标记通过链表结点来表示。3.根据权利要求2所述的高精度提取和快速分类的三维模型数据解析方法，其特征在于，所述将所得的元素标记通过链表结点来表示，具体包括：首先将文档中所有的开始和结束标记抽取出来，并用一个标记结点ElementNode表示，所述标记结点的格式为：(charElemstring，intNum，intMatchNum，ElementNode*next)，其中，ElemString用来记录标记字符串；Num表示当前标记结点在链表中的编号；MatchNum表示：如果当前结点是元素的开始标记，记录链表中与当前结点相配对的结束标记结点的编号；如果结点本身是结束标记，则该项置为空；next是指向下一个结点的指针。4.根据权利要求3所述的高精度提取和快速分类的三维模型数据解析方法，其特征在于，所述步骤2)建立二叉树结点模型的步骤包括：所述二叉树结点模型由NodeString,TreeNode*LeftChild,Tree-Node*RightChild三类组成，其中NodeString表示当前开始标记结点所包含的标记字符串；LeftChild：左子树结点指针，如果当前结点的LeftChild不为空，则表示LeftChild指向的结点嵌套于当前结点，它们互为父子关系；RightChild：右子树结点指针，如果当前结点的RightChild不为空，则表示RightChild指向的结点和当前结点嵌套于同一个标记，它们互为兄弟关系。5.根据权利要求4所述的高精度提取和快速分类的三维...

【专利技术属性】
技术研发人员：罗志勇，耿琦琦，于秀明，罗蓉，王月，苏伟，蔡婷，杨梦培，贾超，
申请(专利权)人：重庆邮电大学，中国电子技术标准化研究院，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人