一种文件拆分方法及装置制造方法及图纸

技术编号:8959505 阅读:132 留言:0更新日期:2013-07-25 19:03
本发明专利技术公开了一种文件拆分方法及装置,该装置包括用于预处理原始文件的目录结构的预处理模块;用于定位原始文件的目录顺序和目录层次的定位模块;用于在所述内容文件中,查找需要剪切的文件内容,并定位内容起始处的文件目录所在的位置的查找模块;用于剪切分割提取的子目录的内容,并将剪切的内容粘贴到新的空文件中,以网页的形式保存入数据库的拆分模块。本发明专利技术拆分速度快、不会造成的文件格式混乱及系统崩溃问题、拆分效果好。

【技术实现步骤摘要】

本专利技术涉及大数据对象的管理技术,属于计算机科学与技术学科中的智能信息处理领域。
技术介绍
在大数据对象管理中的一项关键技术,是如何对数据文件进行分割,以便于进行文件管理与智能搜索。文件分割方法通常采用顺序分割技术,但是对于大数据对象的分割,如数据的容量达到GB时,其分割效率很低,甚至会导致系统内存崩溃。这是由于要在内存中对数据文件进行打开、拷贝、粘贴、保存、上传等操作,因此大量的消耗了系统内存空间。
技术实现思路
本专利技术要解决的技术问题是现有的文件分割方法分割效率很低,甚至会导致系统内存崩溃。为解决上述技术问题,本专利技术采用的技术方案是:一种文件拆分方法,包括以下步骤:1)对文件目录结构进行 预处理,使其规范化;2)采用双指针技术对文件目录进行定位,获取数据文件的目录个数;3)从文件的尾部开始依此向文章的起始处剪切,按照文件目录的顺序逐目录进行分割提取,对子目录的内容进行剪切,然后将剪切的内容再粘贴到新的空文件中,并以网页的形式保存在数据库中。传统文件的分割方法是采用顺序分割方法,即按照文件目录的顺序逐目录进行分割提取,对子目录的内容进行剪切,然后将剪切的内容再粘贴到新的空文本文档来自技高网...

【技术保护点】
一种文件拆分方法,其特征是,包括以下步骤:1)对文件目录结构进行预处理,使其规范化;2)采用双指针技术对文件目录进行定位,获取数据文件的目录个数;3)从文件的尾部开始依此向文章的起始处剪切,按照文件目录的顺序逐目录进行分割提取,对子目录的内容进行剪切,然后将剪切的内容再粘贴到新的空文件中,并以网页的形式保存在数据库中。

【技术特征摘要】
1.一种文件拆分方法,其特征是,包括以下步骤: 1)对文件目录结构进行预处理,使其规范化; 2)采用双指针技术对文件目录进行定位,获取数据文件的目录个数; 3)从文件的尾部开始依此向文章的起始处剪切,按照文件目录的顺序逐目录进行分割提取,对子目录的内容进行剪切,然后将剪切的内容再粘贴到新的空文件中,并以网页的形式保存在数据库中。2.根据权利要求1所述的一种文件拆分方法,其特征是:步骤2)中的双指针包括指针Count和指针Catalog ();指针Count为文件的目录顺...

【专利技术属性】
技术研发人员:王卫东陈勇叶华李红梅郭小芳胡存刚宋晓宁
申请(专利权)人:南京龙渊微电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1