【技术实现步骤摘要】
本专利技术涉及大数据对象的管理技术,属于计算机科学与技术学科中的智能信息处理领域。
技术介绍
在大数据对象管理中的一项关键技术,是如何对数据文件进行分割,以便于进行文件管理与智能搜索。文件分割方法通常采用顺序分割技术,但是对于大数据对象的分割,如数据的容量达到GB时,其分割效率很低,甚至会导致系统内存崩溃。这是由于要在内存中对数据文件进行打开、拷贝、粘贴、保存、上传等操作,因此大量的消耗了系统内存空间。
技术实现思路
本专利技术要解决的技术问题是现有的文件分割方法分割效率很低,甚至会导致系统内存崩溃。为解决上述技术问题,本专利技术采用的技术方案是:一种文件拆分方法,包括以下步骤:1)对文件目录结构进行 预处理,使其规范化;2)采用双指针技术对文件目录进行定位,获取数据文件的目录个数;3)从文件的尾部开始依此向文章的起始处剪切,按照文件目录的顺序逐目录进行分割提取,对子目录的内容进行剪切,然后将剪切的内容再粘贴到新的空文件中,并以网页的形式保存在数据库中。传统文件的分割方法是采用顺序分割方法,即按照文件目录的顺序逐目录进行分割提取,对子目录的内容进行剪切,然后将剪切的 ...
【技术保护点】
一种文件拆分方法,其特征是,包括以下步骤:1)对文件目录结构进行预处理,使其规范化;2)采用双指针技术对文件目录进行定位,获取数据文件的目录个数;3)从文件的尾部开始依此向文章的起始处剪切,按照文件目录的顺序逐目录进行分割提取,对子目录的内容进行剪切,然后将剪切的内容再粘贴到新的空文件中,并以网页的形式保存在数据库中。
【技术特征摘要】
1.一种文件拆分方法,其特征是,包括以下步骤: 1)对文件目录结构进行预处理,使其规范化; 2)采用双指针技术对文件目录进行定位,获取数据文件的目录个数; 3)从文件的尾部开始依此向文章的起始处剪切,按照文件目录的顺序逐目录进行分割提取,对子目录的内容进行剪切,然后将剪切的内容再粘贴到新的空文件中,并以网页的形式保存在数据库中。2.根据权利要求1所述的一种文件拆分方法,其特征是:步骤2)中的双指针包括指针Count和指针Catalog ();指针Count为文件的目录顺...
【专利技术属性】
技术研发人员:王卫东,陈勇,叶华,李红梅,郭小芳,胡存刚,宋晓宁,
申请(专利权)人:南京龙渊微电子科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。