一种基于大数据的文件存储空间智能分配方法组成比例

技术编号:20272293 阅读:28 留言:0更新日期:2019-02-02 03:35
本发明专利技术公开了一种基于大数据的文件存储空间智能分配方法,包括数据接入模块、文件分析模块、文件查询模块、控制器、调用监控模块、限期存储模块、备份存储模块、调用记录模块和文件调转模块;所述数据接入模块用于用户录入数据信息用,所述数据接入模块用于将数据信息传输到文件分析模块,所述文件分析模块用于对数据信息进行分析;本发明专利技术通过文件分析模块根据数据信息的后缀名将数据信息分类为文档信息、图片信息、影像信息和其他信息;同时给上述各个信息打上识别字眼便于识别,之后将上述各类信息传输到控制器内,控制器将上述各个带有识别字眼的信息传输到限期存储模块按照类别进行存储。

【技术实现步骤摘要】
一种基于大数据的文件存储空间智能分配方法
本专利技术属于智能分配领域,涉及一种大数据技术,具体是一种基于大数据的文件存储空间智能分配方法。
技术介绍
文件系统是操作系统用于明确存储设备(常见的是磁盘,也有基于NANDFlash的固态硬盘)或分区上的文件的方法和数据结构;即在存储设备上组织文件的方法。操作系统中负责管理和存储文件信息的软件机构称为文件管理系统,简称文件系统。文件系统由三部分组成:文件系统的接口,对对象操纵和管理的软件集合,对象及属性。从系统角度来看,文件系统是对文件存储设备的空间进行组织和分配,负责文件存储并对存入的文件进行保护和检索的系统。具体地说,它负责为用户建立文件,存入、读出、修改、转储文件,控制文件的存取,当用户不再使用时撤销文件等。但是当前,文件在存储的时候,在数据量很大的时候,如何将文件智能的进行分类存储以便于快速检索成为了一个关键问题,但是当前检索都是依托于常规技术检索,没有结合存储的情况和文件具体的热度来进行存储;这样就导致了在检索文件时造成了大量的浪费;为了解决上述缺陷,现提供一种解决方案。
技术实现思路
本专利技术的目的在于提供一种基于大数据的文件存储空间智能分配方法。本专利技术所有解决的技术问题为:(1):如何对数据信息进行准确分类,且带有标识性,便于存储和分辨;(2):如何对数据信息按照重要程度进行分类,将一些不经常用到信息进行集中存储;(3):如何形成数据信息的检索信息;本专利技术的目的可以通过以下技术方案实现:一种基于大数据的文件存储空间智能分配方法,包括数据接入模块、文件分析模块、文件查询模块、控制器、调用监控模块、限期存储模块、备份存储模块、调用记录模块和文件调转模块;其中,所述数据接入模块用于用户录入数据信息用,所述数据接入模块用于将数据信息传输到文件分析模块,所述文件分析模块用于对数据信息进行分析,具体分析步骤如下:步骤一:获取到数据信息,自动读取数据信息的后缀名;步骤二:对后缀名进行识别,判断其文档类型;S1:将数据信息划分为文档信息,文档信息包括所有的文本类文档文件;S2:图片信息,图片信息包括所有格式的图片文件;S3:影像信息,影像信息包括所有的音频、视频文件;S4:其他信息,其他信息为除上述文档信息、图片信息和影像信息以外的信息;步骤三:给上述各数据信息添加识别字眼;S1:在文档信息名称前端添加识别字眼W;S2:在图片信息名称前端添加识别字眼T;S3:在影像信息名称前端添加识别字眼Y;S4:在其他信息名称前端添加识别字眼Q;所述文件分析模块用于将分类后的文档信息、图片信息、影像信息和其他信息传输到控制器;所述控制器接收文档分析模块传输的文档信息、图片信息、影像信息和其他信息,所述控制器用于将文档信息、图片信息、影像信息和其他信息传输到限期存储模块,所述限期存储模块接收控制器传输的文档信息、图片信息、影像信息和其他信息,所述限期存储模块用于根据文档信息、图片信息、影像信息和其他信息形成检索信息组并进行实时存储;所述检索信息组为限期存储模块存储的每一份数据信息的检索信息,检索信息用于用户在需要进行检索时用,检索信息包括检索关键词和路径信息;检索关键词为上述各数据信息的文件名称信息加简介信息,路径信息为对应数据信息的存储位置信息;所述文件查询模块用于用户在需要进行检索时候输入查询信息用;所述查询信息包括查询关键词和数据信息的识别字眼;查询关键词包括查询名称信息和查询简介,查询简介为用户自主输入;所述文件查询模块用于将查询信息传输到控制器,所述控制器根据检索关键词自动从限期存储模块进行查询,查询过程如下:步骤一:获取到查询信息内数据信息的识别字眼,根据识别字眼锁定数据信息的类型并将该类文档类型标记为锁定数据信息组;步骤二:获取到查询信息内的查询名称信息,同时获取到锁定数据信息组内的检索信息组,之后获取对应检索信息组内检索信息的检索关键词,再之后获取检索关键词内的文件名称信息;将查询名称信息与文件名称信息进行比对;具体比对过程如下:S1:将查询名称信息与文件名称信息进行逐字比对,获取到查询名称信息与文件名称信息的重叠率C1i,i=1...n;S2:将C1i与预设值C1进行比对,获取所有大于C1的重叠率Ci对应的文件名称信息并将其标定为待确认文件名称信息组;S3:获取到待确认文件名称信息组对应的简介信息组,获取到查询信息内的查询简介;S4:将查询简介与简介信息组进行逐字比对,获取到查询简介与简介信息组的重合率C2i,i=1...n;S5:将C2i按照由大到小的顺序进行排序,获取前三名重合率对应的简介信息并将其标定为待选择简介信息组;步骤三:获取待选择简介信息组对应的检索信息内的路径信息组并将路径信息组标记为待选择路径信息组;步骤四:根据待选择路径信息组内的三组路径信息获取到对应的数据信息组并将其标定为待选择数据信息组;所述控制器用于将待选择数据信息组传输到显示模块进行实时显示,所述控制器用于将待选择数据信息组返回到文件查询模块用于用户输入目标数据信息,所述文件查询模块用于向控制器传输目标数据信息,所述控制器接收到目标数据信息并将目标数据信息传输到调用监控模块,所述调用监控模块用于将目标数据信息打上时间戳之后传输到调用记录模块,所述调用记录模块用于接收调用监控模块每一次传输到目标数据信息并进行下述处理:步骤一:获取到接收到的所有目标数据信息最后一次的时间戳并将其标记为Ti,i=1...n;步骤二:将Ti按照时间由近到远的顺序进行排序;步骤三:并将Ti与当天时间进行比对计算得到距当天过去的时间信息Tji,i=1...n;步骤四:按照Tji≤X1,X1<Tji<X2,Tji≥X2,将Tji划分为三个阶段;X1和X2均为预设值;并获取对应时间段的目标数据信息;步骤五:将Tji≤X1时间段对应的目标数据信息标记为热门数据信息;将X1<Tji<X2时间段对应的目标数据信息标记为常规数据信息;将Tji≥X2时间段对应的目标数据信息标记为冷门数据信息;所述调用记录模块用于将热门数据信息、常规数据信息和冷门数据信息融合形成调用信息,所述调用记录模块用于将调用信息传输到文件调转模块,所述文件调转模块用于将调用信息与限期存储模块内存储所有的数据信息进行比对,获取得到未调用过的数据信息并将其标记为转移信息;所述文件调转模块用于将转移信息从限期存储模块内调用出来并将其传输到备份存储模块,所述备份存储模块接收到文件调转模块传输的转移信息并将转移信息对应的检索信息删除形成备份存储信息,所述备份存储模块用于存储备份存储信息;当所述控制器未从限期存储模块内查询到查询信息对应的数据信息时会自动查询备份存储模块内的数据信息,所述控制器用于根据查询信息内的查询名称信息从备份存储模块查找对应数据信息,当数据信息被查询后控制器会将其自动标记为目标数据信息并将其传输到调用监控模块;所述调用监控模块用于将目标数据信息打上时间戳传输到调用记录模块。进一步地,所述文件调转模块用于根据调用信息将备份存储模块内被调用过的备份存储信息重新标记为数据信息并将数据信息传输到文件分析模块;所述控制器接收到目标数据信息并将目标数据信息传输到显示模块进行实时显示;所述调用本文档来自技高网...

【技术保护点】
1.一种基于大数据的文件存储空间智能分配方法,其特征在于,包括数据接入模块、文件分析模块、文件查询模块、控制器、调用监控模块、限期存储模块、备份存储模块、调用记录模块和文件调转模块;其中,所述数据接入模块用于用户录入数据信息用,所述数据接入模块用于将数据信息传输到文件分析模块,所述文件分析模块用于对数据信息进行分析,具体分析步骤如下:步骤一:获取到数据信息,自动读取数据信息的后缀名;步骤二:对后缀名进行识别,判断其文档类型;S1:将数据信息划分为文档信息,文档信息包括所有的文本类文档文件;S2:图片信息,图片信息包括所有格式的图片文件;S3:影像信息,影像信息包括所有的音频、视频文件;S4:其他信息,其他信息为除上述文档信息、图片信息和影像信息以外的信息;步骤三:给上述各数据信息添加识别字眼;S1:在文档信息名称前端添加识别字眼W;S2:在图片信息名称前端添加识别字眼T;S3:在影像信息名称前端添加识别字眼Y;S4:在其他信息名称前端添加识别字眼Q;所述文件分析模块用于将分类后的文档信息、图片信息、影像信息和其他信息传输到控制器;所述控制器接收文档分析模块传输的文档信息、图片信息、影像信息和其他信息,所述控制器用于将文档信息、图片信息、影像信息和其他信息传输到限期存储模块,所述限期存储模块接收控制器传输的文档信息、图片信息、影像信息和其他信息,所述限期存储模块用于根据文档信息、图片信息、影像信息和其他信息形成检索信息组并进行实时存储;所述检索信息组为限期存储模块存储的每一份数据信息的检索信息,检索信息用于用户在需要进行检索时用,检索信息包括检索关键词和路径信息;检索关键词为上述各数据信息的文件名称信息加简介信息,路径信息为对应数据信息的存储位置信息;所述文件查询模块用于用户在需要进行检索时候输入查询信息用;所述查询信息包括查询关键词和数据信息的识别字眼;查询关键词包括查询名称信息和查询简介,查询简介为用户自主输入;所述文件查询模块用于将查询信息传输到控制器,所述控制器根据检索关键词自动从限期存储模块进行查询,查询过程如下:步骤一:获取到查询信息内数据信息的识别字眼,根据识别字眼锁定数据信息的类型并将该类文档类型标记为锁定数据信息组;步骤二:获取到查询信息内的查询名称信息,同时获取到锁定数据信息组内的检索信息组,之后获取对应检索信息组内检索信息的检索关键词,再之后获取检索关键词内的文件名称信息;将查询名称信息与文件名称信息进行比对;具体比对过程如下:S1:将查询名称信息与文件名称信息进行逐字比对,获取到查询名称信息与文件名称信息的重叠率C1i,i=1...n;S2:将C1i与预设值C1进行比对,获取所有大于C1的重叠率Ci对应的文件名称信息并将其标定为待确认文件名称信息组;S3:获取到待确认文件名称信息组对应的简介信息组,获取到查询信息内的查询简介;S4:将查询简介与简介信息组进行逐字比对,获取到查询简介与简介信息组的重合率C2i,i=1...n;S5:将C2i按照由大到小的顺序进行排序,获取前三名重合率对应的简介信息并将其标定为待选择简介信息组;步骤三:获取待选择简介信息组对应的检索信息内的路径信息组并将路径信息组标记为待选择路径信息组;步骤四:根据待选择路径信息组内的三组路径信息获取到对应的数据信息组并将其标定为待选择数据信息组;所述控制器用于将待选择数据信息组传输到显示模块进行实时显示,所述控制器用于将待选择数据信息组返回到文件查询模块用于用户输入目标数据信息,所述文件查询模块用于向控制器传输目标数据信息,所述控制器接收到目标数据信息并将目标数据信息传输到调用监控模块,所述调用监控模块用于将目标数据信息打上时间戳之后传输到调用记录模块,所述调用记录模块用于接收调用监控模块每一次传输到目标数据信息并进行下述处理:步骤一:获取到接收到的所有目标数据信息最后一次的时间戳并将其标记为Ti,i=1...n;步骤二:将Ti按照时间由近到远的顺序进行排序;步骤三:并将Ti与当天时间进行比对计算得到距当天过去的时间信息Tji,i=1...n;步骤四:按照Tji≤X1,X1...

【技术特征摘要】
1.一种基于大数据的文件存储空间智能分配方法,其特征在于,包括数据接入模块、文件分析模块、文件查询模块、控制器、调用监控模块、限期存储模块、备份存储模块、调用记录模块和文件调转模块;其中,所述数据接入模块用于用户录入数据信息用,所述数据接入模块用于将数据信息传输到文件分析模块,所述文件分析模块用于对数据信息进行分析,具体分析步骤如下:步骤一:获取到数据信息,自动读取数据信息的后缀名;步骤二:对后缀名进行识别,判断其文档类型;S1:将数据信息划分为文档信息,文档信息包括所有的文本类文档文件;S2:图片信息,图片信息包括所有格式的图片文件;S3:影像信息,影像信息包括所有的音频、视频文件;S4:其他信息,其他信息为除上述文档信息、图片信息和影像信息以外的信息;步骤三:给上述各数据信息添加识别字眼;S1:在文档信息名称前端添加识别字眼W;S2:在图片信息名称前端添加识别字眼T;S3:在影像信息名称前端添加识别字眼Y;S4:在其他信息名称前端添加识别字眼Q;所述文件分析模块用于将分类后的文档信息、图片信息、影像信息和其他信息传输到控制器;所述控制器接收文档分析模块传输的文档信息、图片信息、影像信息和其他信息,所述控制器用于将文档信息、图片信息、影像信息和其他信息传输到限期存储模块,所述限期存储模块接收控制器传输的文档信息、图片信息、影像信息和其他信息,所述限期存储模块用于根据文档信息、图片信息、影像信息和其他信息形成检索信息组并进行实时存储;所述检索信息组为限期存储模块存储的每一份数据信息的检索信息,检索信息用于用户在需要进行检索时用,检索信息包括检索关键词和路径信息;检索关键词为上述各数据信息的文件名称信息加简介信息,路径信息为对应数据信息的存储位置信息;所述文件查询模块用于用户在需要进行检索时候输入查询信息用;所述查询信息包括查询关键词和数据信息的识别字眼;查询关键词包括查询名称信息和查询简介,查询简介为用户自主输入;所述文件查询模块用于将查询信息传输到控制器,所述控制器根据检索关键词自动从限期存储模块进行查询,查询过程如下:步骤一:获取到查询信息内数据信息的识别字眼,根据识别字眼锁定数据信息的类型并将该类文档类型标记为锁定数据信息组;步骤二:获取到查询信息内的查询名称信息,同时获取到锁定数据信息组内的检索信息组,之后获取对应检索信息组内检索信息的检索关键词,再之后获取检索关键词内的文件名称信息;将查询名称信息与文件名称信息进行比对;具体比对过程如下:S1:将查询名称信息与文件名称信息进行逐字比对,获取到查询名称信息与文件名称信息的重叠率C1i,i=1...n;S2:将C1i与预设值C1进行比对,获取所有大于C1的重叠率Ci对应的文件名称信息并将其标定为待确认文件名称信息组;S3:获取到待确认文件名称信息组对应的简介信息组,获取到查询信息内的查询简介;S4:将查询简介与简介信息组进行逐字比对,获取到查询简介与简介信息组的重合率C2i,i=1...n;S5:将C2i按照由大到小的顺序进行排序,获取前三名重合率对应的简介信息并将其标定为待选择简介信息组;步骤三:获取待选择简介信息组对应的检索信息内的路径信息组并将路径信息组标记为待选择路径信息组;步骤四:根据待选择路径信息组内的三组路径信息获取到对应的数据信息组并将其标定为待选择数据信息组;所述控制器用于将待选择数据信息组传输到显示模块进行实时显示,所述控制器用于将待选择数据信息组返回到文件查询模块用于用户输入目标数据信息,所述文件查询模块用于向控制器传输目标数据信息,所述控制器接收到目标数据信息并将目标数据信息传输到调用监控模块,所述调用监控模块用于将目标数据信息打上时间戳之后传输到调用记录模块,所述调用记录模块用于接收调用监控模块每一次传输到目标数据信息并进行下述处理:步骤一:获取到接收到的所有目标数据信息最后一次的时间戳并将其标记为Ti,i=1...n;步骤二:将Ti按照时间由近到远的顺序进行排序;步骤三:并将Ti与当天时间进行比对计算得到距当天过去的时间信息Tji,i=1...n;...

【专利技术属性】
技术研发人员:方明权蔡章利蒋政
申请(专利权)人:重庆满集网络科技有限公司
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1