一种文件数量统计方法、装置、设备及存储介质制造方法及图纸

技术编号:27274540 阅读:23 留言:0更新日期:2021-02-06 11:40
本发明专利技术涉及一种文件数量统计方法、装置、设备及存储介质。该统计方法包括如下步骤:获取第一请求,第一请求携带有第一待查目录文件的标识;根据第一待查目录文件的标识确定第一待查目录文件,并获取第一待查目录文件的空间占用值;若第一待查目录文件的空间占用值大于等于第一预设阈值,则确定第一文件数量统计模式;第一文件数量统计模式包括文件采样规则和文件数量统计模型;利用文件采样规则对第一待查目录文件进行采样,得到文件采样信息;根据文件采样信息和第一待查目录文件的空间占用值按照文件数量统计模型确定出第一待查目录文件包含的文件数量。本申请提供的文件数量统计方法具有资源消耗小和执行效率高的特点。计方法具有资源消耗小和执行效率高的特点。计方法具有资源消耗小和执行效率高的特点。

【技术实现步骤摘要】
一种文件数量统计方法、装置、设备及存储介质


[0001]本专利技术涉及计算机
,特别涉及一种文件数量统计方法、装置、设备及存储介质。

技术介绍

[0002]在系统运行过程中,由于对目录规划设置不合理,或缺少文件清理机制,或出现程序异常情况,则可能会导致目录下文件大量堆积的异常情况,若文件持续堆积,当目录中的文件数目达到一定数量级(例如:百万级别),目录文件的物理存储结构就会变得过于庞大,会导致访问该目录时文件读写时延变大,系统输入和输出(IO,input and output)时间变长,同时使得占用的中央处理器(CPU,central processing unit)资源增加,进而会导致处理时间缓慢和系统成功率下降等问题产生,严重时甚至会导致服务器夯死,造成损失。
[0003]针对目录文件堆积导致的运行风险,迫切需要对目录文件数量进行有效的统计,但是由于对于大目录文件数量统计存在执行时间长、消耗系统资源大的突出问题,目前还没有有效的解决方案,现有的各种统计软件、产品均无法实现对目录文件数进行有效统计。

技术实现思路

[0004]本专利技术要解决的是现有统计目录文件时间长、系统资源消耗大的技术问题。
[0005]为解决上述技术问题,本申请在一方面公开了一种文件数量统计方法,其包括:
[0006]获取第一请求,该第一请求携带有第一待查目录文件的标识;
[0007]根据该第一待查目录文件的标识确定该第一待查目录文件,并获取该第一待查目录文件的空间占用值;
[0008]若该第一待查目录文件的空间占用值大于等于第一预设阈值,则确定第一文件数量统计模式;该第一文件数量统计模式包括文件采样规则和文件数量统计模型;
[0009]利用该文件采样规则对该第一待查目录文件进行采样,得到文件采样信息;
[0010]根据该文件采样信息和该第一待查目录文件的空间占用值按照该文件数量统计模型确定出该第一待查目录文件包含的文件数量。
[0011]可选地,该利用该文件采样规则对该第一待查目录文件进行采样,得到文件采样信息,包括:
[0012]对该第一待查目录文件进行采样,确定该第一待查目录文件上的多个采样点;该多个采样点中任意两个相邻的采样点之间的间距等于预设步长;该第一待查目录文件包括多个子文件;
[0013]获取每个该采样点对应的子文件的文件信息,得到文件信息集;
[0014]根据该文件信息集确定出该文件采样信息。
[0015]可选地,该文件信息包括采样次数信息,次级文件存在信息和结构体体量信息;文件采样信息包括采样次数,次级文件存在次数和结构体体量值;
[0016]该根据文件信息集确定出该文件采样信息,包括:
[0017]根据该文件信息集中多个采样次数信息确定该该采样次数;
[0018]根据该文件信息集中多个次级文件存在信息确定该次级文件存在次数;
[0019]根据该文件信息集中多个结构体体量信息确定该结构体体量值。
[0020]可选地,该根据该文件采样信息和该第一待查目录文件的空间占用值按照该文件数量统计模型确定出该第一待查目录文件包含的文件数量,包括:
[0021]针对该文件数量统计模型根据该采样次数和该次级文件存在次数确定出文件填充率;
[0022]根据多个该结构体体量值确定出平均结构体体量值;
[0023]根据该文件填充率、该平均结构体体量值和该第一待查目录文件的空间占用值确定出该第一待查目录文件包含的文件数量。
[0024]可选地,该根据该第一待查目录文件的标识确定该第一待查目录文件,并获取该第一待查目录文件的空间占用值之后,还包括:
[0025]若该第一待查目录文件的空间占用值大于等于第二预设阈值且小于该第一预设阈值,则确定第二文件数量统计模式;
[0026]基于该第二文件数量统计模式对该第一待查目录文件的文件内容信息进行遍历,得到遍历结果;
[0027]根据该遍历结果确定出该第一待查目录文件包含的文件数量。
[0028]可选地,该获取第一请求,该第一请求携带有第一待查目录文件的标识之前,还包括:
[0029]获取第二请求,该第二请求携带有第二待查目录的标识;
[0030]根据该第二待查目录文件的标识确定该第二待查目录文件,并获取该第二待查目录文件的空间占用值;
[0031]若该第二待查目录文件的空间占用值大于等于该第二预设阈值,则确定该第二待查目录文件为第一待查目录文件。
[0032]可选地,该获取第一请求,该第一请求携带有第一待查目录文件的标识之前,还包括:
[0033]获取第三请求,该第三请求携带有待查文件系统的标识;
[0034]根据该待查文件系统的标识确定该待查文件系统,并获取该待查文件系统的文件数量索引信息;
[0035]根据该文件数量索引信息确定该待查文件系统的文件数量值;
[0036]若该待查文件系统的文件数量值大于等于第三预设阈值,则确定该待查文件系统的目录文件为待查目录文件。
[0037]本申请在另一方面还公开了一种文件数量统计装置,其包括:
[0038]获取模块,用于获取第一请求,该第一请求携带有第一待查目录文件的标识;
[0039]第一确定模块,用于根据该第一待查目录文件的标识确定该第一待查目录文件,并获取该第一待查目录文件的空间占用值;
[0040]第二确定模块,用于若该第一待查目录文件的空间占用值大于等于第一预设阈值,则确定第一文件数量统计模式;该第一文件数量统计模式包括文件采样规则和文件数量统计模型;
[0041]采样模块,用于利用该文件采样规则对该第一待查目录文件进行采样,得到文件采样信息;
[0042]第三确定模块,用于根据该文件采样信息和该第一待查目录文件的空间占用值按照该文件数量统计模型确定出该第一待查目录文件包含的文件数量。
[0043]本申请在另一方面还公开了一种设备,该设备包括处理器和存储器,该存储器中存储有至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、该至少一段程序、该代码集或指令集由该处理器加载并执行以实现上述的文件数量统计方法。
[0044]本申请在另一方面还公开了一种计算机存储介质,该计算机存储介质中存储有至少一条指令或至少一段程序,该至少一条指令或至少一段程序由处理器加载并执行以实现上述的文件数量统计方法。
[0045]采用上述技术方案,本申请提供的文件数量统计方法具有如下有益效果:
[0046]本申请提供的一种文件数量统计方法包括如下步骤:获取第一请求,该第一请求携带有第一待查目录文件的标识;根据该第一待查目录文件的标识确定该第一待查目录文件,并获取该第一待查目录文件的空间占用值;若该第一待查目录文件的空间占用值大于等于第一预设阈值,则确定第一文件数量统计模式;该第一文件数量统计模式包括文件采样规则和文件数量统计模型;利用该文件采样规则对该第一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文件数量统计方法,其特征在于,包括:获取第一请求,所述第一请求携带有第一待查目录文件的标识;根据所述第一待查目录文件的标识确定所述第一待查目录文件,并获取所述第一待查目录文件的空间占用值;若所述第一待查目录文件的空间占用值大于等于第一预设阈值,则确定第一文件数量统计模式;所述第一文件数量统计模式包括文件采样规则和文件数量统计模型;利用所述文件采样规则对所述第一待查目录文件进行采样,得到文件采样信息;根据所述文件采样信息和所述第一待查目录文件的空间占用值按照所述文件数量统计模型确定出所述第一待查目录文件包含的文件数量。2.根据权利要求1所述的统计方法,其特征在于,所述利用所述文件采样规则对所述第一待查目录文件进行采样,得到文件采样信息,包括:对所述第一待查目录文件进行采样,确定所述第一待查目录文件上的多个采样点;所述多个采样点中任意两个相邻的采样点之间的间距等于预设步长;所述第一待查目录文件包括多个子文件;获取每个所述采样点对应的子文件的文件信息,得到文件信息集;根据所述文件信息集确定出所述文件采样信息。3.根据权利要求2所述的统计方法,其特征在于,所述文件信息包括采样次数信息,次级文件存在信息和结构体体量信息;文件采样信息包括采样次数,次级文件存在次数和结构体体量值;所述根据文件信息集确定出所述文件采样信息,包括:根据所述文件信息集中多个采样次数信息确定所述所述采样次数;根据所述文件信息集中多个次级文件存在信息确定所述次级文件存在次数;根据所述文件信息集中多个结构体体量信息确定所述结构体体量值。4.根据权利要求3所述的统计方法,其特征在于,所述根据所述文件采样信息和所述第一待查目录文件的空间占用值按照所述文件数量统计模型确定出所述第一待查目录文件包含的文件数量,包括:针对所述文件数量统计模型根据所述采样次数和所述次级文件存在次数确定出文件填充率;根据多个所述结构体体量值确定出平均结构体体量值;根据所述文件填充率、所述平均结构体体量值和所述第一待查目录文件的空间占用值确定出所述第一待查目录文件包含的文件数量。5.根据权利要求1所述的统计方法,其特征在于,所述根据所述第一待查目录文件的标识确定所述第一待查目录文件,并获取所述第一待查目录文件的空间占用值之后,还包括:若所述第一待查目录文件的空间占用值大于等于第二预设阈值且小于所述第一预设阈值,则确定第二文件数量统计模式;...

【专利技术属性】
技术研发人员:安卫杰
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1