基于深度学习的文件分类方法、装置、电子设备及介质制造方法及图纸

技术编号:31492313 阅读:29 留言:0更新日期:2021-12-18 12:29
本发明专利技术涉及人工智能技术,提供一种基于深度学习的文件分类方法,通过分词算法对文件前缀名称进行分词处理以获取每个文件的关键词,而后基于预设的价值分析模型,通过关键词对文件进行价值分析以获取各个文件的价值排名列表,再按照价值排名列表对所述文件进行维度划分以形成文件标签,并基于该文件标签对文件进行分类管理,遍历程序为具有遍历及标注功能的算法,通过预设的价值分析模型能够精准的获取同一层级的各个文件的价值排列,从而可根据价值排序进行取舍,以自动选择删除还是留存,若留存再根据标签进行分类处理,进而完成同一层级的文件的取舍和管理。级的文件的取舍和管理。级的文件的取舍和管理。

【技术实现步骤摘要】
基于深度学习的文件分类方法、装置、电子设备及介质


[0001]本专利技术涉及人工智能领域,涉及关键字提取技术,尤其涉及一种基于关键字提取技术的基于深度学习的文件分类方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]在计算机日常使用过程中,文件越积累越多,因此需定期整理和清除一些无效的文件,才能使得文件夹和文件井然有序,并释放出空间。
[0003]清理文件及文件夹的过程是相当耗费人的时间和精力的,目前多采用查杀软件进行文件检测,以检测出长期未使用的文件夹或文件,而后该查杀软件公布该文件的创建期限,并提示用户是否需要删除该文件以扩大存储空间,但该种方式仅仅能够获取长期未使用的文件,确不能够对其进行整理或分类,并且,若基于该查杀软件选择对长期未使用的文件进行删除处理,在一定期限内不易找回,因此若因为误操作选择了删除,则被删除的文件无法复原。
[0004]因此,亟需一种能够进行精准分类,且提高管理便利性的基于深度学习的文件分类方法。

技术实现思路

[0005]本专利技术提供一种基于深度学习的文件分类方法,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的文件分类方法,其特征在于,包括:通过预设的遍历程序对同一层级的文件进行遍历以获取文件名数据;拆分所述文件名数据中的文件前缀名称、文件后缀名称和分隔符,并通过分词算法对所述文件前缀名称进行分词处理以获取每个文件的关键词;基于预设的价值分析模型,通过所述关键词对所述文件进行价值分析以获取各个文件的价值排名列表;按照所述价值排名列表对所述文件进行维度划分以形成文件标签,并基于所述文件标签对所述文件进行分类管理。2.如权利要求1所述的基于深度学习的文件分类方法,其特征在于,所述通过预设的遍历程序对同一层级的文件进行遍历以获取文件名数据,包括:通过预设的检测程序对系统中包含的文件进行过滤以去除粉碎文件,并将剩余的文件进行分级处理以形成不同层级的文件;通过所述遍历程序遍历处于同一层级的文件以获取文件名,并在所述文件名的分隔符处标注标记符以形成文件字符;在所述文件字符中标注关于所述文件的规格信息以形成文件名数据。3.如权利要求1所述的基于深度学习的文件分类方法,其特征在于,在所述通过分词算法对所述文件前缀名称进行分词处理以获取每个文件的关键词之前,包括:通过分词样本数据创建分词库;利用所述分词样本数据训练卷积神经网络模型以形成词汇识别模型;连接所述词汇识别模型与所述分词库以创建分词算法。4.如权利要求3所述的基于深度学习的文件分类方法,其特征在于,所述通过分词算法对所述文件前缀名称进行分词处理以获取每个文件的关键词,包括:获取文件名数据;对所述文件名数据进行解析处理以获取文件字符;将所述文件字符拆分为文件前缀名称和文件后缀名称;通过所述分词算法使所述词汇识别模型对所述文件前缀名称进行拆分处理以形成拆分词,并将所述拆分词与所述分词库进行词汇对照,以判断所述拆分词是否包含在所述分词库中,若包含在所述分词库中,则将所述拆分词作为关键词,若不包含在所述分词库中,则通过所述词汇识别模型对所述文件字符进行再拆分处理以形成二阶拆分词,并将所述二阶拆分词作为所述关键词。5.如权利要求4所述的基于深度学习的文件分类方法,其特征在于,所述基于预设的价值分析模型,通过所述关键词对所述文件进行价值分析以获取各个文件的价值排名列表,包括:基于特定词汇构建价值分析模型;通过所述价值分析模型对所述关键词进行遍历分析,根据所述关键词中包含的特定词汇的个数与所述价值分类确定所述关键词的价值等级;基于所...

【专利技术属性】
技术研发人员:贾梦晓
申请(专利权)人:平安普惠企业管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1