【技术实现步骤摘要】
一种基于深度学习的企业云盘用的文件分类方法
[0001]本专利技术涉及人工智能领域,尤其涉及一种基于深度学习的企业云盘用的文件分类方法。
技术介绍
[0002]在日常的工作中,大中型企业文档资料数量大,文件类型多,在用企业云盘进行资料管理和维护,而一般企业云盘不具备智能文件分类功能或者是只具备简易的不可学习的文件分类功能,这功能需要人工参与维护,耗时大,工作繁琐,还需要对所有文件夹有个详细了解,否在就会出现整理归档错的问题。
[0003]而随着人工智能的发展,目前已能通过文件名分词计算逻辑,去提取文件名的关键词,还能建立连词库模型,过滤池库模型,对关键词的提取做出对应的调整。也具备计算出字符串中某个名词的权重技术。
[0004]文件分词能力目前分词准确性较低,需要长期训练,扩充连词库和过滤池库来调整文件分词的准确性,其次在分词中,只能对文件名存在的名称进行提取,不能关联出他的近义词、同义词等,权重计算技术,只能计算出名称在字符串中的权重,没法根据日常情况进行初始权重的调整,这些都会造成文件分类出错。文件分类出 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的企业云盘用的文件分类方法,其特征在于:其包括以下步骤:步骤1,创建连词库、过滤词库、映射词库,连词库、过滤词库和映射词库均支持自定义配置,使用者可将日常沉淀的语法规则录入词库中;步骤2,通过预设的程序对指定文件夹进行分类事件监听;步骤3,获取到要进行分类整理的文件名,并对文件名进行预处理;步骤4,对文件名通过分词算法,结合连词库、过滤词库提取文件的关键词;步骤5,根据关键词去映射词库取出映射次及映射权重,加入关键词集合中;步骤6,遍历关键词集合,根据权重算法,去计算文件夹路径对应的权重;步骤7,根据权重,取出权重最大的关键词和对应的文件夹路径,将文件迁移到对应路径下,以形成文件分类结果;步骤8,根据文件分类结果页面中文件的关键词集合和对应的权重,通过连词库管理和过滤词库对关键词进行调整,避免下次文件分类关键词计算取错。2.根据权利要求1所述的一种基于深度学习的企业云盘用的文件分类方法,其特征在于:步骤2中客户通过右键上传、拖动上传、按钮上传文件到公共目录下,将触发文件分类逻辑。3.根据权利要求1所述的一种基于深度学习的企业云盘用的文件分类方法,其特征在于:步骤3中将用户上传文件的文件名取出进行预处理,过滤特...
【专利技术属性】
技术研发人员:周景峰,范荣木,王毅铭,
申请(专利权)人:中电福富信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。