The embodiment of this application provides a method and device for identifying the source of documents, which includes: acquiring the files stored in the preset time interval of the mobile terminals in a plurality of mobile terminals regularly and acquiring the application software of the mobile terminals; associating the files of the mobile terminals with their application software separately; and according to the files of the mobile terminals. According to the relationship between the files and the application software, the number of associations between the files and the application software is determined. According to the number of associations between the files and the application software, candidate applications related to the generation of the files are selected from the application software. The embodiment of the application improves the speed, efficiency and accuracy of identifying the source of documents, and also reduces the cost of identifying, thereby improving the speed of cleaning documents and reducing the cost of cleaning documents.
【技术实现步骤摘要】
文件来源识别方法及装置
本申请涉及计算机
,尤其涉及一种文件来源识别方法及装置。
技术介绍
目前,用户的移动终端中通常都安装有大量的应用软件,例如,视频应用软件、购物应用软件、通讯应用软件等,以满足用户对日常生活的需求。然而,在移动终端运行应用软件时,大部分的应用软件都会在移动终端的公共存储空间(即sdcard)中存储大量的文件,如日志文件、图片缓存文件、以及其他多媒体文件等。由于上述文件的存在,极大的浪费了移动终端的存储空间,从而使得移动终端性能降低,例如,移动终端运行速度降低等。为了解决由于移动终端中存储了大量的各应用软件生成的文件,而导致的移动终端性能降低的问题,需对移动终端中存储的文件进行清理。然而,在对移动终端中存储的文件进行清理时,首先要识别各文件的来源,即各文件是由那个应用软件生成的,然后,根据文件的来源确定是否要删除文件。当前,常采用人工运营的方式识别文件来源,然而,上述方式识别速度慢、成本高且很难覆盖到新生成的文件。
技术实现思路
本申请实施例的目的是提供一种文件来源识别方法及装置,以解决文件来源识别速度慢、成本高且很难覆盖到新生成的文件等问题。为达到以上目的,本申请实施例是这样实现的:本申请实施例提供了一种文件来源识别方法,包括:定时获取多个移动终端中的各所述移动终端在预设时间间隔内存储的文件,并获取各所述移动终端中的应用软件;分别将各所述移动终端的文件与其应用软件进行关联;根据各所述移动终端的文件与其应用软件的关联关系,确定各所述文件与各所述应用软件的关联次数;根据各所述文件与各所述应用软件的关联次数,从所述应用软件中选取与生成所述 ...
【技术保护点】
1.一种文件来源识别方法,其特征在于,包括:定时获取多个移动终端中的各所述移动终端在预设时间间隔内存储的文件,并获取各所述移动终端中的应用软件;分别将各所述移动终端的文件与其应用软件进行关联;根据各所述移动终端的文件与其应用软件的关联关系,确定各所述文件与各所述应用软件的关联次数;根据各所述文件与各所述应用软件的关联次数,从所述应用软件中选取与生成所述文件相关的候选应用软件。
【技术特征摘要】
1.一种文件来源识别方法,其特征在于,包括:定时获取多个移动终端中的各所述移动终端在预设时间间隔内存储的文件,并获取各所述移动终端中的应用软件;分别将各所述移动终端的文件与其应用软件进行关联;根据各所述移动终端的文件与其应用软件的关联关系,确定各所述文件与各所述应用软件的关联次数;根据各所述文件与各所述应用软件的关联次数,从所述应用软件中选取与生成所述文件相关的候选应用软件。2.根据权利要求1所述的文件来源识别方法,其特征在于,所述定时获取多个移动终端中的各所述移动终端在预设时间间隔内存储的文件,并获取各所述移动终端中的应用软件包括:按照一预设频率获取多个移动终端中的各所述移动终端在所述预设时间间隔内存储的文件,并在所述预设时间间隔的结束时刻获取各所述移动终端中已安装的应用软件。3.根据权利要求1所述的文件来源识别方法,其特征在于,所述分别将各所述移动终端的文件与其应用软件进行关联包括:分别将各所述移动终端中的各所述文件与其中的各所述应用软件作为一个关联信息存储在一关联数据表中。4.根据权利要求1所述的文件来源识别方法,其特征在于,所述分别将各所述移动终端的文件与其应用软件进行关联包括:根据所述文件的生成时间和所述应用软件的安装时间,分别将各所述移动终端的文件与其应用软件进行关联。5.根据权利要求1所述的文件来源识别方法,其特征在于,所述分别将各所述移动终端的文件与其应用软件进行关联包括:根据由大数据统计得到的关联规则表,分别将各所述移动终端的文件与其应用软件进行关联,其中,所述关联规则表包括多个已知的文件与应用软件的关联信息。6.根据权利要求5所述的文件来源识别方法,其特征在于,所述根据由大数据统计得到的关联规则表,分别将各所述移动终端的文件与其应用软件进行关联包括:根据所述文件的名称和存储路径计算各所述移动终端中的文件与关联规则表中的每一个关联信息中的文件的相似度;将关联规则表中与各所述移动终端中的文件的相似度大于预设相似度的文件所对应的关联信息中的应用软件确定为对应的各所述移动终端中的文件的待关联应用软件;判断各所述移动终端中的应用软件中是否存在与其中的文件的待关联应用软件相同的应用软件,若存在,将各所述移动终端中的文件与其中的与文件的待关联应用软件相同的应用软件进行关联。7.根据权利要求1所述的文件来源识别方法,其特征在于,所述方法还包括:根据各所述文件与各所述候选应用软件的关联次数,分别将与各所述文件的关联次数最多的候选应用软件确定为生成各所述文件的应用软件。8.根据权利要求1所述的文件来源识别方法,其特征在于,所述方法还包括:获取各所述文件的名称和存储路径,并分别对与生成各所述文件相关的候选应用软件进行扫描,以获得与生成各所述文件相关的候选应用软件的扫描数据;判断与生成各所述文件相关的候选应用软件的扫描数据中是否包括对应的所述文件的名称和存储路径;将与生成各所述文件相关的候选应用软件的扫描数据中包括对应的所述文件的名称和存储路径的候选应用...
【专利技术属性】
技术研发人员:唐淳,李涛,
申请(专利权)人:麒麟合盛网络技术股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。