确定垃圾文件大小的方法和装置及电子设备制造方法及图纸

技术编号:12612974 阅读:35 留言:0更新日期:2015-12-30 11:41
本发明专利技术提出一种确定垃圾文件大小的方法和装置及电子设备,该确定垃圾文件大小的方法包括:获取已有的所有目标区域中每个目标区域的用于进行垃圾文件清理的特征点数据;根据所述特征点数据,将所述所有目标区域分成训练集和测试集;根据所述训练集中每个目标区域的特征点数据,确定所述测试集中每个目标区域的首次可清理的垃圾文件大小。该方法能够预估出每个目标区域的首次可清理的垃圾文件大小。

【技术实现步骤摘要】

本专利技术涉及垃圾文件清理
,尤其涉及一种确定垃圾文件大小的方法和装置及电子设备
技术介绍
当前用户手机存储中,由于应用的开发规范不当,导致大量存储空间被无用数据占用,致使手机存储空间不足,存储数据杂乱不堪,因此清理更多的无用数据,释放更多存储空间,成为用户的强烈需求。而各国清理需求并不一致,需结合各国因素预估该国首次可清理的垃圾文件大小,进而可以根据该大小制定相应的运营策略。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种确定垃圾文件大小的方法,该方法可以预估出每个目标区域的首次可清理的垃圾文件大小。本专利技术的另一个目的在于提出一种确定垃圾文件大小的装置。本专利技术的另一个目的在于提出一种电子设备。为达到上述目的,本专利技术第一方面实施例提出的确定垃圾文件大小的方法,包括:获取已有的所有目标区域中每个目标区域的用于进行垃圾文件清理的特征点数据;根据所述特征点数据,将所述所有目标区域分成训练集和测试集;根据所述训练集中每个目标区域的特征点数据,确定所述测试集中每个目标区域的首次可清理的垃圾文件大小。可选的,所述根据所述特征点数据,将所述所有目标区域分成训练集和测试集,包括:根据所述特征点数据,确定所述所有目标区域中每个目标区域的清理效果;按照所述清理效果从好到差的顺序,选择预设个数的目标区域组成训练集;将所述所有目标区域中除组成所述训练集的目标区域之外的其他目标区域,组成测试集。可选的,所述根据所述训练集中每个目标区域的特征点数据,确定所述测试集中每个目标区域的首次可清理的垃圾文件大小,包括:根据所述训练集中每个目标区域的特征点数据进行训练,得到对应每个目标区域的首次可清理的垃圾文件大小与所述特征点数据之间的函数关系;根据所述函数关系,以及所述测试集中每个目标区域的特征点数据,得到所述测试集中每个目标区域的首次可清理的垃圾文件大小。可选的,所述根据所述训练集中每个目标区域的特征点数据进行训练,得到对应每个目标区域的首次可清理的垃圾文件大小与所述特征点数据之间的函数关系,包括:采用分类回归树算法,根据所述训练集中每个目标区域的特征点数据进行训练,得到对应每个目标区域的首次可清理的垃圾文件大小与所述特征点数据之间的函数关系。可选的,所述确定所述测试集中每个目标区域的首次可清理的垃圾文件大小之后,所述方法还包括:根据确定出的每个目标区域的首次可清理的垃圾文件大小,计算预设的衡量参数;判断所述衡量参数是否满足预设的最优条件;如果满足,保存所述确定出的每个目标区域的首次可清理的垃圾文件大小。可选的,所述判断所述衡量参数是否满足预设的最优条件之后,所述方法还包括:如果不满足,重新组成新的训练集和测试集,并重新确定新的测试集中每个目标区域的首次可清理的垃圾文件大小。可选的,所述确定所述测试集中每个目标区域的首次可清理的垃圾文件大小之后,所述方法还包括:按照首次可清理的垃圾文件大小的从大到小的顺序,对相应目标区域进行垃圾文件清理的处理。可选的,所述获取已有的所有目标区域中每个目标区域的特征点数据,包括:获取已有的所有目标区域中每个目标区域的初始数据;根据预设规则,对所述初始数据进行过滤,得到所述特征点数据。可选的,所述根据预设规则,对所述初始数据进行过滤,包括:去除所述初始数据中的无效数据。可选的,所述特征点数据包括如下项中的至少一项:已有的首次可清理的垃圾文件大小;首次垃圾清理的用户数;非首次可清理的垃圾文件大小;非首次垃圾清理的用户数;安装比例较高的预设个数的安装包中已运营的安装包的占比率;要完成预设比例的覆盖率,剩余待运营的安装包个数;平均安装包个数;不同机型的占比率;检出的首次可清理的垃圾文件大小在预设范围内的用户数的占比率。本专利技术第一方面实施例提出的确定垃圾文件大小的方法,通过得到训练集和测试集,并根据训练集中每个目标区域的特征点数据得到测试集中每个目标区域的首次可清理的垃圾文件大小,可以预估出每个目标区域的首次可清理的垃圾文件大小。为达到上述目的,本专利技术第二方面实施例提出的确定垃圾文件大小的装置,包括:获取模块,用于获取已有的所有目标区域中每个目标区域的用于进行垃圾文件清理的特征点数据;划分模块,用于根据所述特征点数据,将所述所有目标区域分成训练集和测试集;确定模块,用于根据所述训练集中每个目标区域的特征点数据,确定所述测试集中每个目标区域的首次可清理的垃圾文件大小。可选的,所述划分模块具体用于:根据所述特征点数据,确定所述所有目标区域中每个目标区域的清理效果;按照所述清理效果从好到差的顺序,选择预设个数的目标区域组成训练集;将所述所有目标区域中除组成所述训练集的目标区域之外的其他目标区域,组成测试集。可选的,所述确定模块包括:第一单元,用于根据所述训练集中每个目标区域的特征点数据进行训练,得到对应每个目标区域的首次可清理的垃圾文件大小与所述特征点数据之间的函数关系;第二单元,用于根据所述函数关系,以及所述测试集中每个目标区域的特征点数据,得到所述测试集中每个目标区域的首次可清理的垃圾文件大小。可选的,所述第一单元具体用于:采用分类回归树算法,根据所述训练集中每个目标区域的特征点数据进行训练,得到对应每个目标区域的首次可清理的垃圾文件大小与所述特征点数据之间的函数关系。可选的,还包括:计算模块,用于根据确定出的每个目标区域的首次可清理的垃圾文件大小,计算预设的衡量参数;判断模块,用于判断所述衡量参数是否满足预设的最优条件;保存模块,用于如果满足,保存所述确定出的每个目标区域的首次可清理的垃圾文件大小。可选的,还包括:调整模块,用于如果不满足,重新组成新的训练集和测试集,并重新确定新的测试集中每个目标区域的首次可清理的垃圾文件大小。可选的,还包括:处理模块,用于按照首次可清理的垃圾文件大小的从大到小的顺序,对相应目标区域进行垃圾文件清理的处理。可选的,所述获取模块具体用于:获取已有的所有目标区域中每个目标区域的初始数据;根据预设规则,对所述初始数据进行过滤,得到所述特征点数据。可选的,所述获取模块具体用于根据预设规则,对所述初始数据进行过滤,得到所述特征点数据,包括:去除所述初始数据中的无效数据。本专利技术第二方面实施例提出的确定垃圾文件大小的装置,通过得到训练集和测试集,并根据训练集中每个目标区域的特征点数据得到测试集中每个目标区域的首次可清理的垃圾文件大小,可以预估出每个目标区域的首次可清理的垃圾文件大小。为达到上述目的,本专利技术第三方面实施例提出的电子设备,包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行以下步骤:获取已有的所有目标区域中每个目标区域的用于进行垃圾文件清理的特征点数据;根据所述特征点数据,将所述所有目标区域分成训练集和测试集;根据所述训练集中每个目标区域的特征点数据,确定所述测试集中每个目标区域的首次可清理的垃圾文件大小。可选的,所述根据所述特征点数据,将所述所有目标区域分成训练集和测试集,包本文档来自技高网...

【技术保护点】
一种确定垃圾文件大小的方法,其特征在于,包括:获取已有的所有目标区域中每个目标区域的用于进行垃圾文件清理的特征点数据;根据所述特征点数据,将所述所有目标区域分成训练集和测试集;根据所述训练集中每个目标区域的特征点数据,确定所述测试集中每个目标区域的首次可清理的垃圾文件大小。

【技术特征摘要】

【专利技术属性】
技术研发人员:闫泳杉
申请(专利权)人:北京金山安全软件有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1