基于机器学习的文件系统参数自动调优方法及系统技术方案

技术编号：20865968 阅读：28 留言：0更新日期：2019-04-17 09:15

本发明专利技术公开了基于机器学习的文件系统参数自动调优方法及系统，方法包括：获取文件系统的读写比例；对文件系统的参数进行修改，然后分别在不同读写比例下测试文件系统的负载的访问性能；根据测试得到的访问性能，识别文件系统的关键参数；根据文件系统的读写比例、访问性能以及关键参数，通过深度神经网络训练得到预测模型；根据预测模型的输出值，通过负载匹配方法和遗传算法，获取文件系统的推荐参数。本发明专利技术通过机器学习技术，将文件系统的参数调整实现为自动化流程，大大降低了人工成本，提高了工作效率；另外，本发明专利技术能够对不同的文件系统和硬件环境进行参数调优，提高了通用性，可广泛应用于机器学习技术领域。

全部详细技术资料下载

【技术实现步骤摘要】
基于机器学习的文件系统参数自动调优方法及系统
本专利技术涉及机器学习
，尤其是基于机器学习的文件系统参数自动调优方法及系统。
技术介绍
系统软件的高效运行需要对其自身的多种参数进行人工设定，例如：(1)关系型数据库中日志文件(Logfilesize)的大小；(2)操作系统虚拟内存大小以及(3)文件系统的页缓存大小(PageCache)等等。但是，在一般情况下，由于此类参数的默认值并不适用于所有的上层多样应用程序。因此，需要人工劳力，例如数据库管理员或者系统运维人员，去监控应用程序的运行数据，总结其运行特征，然后再对系统软件进行参数调整，使得系统环境能够和该应用程序的运行特征互相适配，以达到较优的性能。由于系统软件的底层性和特殊性，导致其可调整的参数数量一般较多，这不仅加大了人工调整的工作量，也减慢了系统软件与特定应用程序之间的匹配速度，从而降低了应用程序的运行性能。而且，不合适的参数配置甚至会导致系统软件出现运行错误，从而引起应用程序或者整个系统的崩溃。现有技术提出了通过机器学习技术，对某一系统软件进行参数自动推荐和调优。但是，目前的参数推荐和调优方法只能对某一系统软件类型的指定系统发挥作用，通用性差。
技术实现思路
为解决上述技术问题，本专利技术的目的在于：提供一种效率高且通用性强的，基于机器学习的文件系统参数自动调优方法及系统。本专利技术一方面所采取的技术方案为：基于机器学习的文件系统参数自动调优方法，包括以下步骤：获取文件系统的读写比例；对文件系统的参数进行修改，然后分别在不同读写比例下测试文件系统的负载的访问性能；根据测试得到的访问性能，识别文件...

【技术保护点】
1.基于机器学习的文件系统参数自动调优方法，其特征在于：包括以下步骤：获取文件系统的读写比例；对文件系统的参数进行修改，然后分别在不同读写比例下测试文件系统的负载的访问性能；根据测试得到的访问性能，识别文件系统的关键参数；根据文件系统的读写比例、访问性能以及关键参数，通过深度神经网络训练得到预测模型；根据预测模型的输出值，通过负载匹配方法和遗传算法，获取文件系统的推荐参数。

【技术特征摘要】
1.基于机器学习的文件系统参数自动调优方法，其特征在于：包括以下步骤：获取文件系统的读写比例；对文件系统的参数进行修改，然后分别在不同读写比例下测试文件系统的负载的访问性能；根据测试得到的访问性能，识别文件系统的关键参数；根据文件系统的读写比例、访问性能以及关键参数，通过深度神经网络训练得到预测模型；根据预测模型的输出值，通过负载匹配方法和遗传算法，获取文件系统的推荐参数。2.根据权利要求1所述的基于机器学习的文件系统参数自动调优方法，其特征在于：所述对文件系统的参数进行修改，然后分别在不同读写比例下测试文件系统的负载的访问性能这一步骤，包括以下步骤：判断文件系统的参数的类型，其中，参数的类型包括离散型和连续型；若参数类型为离散型，则获取文件系统的所有参数值；若参数类型为连续型，则获取文件系统的默认参数值、最大参数值以及最小参数值；根据获取的参数值，基于不同的读写比例生成不同类型的负载；用不同类型的负载分别访问文件系统，得到访问性能的测试结果。3.根据权利要求2所述的基于机器学习的文件系统参数自动调优方法，其特征在于：所述根据测试得到的访问性能，识别文件系统的关键参数这一步骤，包括以下步骤：根据参数值、负载类型以及负载的访问性能，生成初始数据集；对初始数据集进行剥离操作，得到最终数据集；通过岭回归方法对最终数据集进行处理，得到参数的回归系数；对参数的回归系数进行排序，选取设定个数的参数作为关键参数。4.根据权利要求3所述的基于机器学习的文件系统参数自动调优方法，其特征在于：所述根据文件系统的读写比例、访问性能以及关键参数，通过深度神经网络训练得到预测模型这一步骤，包括以下步骤：根据关键参数、所述关键参数对应的负载类型以及所述关键参数对应的访问性能，生成训练数据集；将训练数据集划分为训练集和验证集；将训练集中的关键参数及所述关键参数的负载类型输入深度神经网络；通过深度神经网络输出文件系统的预测访问性能；根据验证集，通过损失函数计算预测访问性能与实际访问性能的第一距离；根据计算得到的第一距离，采用随机梯度下降法对参数进行实时更新。5.根据权利要求1所述的...

【专利技术属性】
技术研发人员：李丁丁，林荣华，吴正洋，汤庸，
申请(专利权)人：华南师范大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人