【技术实现步骤摘要】
基于I/O模式的存储系统延迟评估
技术介绍
在数据存储网络中,延迟是存储设备响应或服务数据请求(例如输入/输出(I/O)请求)所需的或使用的时间量。比一般延迟时间更高或更长的延迟时间表示使用数据存储网络的应用程序所经历的数据存储网络的性能退化。传统的数据存储网络性能评估过程测量延迟时间,以确定数据存储网络是否正经历性能退化。然而,传统的基于延迟的性能评估方法已经显示出高度不准确,因为数据存储网络性能受多个因素的影响而非仅仅延迟时间。更具体地,已知数据存储网络性能取决于数据存储网络的应用程序工作量的各种特性,例如诸如I/O请求的大小、CPU饱和度、端口饱和度、磁盘饱和度、队列深度和高速缓存未命中等。因此,传统的用于数据存储网络的基于延迟的性能评估方法易于产生不准确的结果并且错误地指示性能退化。因此,对数据存储网络及其管理员的挑战是如何准确地识别存储环境中是否存在性能问题,以及如果识别出性能问题,则识别性能问题的可能原因。传统的数据存储网络的另一个挑战是识别基于延迟的性能退化的根本原因,因为传统的基于延迟的性能评估技术不能分析或以其他方式确定会引起延迟问题的因素。此外,传统 ...
【技术保护点】
1.一种用于识别数据存储网络中的延迟贡献者的方法,所述方法包括:根据训练数据创建用于数据存储网络的历史工作量指纹模型,包括:在采样间隔内记录来自存储网络的所述训练数据,其中所述训练数据包括用于所述数据存储网络的总数据延迟指标和平均数据延迟指标;创建表示所述训练数据的带标记的点数据结构;创建表示所述带标记的点数据结构中的所述训练数据的二进制直方图;对所述带标记的点数据结构运行聚类算法,以生成训练数据工作量类型的聚类;并且识别用于所述训练数据的每个工作量类型的延迟阈值;监视来自所述数据存储网络的当前样本数据,并将所述当前样本数据分类为聚类、当前工作量指纹和当前工作量类型;基于所 ...
【技术特征摘要】
2018.04.30 IN 2018410163131.一种用于识别数据存储网络中的延迟贡献者的方法,所述方法包括:根据训练数据创建用于数据存储网络的历史工作量指纹模型,包括:在采样间隔内记录来自存储网络的所述训练数据,其中所述训练数据包括用于所述数据存储网络的总数据延迟指标和平均数据延迟指标;创建表示所述训练数据的带标记的点数据结构;创建表示所述带标记的点数据结构中的所述训练数据的二进制直方图;对所述带标记的点数据结构运行聚类算法,以生成训练数据工作量类型的聚类;并且识别用于所述训练数据的每个工作量类型的延迟阈值;监视来自所述数据存储网络的当前样本数据,并将所述当前样本数据分类为聚类、当前工作量指纹和当前工作量类型;基于所述历史工作量指纹模型,为所述当前样本数据分配分数;并且将来自所述当前样本数据的所测量的延迟值与历史上所测量的延迟相关因素相关联,以创建延迟分数图表,所述延迟分数图表识别针对所述当前样本数据的引起所述数据存储网络中的延迟的因素。2.如权利要求1所述的方法,其中所述带标记的点数据结构表示各种大小的I/O在预定大小的组中的数量分布。3.如权利要求1所述的方法,其中所述聚类算法包括k均值聚类算法。4.如权利要求3所述的方法,其中所述k均值聚类算法的聚类大小被设置为八,以产生八个工作量类型的聚类,所述八个工作量类型的聚类包括构成所述历史工作量指纹模型的工作量指纹。5.如权利要求1所述的方法,其中所述聚类算法包括高斯混合模型聚类算法。6.如权利要求1所述的方法,其中识别用于所述训练数据的每个工作量类型的延迟阈值包括:生成与所识别的延迟阈值对应的延迟表。7.如权利要求6所述的方法,进一步包括:将所述聚类算法应用于所述训练数据,以基于延迟表中的位置将所述数据分类为用于所记录的延迟值的工作量指纹和工作量类型。8.如权利要求1所述的方法,其中所述历史工作量指纹模型包括十六维向量,所述十六维向量至少表示所述训练数据中的I/O计数、所述训练数据的读/写比率以及所述训练数据中的高速缓存命中百分比。9.如权利要求1所述的方法,其中识别用于每个训练数据工作量类型的延迟阈值包括:识别用于训练数据工作量类型的数据点或位置,其中在所述数据点或位置处,延迟百分位数斜率图从基本上水平的斜率变为基本垂直的斜率。10.一种非暂时性计算机可读介质,包括存储在所述非暂时性计算机可读介质上的计算机可执行指令,当所述计算机可执行指令由处理器执行时,使得所述处理器执行识别数据存储网络中的延迟贡献者的方法,所述方法包括:根据训练数据创建用于数据存储网络的历史工作量指纹模型,所述工作量指纹模型包括表示至少训练数据中的I/O计数、所述训练数据的读/写比率和所述训练数据中的高速缓存命中百分比的多维向量;监视来自所述数据存储网络的当前样本数据并将所述当前样本数据分类为聚类、当前工作量指纹和当前工作量类型;基于所述历史工作量指纹模型,为所述当前样本数据分配分数;并且将来自所述当前样本数据的所测量的延迟值与历史上所测量的延迟相关因素相关联,以创建延迟分数图表,所述延迟分数图表确定针对所述当前样本数据的引起所述数据存储网络中的延迟的因素。11.如权利要求10所述的非暂时性计算机可读介质,其中所述多维具...
【专利技术属性】
技术研发人员:M·杜塔,M·斯里瓦特萨夫,约翰·J·森根伯格,
申请(专利权)人:慧与发展有限责任合伙企业,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。