【技术实现步骤摘要】
微服务系统的故障根因定位方法、装置和设备
[0001]本申请涉及故障检测领域,更具体地说,涉及微服务系统的故障根因定位方法、装置和设备。
技术介绍
[0002]近年来,各大企业逐步使用松耦合的轻量级微服务框架取代单一应用程序,服务应用程序的低耦合特性使得每个服务能够独立重构和动态伸缩。尽管在现代微服务架构中有各种弹性策略,例如负载均衡,但由于资源消耗、网络阻塞等原因,微服务应用程序的系统范围异常仍然普遍存在。一些高延迟的性能问题发生得非常频繁,且发生频次也显著地高于可用性问题的发生,这些性能问题通常比较隐蔽,很难被发现。
[0003]分布式追踪是微服务系统性能故障诊断的主流工具。在大型微服务系统中,一个请求通常由部署在不同节点、不同数据中心的多个服务处理。分布式追踪记录了系统完成用户请求的详细执行逻辑与执行情况,包括服务实例的调用路径和服务实例之间调用的延迟信息。由于分布式追踪在捕获服务实例之间的交互方面具有不可替代的优势,分布式追踪已经成为不可或缺的基础监控设施。分布式追踪是获得对微服务系统的洞察和可观察性的一项重 ...
【技术保护点】
【技术特征摘要】
1.一种微服务系统的故障根因定位方法,其特征在于,包括:收集当前时间段内微服务系统的追踪数据,并根据调用的类型分成多个调用对;利用分布式分位数草图算法计算各个所述调用对处理时间的分位数,并编码为所述当前时间段对应的状态向量;采用鲁棒随机森林算法对所述状态向量进行异常分析,确定所述状态向量的异常得分;基于所述异常得分对故障进行根因定位。2.根据权利要求1所述的方法,其特征在于,所述利用分布式分位数草图算法计算各个所述调用对处理时间的分位数,包括:根据预设的尾部相对误差率、边界和头部误差,对所述各个调用对处理时间进行数据划分,生成头部数据和尾部数据;分别使用相对应的桶对所述各个调用对处理时间的所述头部数据和所述尾部数据进行数据处理,生成记录有所述各个调用对处理时间分布情况的各个目标桶;基于预设的分位数率,以及所述各个目标桶,确定各个调用对处理时间的分位数。3.根据权利要求1所述的方法,其特征在于,采用鲁棒随机森林算法对所述状态向量进行异常分析,确定所述状态向量的异常得分,包括:基于所述状态向量的时间序列进行维度切割,并生成当前鲁棒随机砍伐树;根据所述当前鲁棒随机砍伐树每一分支结点的切割率,以及所述鲁棒随机砍伐树的树大小,确定所述异常得分。4.根据权利要求3所述的方法,其特征在于,生成当前鲁棒随机砍伐树,包括:若所述当前时间段的上一时间段的初始鲁棒随机砍伐树为空,则在所述初始鲁棒随机砍伐树上创建一个叶子结点,并将所述状态向量赋值在所述叶子结点中,得到当前鲁棒随机砍伐树;若所述当前时间段的上一时间段的初始鲁棒随机砍伐树非空,则创建一个分支结点以及一个赋值有所述状态向量的叶子结点,根据随机选取的切割维度、切割值确定所述分支结点以及所述叶子结点的插入位置,并得到当前鲁棒随机砍伐树。5.根据权利要求4所述的方法,其特征在于,根据随机选取的切割维度、切割值确定所述分支结点以及所述叶子结点的插入位置,包括:若所述切割值小于所述切割维度对应的切割值区间的最小值,则确定所述叶子结点为所述分支节点的左子树,确定所述初始鲁棒随机砍伐树为所述分支结点的右子树...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。