【技术实现步骤摘要】
多维度数据的数据分析方法、装置及存储介质
本专利技术涉及信息
,尤其涉及一种多维度数据的数据分析方法、装置及计算机可读存储介质。
技术介绍
为了更好地实时了解和分析服务的运行状况,互联网公司通常会在采集监控数据时,附上尽可能多的属性标签,如UA(UserAgent,用户代理)、网络制式、地理位置等。标签是从不同的角度或维度对数据的描述,不同维度的描述信息使该采集数据具有强大的表达能力,构成了该采集数据的多维度数据。当前利用多维度数据进行定位主要是通过人工对不同维度的数据查看、比较,从所有维度中找到异常程度明显的维度。故障发生时通过人工根据多维度数据进行判断,需要工作人员有一定的经验,且由于判断过程需要查看较多数据的趋势图之后综合判断,过程会耗费较长的时间。当数据维度较多时,定位时间会急剧上涨,导致因无法快速定位止损而引发较大的损失。
技术实现思路
本专利技术实施例提供一种多维度数据的数据分析方法、装置及计算机可读存储介质,以至少解决现有技术中的一个或多个技术问题。第一方面,本专利技术实施例提供了一种多维度数据的数据分析方法,包括:获取多维度数据的维度组合中各维度 ...
【技术保护点】
1.一种多维度数据的数据分析方法,其特征在于,包括:获取多维度数据的维度组合中各维度的正常流量值和异常流量值;将多维度数据的维度组合以及所述维度组合的正常流量值和异常流量值输入决策树,使用所述决策树从所述多维度数据的维度组合中筛选出疑似根因维度;计算所述疑似根因维度的贡献度和子维度损失程度一致度;以及根据计算出的所述疑似根因维度的贡献度和子维度损失程度一致度,识别所述疑似根因维度是否为根因维度,其中,所述根因维度是造成流量损失的根因所对应的数据维度。
【技术特征摘要】
1.一种多维度数据的数据分析方法,其特征在于,包括:获取多维度数据的维度组合中各维度的正常流量值和异常流量值;将多维度数据的维度组合以及所述维度组合的正常流量值和异常流量值输入决策树,使用所述决策树从所述多维度数据的维度组合中筛选出疑似根因维度;计算所述疑似根因维度的贡献度和子维度损失程度一致度;以及根据计算出的所述疑似根因维度的贡献度和子维度损失程度一致度,识别所述疑似根因维度是否为根因维度,其中,所述根因维度是造成流量损失的根因所对应的数据维度。2.根据权利要求1所述的方法,其特征在于,获取多维度数据的各维度的正常流量值和异常流量值,包括:监控所述多维度数据的总流量;以及若监控到预设时间段内的所述多维度数据的总流量有流量损失,则获取所述预设时间段内的多维度数据的各维度的正常流量值和异常流量值。3.根据权利要求2所述的方法,其特征在于,获取所述预设时间段内的多维度数据的各维度的正常流量值和异常流量值包括:将获取的所述预设时间段内的各维度的流量数据值与指定时间段内的各维度的流量数据值的差值确定为所述各维度的异常流量值。4.根据权利要求2所述的方法,其特征在于,获取所述预设时间段内的多维度数据的各维度的正常流量值和异常流量值包括:统计所述预设时间段内的各维度的失败访问的次数,其中,将所述预设时间段内的没有收到回复信息的访问作为失败访问;以及将各维度的访问失败的次数确定为所述各维度的异常流量值。5.根据权利要求2所述的方法,其特征在于,获取所述预设时间段内的多维度数据的各维度的正常流量值和异常流量值包括:预测所述预设时间段内的各维度的流量数据值;将获取的所述预设时间段内的各维度的流量数据值与预测的所述预设时间段内的各维度的流量数据值的差值确定为所述各维度的异常流量值。6.根据权利要求1-5中任一项所述的方法,其特征在于,使用所述决策树筛选出疑似根因维度,包括:将多维度数据的维度组合的异常流量值作为所述维度组合在正例集合的权重,将多维度数据的维度组合的正常流量值作为所述维度组合在负例集合的权重;平衡正负例样本权重,以使初始状态下正负例样本权重相当;根据平衡后的正负例样本权重计算每个维度的信息增益率,选择信息增益率最大的维度进行划分,构造所述决策树;以及将构造的所述决策树的路径确定为疑似根因维度。7.根据权利要求6所述的方法,其特征在于,所述平衡正负例样本权重包括:将多维度数据的维度组合的异常流量值与平衡系数的乘积作为所述维度组合在正例集合的权重,将多维度数据的维度组合的正常流量值作为所述维度组合在负例集合的权重,其中,所述平衡系数是多维度数据的各维度的正常流量值的总和与各维度的异常流量值的总和之比。8.根据权利要求1-5中任一项所述的方法,其特征在于,根据计算出的所述疑似根因维度的贡献度和子维度损失程度一致度,识别所述疑似根因维度是否为根因维度,包括:将计算出的所述疑似根因维度的贡献度和子维度损失程度一致度输入到分类器,对所述疑似根因维度是否为根因维度进行分类。9.一种多维度数据的数据分析装置,其特征在于,包括:流量获取单元,用于获取多维度数据的维度组合中...
【专利技术属性】
技术研发人员:陈云,陈宇,李聪,王博,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。