【技术实现步骤摘要】
日志分析方法及装置、存储介质和电子设备
[0001]本申请涉及人工智能领域,具体而言,涉及一种日志分析方法及装置、存储介质和电子设备。
技术介绍
[0002]目前,随着计算机技术的飞速发展,各类应用的运行日志发挥着日益重要的作用。而且,由于互联网应用自身较高的要求限制(7*24小时不间断运行),所以及时获取应用运行的相关日志数据,并对日志进行及时分析非常重要。因此,利用人工智能算法获取日志实时分析结果,能够帮助运维人员及时发现故障和定位故障。
[0003]但是,目前相关技术中的日志分析算法都存在以下难点:(1)一般人工智能相关算法对标注语料要求较高,即标注语料的规模与精度将直接影响分析结果的准确性,故模型效果受到标注语料极大的限制;(2)目前人工标注的语料获取难度大,所耗费的人工成本极高;(3)不同应用的日志格式不同,且种类繁多,因此无法以统一的正则表达式进行切分;(4)现有日志多为非结构化文本,难以对关键数据及字段进行提取统计;(5)日志数据量爆炸式增长,日志分析速度难以进一步提升,限制了故障告警的速度。
...
【技术保护点】
【技术特征摘要】
1.一种日志分析方法,其特征在于,包括:获取目标日志的语料和目标对照词典,其中,所述目标对照词典中至少包括所述目标日志的语料和开源语料的对应关系,其中,所述开源语料为从互联网中获取到的语料;将所述目标日志的语料和所述开源语料输入预训练模型进行处理,得到词向量一,其中,所述词向量一为所述目标日志的语料和所述开源语料对应的词向量;依据词向量二和所述目标对照词典,得到目标词向量,其中,所述词向量二为对所述词向量一进行平滑操作之后得到的词向量;将所述目标词向量输入训练模型进行处理,得到所述目标日志的分析结果。2.根据权利要求1所述的方法,其特征在于,依据词向量二和所述目标对照词典,得到目标词向量包括:在所述目标对照词典中存在词向量三的情况下,将所述词向量二与所述词向量三进行拼接,其中,所述词向量三为所述目标对照词典中与所述词向量二对应的词向量;将所述词向量二与所述词向量三进行拼接后得到的词向量作为所述目标词向量。3.根据权利要求1所述的方法,其特征在于,在将所述目标词向量输入训练模型进行处理,得到所述目标日志的分析结果之后,所述方法还包括:获取验证语料;将所述验证语料输入到所述训练模型中,得到所述训练模型的输出结果;依据所述验证语料的标准结果和所述输出结果,计算所述验证语料的准确率和召回率;依据所述准确率和所述召回率,验证所述训练模型的准确度。4.根据权利要求1所述的方法,其特征在于,获取目标对照词典包括:获取所述开源语料和所述目标日志的语料;利用目标工具,对所述开源语料和所述目标日志的语料进行训练,得到所述开源语料和所述目标日志的语料的对齐模型;依据所述对齐模型,得到所述目标日志的语料和开源语料的对应关系;基于所述目标日志的语料和开源语料的对应关系,生成所述目标对照词典。5.根据权利要求1所述的方法,其特征在于,在获取目标日志的语料和目标对照词...
【专利技术属性】
技术研发人员:吴都,茅逸斐,熊慧君,徐修颖,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。