基于知识图谱的日志字段名称生成方法、系统及电子设备技术方案

技术编号:32669643 阅读:36 留言:0更新日期:2022-03-17 11:23
本发明专利技术提供一种基于知识图谱的日志字段名称生成方法、系统及电子设备。该方法包括:从样本日志数据提取属性信息和标签信息,以建立样本日志数据的实体

【技术实现步骤摘要】
基于知识图谱的日志字段名称生成方法、系统及电子设备


[0001]本专利技术涉及信息处理
,具体地涉及一种基于知识图谱的日志字段名称生成方法、一种基于知识图谱的日志字段名称生成系统以及一种电子设备。

技术介绍

[0002]随着信息技术以及互联网的飞速发展,各类软件系统不断产生并融合,故障频率、系统复杂性和大数据环境等方面也迎来了的新挑战。运维工作大致经历了人工、工具和自动化、平台化、智能运维几个阶段。
[0003]日志是运维数据源中非常重要且较为特殊的一种。由于其来源广泛、内容丰富、格式灵活,日志可以在智能运维的数据聚合、异常检测、根因分析、趋势预测等多个方面起到独到作用。对日志的解析是进行上述工作的基础,其中包括日志的结构化、日志模板的提取等,日志字段的命名是其中重要一环。
[0004]现有技术方案中,通常只利用日志字段本身的格式信息进行抽象化命名,逻辑单一且方法粗放,字段存在一些误命名现象,且部分种类字段被抽象化命名后过于简单,丢失了较多信息,不利于日志解析后的信息利用。

技术实现思路

>[0005]本专利本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的日志字段名称生成方法,其特征在于,所述方法包括如下步骤:从样本日志数据提取属性信息和标签信息,以建立样本日志数据的实体

关系

属性三元数组;将多条样本日志数据的三元数组进行融合,得到日志数据的知识图谱;获取待命名日志数据;从所述待命名日志数据提取属性信息,将待命名日志数据的属性信息与所述日志数据的知识图谱进行加权匹配,得到匹配结果;根据匹配结果生成所述待命名日志数据各字段的名称。2.根据权利要求1所述的方法,其特征在于,所述属性信息包括:位置信息、长度信息、格式信息、编程语言信息和日志框架信息;所述提取属性信息,包括:从获取的样本日志数据或待命名日志数据提取日志头;从所述日志头中提取各字段的属性信息;所述提取标签信息,包括:从样本日志数据的日志头中提取各字段的标签信息。3.根据权利要求2所述的方法,其特征在于,所述建立样本日志数据的实体

关系

属性三元数组,包括:获取样本日志数据日志头中各字段的标签信息作为实体,获取属性信息中的各项作为实体的关系,获取属性信息的属性值作为各关系的属性,建立样本日志数据各字段的实体

关系

属性三元数组;在每个实体中增设一个关系为出现次数的三元数组,初始属性值为1;合并样本日志数据中的同一实体,更新出现次数的属性值。4.根据权利要求2所述的方法,其特征在于,所述提取日志头,包括:将样本日志数据或待命名日志数据中固定格式的字段替换为标签化的字段,得到初步标签化后的字段;根据初步标签化后的字段确定样本日志数据或待命名日志数据的最长公共子串;提取所述最长公共子串的最后一个空格之前的部分作为样本日志数据或待命名日志数据的日志头。5.根据权利要求2所述的方法,其特征在于,所述提取各字段的属性信息包括:依据位置信息提取规则从样本日志数据的日志头或待命名日志数据的日志头中提取各字段的位置信息;依据长度信息提取规则从样本日志数据的日志头或待命名日志数据的日志头中提取各字段的长度信息;依据格式标签匹配从样本日志数据的日志头或待命名日志数据的日志头中提取各字段的格式信息;依据编程规则从样本日志数据的日志头或待命名日志数据的日志头中提取各字段的编程语言信息;依据日志框架匹配从样本日志数据的日志头或待命名日志数据的日志头中提取各字段的日志框架信息;
所述提取标签信息包括:依据标注的标签名从样本日志数据的日志头中提取各字段的标签名信息。6.根据权利要求1所述的方法,其特征在于,所述将多条样本日志数据进行融合,得到日志数据的知识图谱,包括:提取每一三元数组的标签名和属性值,在已有知识图谱中进行查询匹配;若已存在与该三元数组相同的图谱,则将图谱中出现次数的属性值与该三元数组中出现次数的属性值相加,更新图谱中出现次数的属性值;若不存在与该三元数组相同的图谱,则新建图谱,并将该三元数组全部录入作为一个新的图谱。7.根据权利要求1所述的方法,其特征在于,所述将待命名日志数据的属性信息与所述日志数据的知识图谱进行加权匹配,得到匹配结果,包括:在所述日志数据的知识图谱中匹配查询所述待命名日志数据的属性信息所对应的属性值组;若查询到存在所有属性值均匹配成功的图谱,则返回属性值组对应的标签名作为字段名称生成建议选项;若未查询到所有属性值均匹配成功的图谱,则对属性值组进行加权匹配:若加权匹配成功,则返回至少一个标签名作为字段名称生成建议选项;若加权匹配失败,则返回无匹配结果的信息。8.根据权利要求7所述的方法,其特征在于,所述方法还包括:若加权匹配失败,则对所述待命名日志数据的日志头中各字段的标签名进行标注;从标注后的日志头中提取属性信息,构建所述待命名日志数据的实体

关系

属性三元数组;根据所述待命名日志数据的三元数组更新知识图谱。9.根据权利要求1所述的方法,其特征在于,所述将待命名日志数据的...

【专利技术属性】
技术研发人员:李晓龙刘东阳刘俊君
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1