The present disclosure relates to the field of artificial intelligence technology, and specifically discloses a method and device for extracting data from logs, including: monitoring log updates of running systems; identifying updated logs through a neural network model if they are monitored to update logs to determine the type of logs updated; and matching the log types described in configuration files. Data extraction information search, the data extraction information indicates the data item extracted from the log of the log type, and the corresponding data of the data item is extracted from the updated log according to the data extraction information found. So it can extract the required data from the running system in real time and has high efficiency.
【技术实现步骤摘要】
从日志中提取数据的方法、装置及计算机可读存储介质
本公开涉及人工智能
,特别涉及一种从日志中提取数据的方法、装置及计算机可读存储介质。
技术介绍
现有技术中,为了系统的运行状态,需要进行系统运行相关数据的收集,例如系统登录用户、用户登录时间、处理成功的请求、处理失败的请求、响应时间、处理失败原因等,从而对系统进行综合的统计分析,例如得到系统处理效率、用户偏好等。现有技术中为了获得与系统运行相关的数据,通过在系统的数据库表里面进行对应数据的查找,从而获得对应的数据。但是数据库表中保存的数据并不完整,一般出于数据库的冗余等考虑,数据库表里仅包括系统处理的最终结果等数据。所以,所收集的数据依赖于数据库表中存储的数据,如果数据库表中未保存对应需要收集的数据,则需要从其他途径来收集数据,数据获得的效率低,且获得的数据不完整。由上可知,如何有效获得与系统运行相关的数据的问题还有待解决。
技术实现思路
为了解决相关技术中存在的问题,本公开提供了一种从日志中提取数据的方法及装置。第一方面,一种从日志中提取数据的方法,包括:对所运行的系统进行日志更新监控;如果监控到日志更新,则通过神经网络模型进行所更新日志的识别,以确定所更新日志的日志类型;在配置文件中进行所述日志类型所对应数据提取信息查找,所述数据提取信息指示了从所述日志类型的日志中进行数据提取的数据项;根据所查找到的数据提取信息从所述所更新日志中提取所述数据项对应的数据。第二方面,一种从日志中提取数据的装置,包括:监控模块,被配置为:对所运行的系统进行日志更新监控;识别模块,被配置为:如果监控到日志更新,则通过神经网 ...
【技术保护点】
1.一种从日志中提取数据的方法,其特征在于,包括:对所运行的系统进行日志更新监控;如果监控到日志更新,则通过神经网络模型进行所更新日志的识别,以确定所更新日志的日志类型;在配置文件中进行所述日志类型所对应数据提取信息查找,所述数据提取信息指示了从所述日志类型的日志中进行数据提取的数据项;根据所查找到的数据提取信息从所述所更新日志中提取所述数据项对应的数据。
【技术特征摘要】
1.一种从日志中提取数据的方法,其特征在于,包括:对所运行的系统进行日志更新监控;如果监控到日志更新,则通过神经网络模型进行所更新日志的识别,以确定所更新日志的日志类型;在配置文件中进行所述日志类型所对应数据提取信息查找,所述数据提取信息指示了从所述日志类型的日志中进行数据提取的数据项;根据所查找到的数据提取信息从所述所更新日志中提取所述数据项对应的数据。2.根据权利要求1所述的方法,其特征在于,所述通过神经网络模型进行所更新日志的识别,以确定所更新日志的日志类型,包括:构建所更新日志的特征向量;对所述特征向量进行分类预测,得到所述所更新日志对应的类型标签;根据所述类型标签确定所述所更新日志的日志类型。3.根据权利要求1所述的方法,其特征在于,所述通过神经网络模型进行所更新日志的识别,以确定所更新日志的日志类型之前,还包括:获取若干样本日志,以及获取对每一所述样本日志所标注的样本标签;通过所述若干样本日志和所对应的类型标签进行所述神经网络模型的训练;当所述神经网络模型收敛,结束所述神经网络模型的训练。4.根据权利要求1所述的方法,其特征在于,所述在配置文件中进行所述日志类型所对应数据提取信息查找之前,还包括:获取与待进行数据提取的日志所对应日志类型相同的模板日志;在所述模板日志中,以为所述数据项所配置的变量替换所述数据项所对应的数据,并根据替换后的所述模板日志配置得到所述日志类型所对应的数据提取信息;由每一所述日志类型所对应的数据提取信息构成所述配置文件。5.根据权利要求1所述的方法,其特征在于,所述根据所查找到的数据提取信息从所述所...
【专利技术属性】
技术研发人员:陈珍妮,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。