【技术实现步骤摘要】
日志分析方法、日志分析装置及电子设备
本公开实施例涉及自然语言处理
,尤其涉及一种日志分析方法、日志分析装置及电子设备。
技术介绍
系统的运行一殷都会遇到一些问题。为解决系统的运行问题,常规的处理方法是技术人员查看系统的日志解决问题,即技术人员通过对日志信息进行分析,找到相应的故障信息,解决出现的故障问题。然而,通过人工查看日志以解决系统问题的方式,自动化程度低,造成系统分析的效率较低。
技术实现思路
本公开实施例提供一种日志分析方法、日志分析装置及电子设备,以解决通过人工查看日志以解决系统问题的方式,自动化程度低,造成系统分析的效率较低的问题。为解决上述问题,本公开是这样实现的:根据本公开实施例的第一方面,提供一种日志分析方法,包括:根据语义理解系统的日志中记录的N个文本,确定M个目标相似文本对,其中,每个所述目标相似文本对的第一文本的第一识别结果与标注结果相同,第二文本的第一识别结果与标注结果不同,所述第一识别结果为所述语义理解系统输出的识别结果,N为大于1的整数,M为正 ...
【技术保护点】
1.一种日志分析方法,其特征在于,所述方法包括:/n根据语义理解系统的日志中记录的N个文本,确定M个目标相似文本对,其中,每个所述目标相似文本对的第一文本的第一识别结果与标注结果相同,第二文本的第一识别结果与标注结果不同,所述第一识别结果为所述语义理解系统输出的识别结果,N为大于1的整数,M为正整数;/n根据每个所述目标相似文本对的第二文本的第一识别结果,确定所述语义理解系统存在的第一问题;/n生成日志分析报告,所述日志分析报告包括所述第一问题及所述M个目标相似文本对。/n
【技术特征摘要】
1.一种日志分析方法,其特征在于,所述方法包括:
根据语义理解系统的日志中记录的N个文本,确定M个目标相似文本对,其中,每个所述目标相似文本对的第一文本的第一识别结果与标注结果相同,第二文本的第一识别结果与标注结果不同,所述第一识别结果为所述语义理解系统输出的识别结果,N为大于1的整数,M为正整数;
根据每个所述目标相似文本对的第二文本的第一识别结果,确定所述语义理解系统存在的第一问题;
生成日志分析报告,所述日志分析报告包括所述第一问题及所述M个目标相似文本对。
2.根据权利要求1所述的方法,其特征在于,所述根据语义理解系统的日志中记录的N个文本,确定M个目标相似文本对,包括:
将第一文本集合中的文本两两分组得到K个文本对,所述第一文本集合通过对语义理解系统的日志中记录的N个文本去重后得到,K为大于或等于M的整数;
计算所述K个文本对中文本对的第一文本和第二文本的相似度值;
获取语义理解系统的日志中记录的所述K个文本对中文本的第一识别结果,及基于文本的目标识别结果输入的文本的标注结果,所述目标识别结果为所述第一识别结果或第二识别结果,所述第二识别结果为识别模型输出的识别结果;
根据所述K个文本对中每个文本对的所述相似度值、所述第一识别结果及所述标注结果,得到M个目标相似文本对;
其中,每个所述目标相似文本对的所述相似度值大于第一阈值,且每个所述目标相似文本对的第一文本的第一识别结果与标注结果相同,第二文本的第一识别结果与标注结果不同。
3.根据权利要求1所述的方法,其特征在于,所述第一识别结果和所述标注结果均包括文本的意图;所述根据日志记录中的N个文本,确定M个目标相似文本对之前,所述方法还包括:
确定目标意图,所述目标意图为用户输入的第一意图,或,所述语义理解系统识别得到的Q个意图中数量最多的第二意图,Q为大于1的整数;
根据所述目标意图,从所述日志中记录的文本中筛选出所述N个文本,所述N个文本中每个文本的标注结果的意图均为所述目标意图。
4.根据权利要求1所述的方法,其特征在于,所述生成日志分析报告之前,所述方法还包括:
获取所述日志中记录的所述语义理解系统识别所述N个文本的过程中出现的第一错误信息;
根据所述第一错误信息,确定目标信息;
其中,所述目标信息包括以下至少一项:所述第一错误信息对应的修复信息、所述语义理解系统存在的与所述第一错误信息对应的潜在问题、所述N个文本中出现所述第一错误信息的文本的数量与N的比值;
所述生成日志分析报告,包括:
根据所述第一错误信息、所述目标信息、所述第一问题及所述M个目标相似文本对...
【专利技术属性】
技术研发人员:高丛,陈孝良,苏少炜,常乐,
申请(专利权)人:北京声智科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。