【技术实现步骤摘要】
一种获取目标数据提取文本列表的方法
[0001]本专利技术涉及计算机领域,特别是涉及一种获取目标数据提取文本列表的方法。
技术介绍
[0002]目前,随着计算机信息广泛应用,需要计算机进行支持的行业越来越多,对于软件日志的范化也要求越来越高,但日志数据往往数据量较大,占据较大的空间,结构复杂,没有统一的日志模板,且各个设备的数据源众多,产生的日志的顺序并不相同,因此对日志获取动态的模板非常重要,使用人工进行匹配,划分到不同的类型下,需要耗费大量的人力且并不灵活。
技术实现思路
[0003]针对上述技术问题,本专利技术采用的技术方案为:
[0004]一种获取目标数据提取文本列表的方法,所述方法包括如下步骤:
[0005]S10,获取第二目标日志和第二目标日志对应的第二目标DM;
[0006]S20,当DM
i
满足预设处理条件时,执行S40;
[0007]S30,当DM
i
不满足预设处理条件时,否则执行S60;
[0008]S40,当存在
【技术保护点】
【技术特征摘要】
1.一种获取目标数据提取文本列表的方法,其特征在于,所述方法包括如下步骤:S10,获取第二目标日志和第二目标日志对应的第二目标DM;S20,当DM
i
满足预设处理条件时,执行S40;S30,当DM
i
不满足预设处理条件时,否则执行S60;S40,当存在DM
i
等于第二目标DM时,获取DM
i
对应的RE
i
作为第二目标RE列表;S50,当任意DM
i
不等于第二目标DM,执行S60;S60,基于第一数据列表,获取中间数据提取文本列表RE={RE1,RE2,
…
,RE
i
,
…
,RE
m
},RE
i
={RE
i1
,RE
i2
,
…
,RE
it
,
…
,RE
ik
},RE
it
是指第i个RE列表中第t个中间数据提取文本,t的取值范围是1到k,k是指RE
i
中指定文本的数量;S70,基于RE
i
对第二目标日志进行解析,获取目标解析数据列表D
i
={D
i1
,D
i2
,
…
,D
it
,
…
,D
ik
},D
it
是指RE
it
对应的目标解析数据;S80,获取空集数量列表E={E1,E2,
…
,E
i
,
…
,E
m
},E
i
是指遍历D
i
,D
it
=null的数量;S90,获取最小空集数量E
′
,E
′
=min(E1,E2,
…
,E
i
,
…
,E
m
);S91,获取E
′
对应的RE
′
且将RE
′
作为第二目标数据提取文本列表。2.根据权利要求1所述的方法,其特征在于,在S370中,E
′
<预设空集数量阈值E0。3.根据权利要求2所述的方法,其特征在于,E0<0.2*k。4.根据权利要求3所述的方法,其特征在于,E0<0.1*k。5.根据权利要求1所述的方法,其特征在于,还包括以下步骤:S1,获取目标设备对应的目标日志和目标日志对应的目标设备ID,其中,目标日志β=(β1,β2,
…
,β
γ
,
…
,β
γ
′
),β
γ
是指目标日志对应的第γ个字符,γ的取值范围是1到γ,γ
′
是目标日志对应的字符数量;S2,基于第二数据列表,获取目标设备ID对应的DM
i
;S3,基于第一数据列表,获取DM
i
对应的中间数据提取文本RE
i
={RE
i1
,
…
,RE
ij
,
…
,RE
in
}和目标数据键值对列表KV
i
={KV
i1
,
…
,KV
ij
,
…
,KV
in
};S4,基于RE
i
对目标日志进行解析,获取第一解析数据列表V
′
i
={V
′
i1
,
…
,V
′
ij
,
…
,V
′
in
},V
′
ij
是指目标日志中RE对应的数据;S5,基于V
′
i
对KV
i
进行匹配,获取最终键值对列表KV
′
i
={KV
′
i1
,
…
,KV
′
ij
,
…
,KV
′
in
}。6.根据权利要求1所述的系统,其特征在于,在S1后通过如下步骤获取目标ID:S101,当H
...
【专利技术属性】
技术研发人员:迟鹏飞,彭义,武方,苗维杰,
申请(专利权)人:杭州中电安科现代科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。