一种索引服务器的监控方法及监控设备技术

技术编号:32227810 阅读:12 留言:0更新日期:2022-02-09 17:32
本公开涉及一种索引服务器的监控方法及监控设备,涉及数据处理分析技术领域。包括:应用于监控索引服务器;获取目标监控信息,目标监控信息包括:导入数据的监控信息、索引服务状态的监控信息、以及索引服务使用的监控信息中的至少一项;确定目标监控信息对应的目标报警规则,目标报警规则对应于至少一个故障设置;在目标监控信息满足目标报警规则时,输出针对至少一个故障的报警信息。本公开实施例用于解决无法快速准确的确定索引服务中故障的问题。问题。问题。

【技术实现步骤摘要】
一种索引服务器的监控方法及监控设备


[0001]本公开涉及数据处理分析
,尤其涉及一种索引服务器的监控方法及监控设备。

技术介绍

[0002]索引服务是搜索服务中的关键模块,稳定性至关重要,如果针对索引服务的监控不到位就会对业务产业影响,所以需要建立一套监控方法来针对提供索引服务的索引服务器进行监控发现问题。目前市场上有各种的监控平台,通常是从独立的角度来进行监控的,因此得到的监控参数比较零散,在索引服务出现问题的时,需要从大量零散的监控参数中人为分析出现的故障,因此无法快速准确的确定索引服务中故障的问题。

技术实现思路

[0003]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种索引服务器的监控方法及监控设备。
[0004]为了实现上述目的,本公开实施例提供的技术方案如下:
[0005]第一方面,本公开实施例提供一种索引服务器的监控方法,该方法可以应用于监控索引服务器;
[0006]获取目标监控信息,所述目标监控信息包括:导入数据的监控信息、索引服务状态的监控信息、以及索引服务使用的监控信息中的至少一项;
[0007]确定所述目标监控信息对应的目标报警规则,所述目标报警规则对应于至少一个故障设置;
[0008]在所述目标监控信息满足所述目标报警规则时,输出针对所述至少一个故障的报警信息。
[0009]作为本公开实施例一种可选的实施方式,所述目标监控信息包括:导入数据的监控信息:
[0010]在调用第一API导入第一数据到消息队列时,若存在第一请求错误,则将所述第一请求错误记录在日志文件,所述第一API为所述消息队列的API;
[0011]所述第一数据导入到所述消息队列之后,在调用第二API接口将所述消息队列中的所述第一数据导入索引服务时,若存在第二请求错误,则将所述第二请求错误记录到所述日志文件;
[0012]从所述日志文件中获取所述第一请求错误,和/或,所述第二请求错误;
[0013]从所述消息队列中获取消费数据数量,和/或,未消费数据数量;
[0014]将所述第一请求错误、所述第二请求错误、所述消费数据数量和所述未消费数据数量中的至少一项,作为所述导入数据的监控信息。
[0015]作为本公开实施例一种可选的实施方式,所述目标报警规则包括以下至少一种:
[0016]存在所述第一请求错误;
[0017]存在所述第二请求错误;
[0018]所述消费数据数量小于或等于第一数量阈值;
[0019]在第一时长内,所述消费数据数量小于或等于第一数量阈值;
[0020]所述未消费数量大于或等于第二数量阈值;
[0021]在第二时长内,所述未消费数据数量大于或等于第二数量阈值;
[0022]所述未消费数量与所述消费数量的比例大于或等于预设比例;
[0023]在第三时长内,所述未消费数量与所述消费数量的比例大于或等于预设比例;
[0024]消息积压率大于或等于比率阈值,所述消息积压率为:在第四时长内,所述未消费数量与所述消息队列对应的数据总量的比值。
[0025]作为本公开实施例一种可选的实施方式,所述索引服务器为包括多个服务器的服务器集群,所述目标监控信息包括:索引服务状态的监控信息;
[0026]所述获取目标监控信息,包括:
[0027]获取所述多个服务器的运行状态信息;所述运行状态信息包括以下至少一种:
[0028]负载率、索引服务的慢查询日志;
[0029]其中,所述负载率包括:CPU使用率、内存使用率、带宽占用率、磁盘占用率中的至少一种。
[0030]作为本公开实施例一种可选的实施方式,所述目标报警规则包括以下至少一种:
[0031]单个服务器的负载率大于或等于第一预设比率;
[0032]总负载率大于或等于第二预设比率;
[0033]存在负载差值大于或等于预设差值的两个服务器;
[0034]存在所述索引服务的慢查询日志;
[0035]所述索引服务的慢查询日志指示所述索引服务的响应时长大于或等于预设时长。
[0036]作为本公开实施例一种可选的实施方式,所述目标监控信息包括:索引服务使用的监控信息;
[0037]所述获取目标监控信息,包括:
[0038]若索引服务使用过程中,出现目标错误,则将所述目标错误记录到所述日志文件,所述目标错误包括:未连接到所述索引服务器,以及连接所述索引服务器超时中的至少一项;
[0039]若索引服务使用过程中,保存用户的搜索记录,搜索记录中包括:用户ID、时间、索引服务器标识、搜索耗时时长。
[0040]从所述日志文件中获取所述目标错误记录,作为所述索引服务使用的监控信息。
[0041]作为本公开实施例一种可选的实施方式,所述目标报警规则包括以下至少一种:
[0042]存在所述目标错误;
[0043]所述搜索耗时时长大于或等于预设时长。
[0044]作为本公开实施例一种可选的实施方式,所述获取目标监控信息,包括:
[0045]通过导入第一模拟数据,获取所述导入数据的监控信息;
[0046]和/或,
[0047]通过针对第二模拟数据使用索引服务,获取所述索引服务状态的监控信息,和/或,索引服务使用的监控信息。
[0048]作为本公开实施例一种可选的实施方式,所述输出报警信息,包括:
[0049]基于所述报警信息,显示报警界面;所述报警界面中包括至少一个功能控件,所述至少一个功能控件用于触发针对所述至少一个故障的处理操作,其中,每个功能控件用于触发针对一个或多个的故障的处理操作。
[0050]第二方面,提供一种索引服务器的监控装置,包括:
[0051]获取模块,用于获取目标监控信息,所述目标监控信息包括:导入数据的监控信息、索引服务状态的监控信息、以及索引服务使用的监控信息中的至少一项;
[0052]确定模块,用于确定所述目标监控信息对应的目标报警规则,所述目标报警规则对应于至少一个故障设置;
[0053]输出模块,用于在所述目标监控信息满足所述目标报警规则时,输出针对所述至少一个故障的报警信息。
[0054]第三方面,提供一种监控设备,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面或其可选的实施方式中的任一项的索引服务器的监控方法。
[0055]第四方面,本公开一种计算机可读存储介质,包括:计算机可读存储介质上存储计算机程序,计算机程序被处理器执行时实现如第一方面或其可选的实施方式中的任一项的索引服务器的监控方法。
[0056]第五方面,提供一种计算机程序产品,包括:当计算机程序产品在计算机上运行时,使得计算机实现如第一方面或其可选的实施方式中的任一项的索引服务器的监控方法。
[0057本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种索引服务器的监控方法,其特征在于,应用于监控索引服务器;获取目标监控信息,所述目标监控信息包括:导入数据的监控信息、索引服务状态的监控信息、以及索引服务使用的监控信息中的至少一项;确定所述目标监控信息对应的目标报警规则,所述目标报警规则对应于至少一个故障设置;在所述目标监控信息满足所述目标报警规则时,输出针对所述至少一个故障的报警信息。2.根据权利要求1所述的方法,其特征在于,所述目标监控信息包括:所述导入数据的监控信息:所述获取目标监控信息,包括:在调用第一API导入第一数据到消息队列时,若存在第一请求错误,则将所述第一请求错误记录在日志文件,所述第一API为所述消息队列的API;所述第一数据导入到所述消息队列之后,在调用第二API接口将所述消息队列中的所述第一数据导入索引服务时,若存在第二请求错误,则将所述第二请求错误记录到所述日志文件,其中,所述第二API接口为所述索引服务的API接口;从所述日志文件中获取所述第一请求错误,和/或,所述第二请求错误;从所述消息队列中获取消费数据数量,和/或,未消费数据数量;将所述第一请求错误、所述第二请求错误、所述消费数据数量和所述未消费数据数量中的至少一项,作为所述导入数据的监控信息。3.根据权利要求2所述的方法,其特征在于,所述目标报警规则包括以下至少一种:存在所述第一请求错误;存在所述第二请求错误;所述消费数据数量小于或等于第一数量阈值;在第一时长内,所述消费数据数量小于或等于第一数量阈值;所述未消费数量大于或等于第二数量阈值;在第二时长内,所述未消费数据数量大于或等于第二数量阈值;所述未消费数量与所述消费数量的比例大于或等于预设比例;在第三时长内,所述未消费数量与所述消费数量的比例大于预设比例;消息积压率大于或等于比率阈值,所述消息积压率为:在第四时长内,所述未消费数量与所述消息队列中数据总量的比值。4.根据权利要求1所述的方法,其特征在于,所述索引服务器为包括多个服务器的服务器集群,所述目标监控信息包括:所述索引服务状态的监控信息;所述获取目标监控信息,包括:获...

【专利技术属性】
技术研发人员:陈永飞刘大伟郑伟
申请(专利权)人:北京库睿科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1