当前位置: 首页 > 专利查询>SAP欧洲公司专利>正文

问题检测系统技术方案

技术编号:37172642 阅读:16 留言:0更新日期:2023-04-20 22:43
一种系统和方法包括监测一个或多个软件应用以确定与第一过程的实例相关联的第一指标的值,所述第一过程包括由所述一个或多个软件应用执行的步骤;确定在所述第一过程的第一数量的正在进行的实例中所述第一指标的值已经超过与所述第一过程相关联的阈值;确定所述第一数量大于与所述第一过程相关联的第一计数限制;并且响应于确定所述第一数量大于所述第一计数限制,向与所述第一过程的每个正在进行的实例相关联的用户发送错误消息。行的实例相关联的用户发送错误消息。行的实例相关联的用户发送错误消息。

【技术实现步骤摘要】
问题检测系统

技术介绍

[0001]企业计算系统促进企业内许多过程的执行。尽管尽了最大努力,但潜在的技术问题可能会延迟或阻止此类过程的完成。技术问题可能存在于不同的计算系统中,并且可能是零星的或否则难以由负责的技术支持团队监测和/或检测。
[0002]当过程被延迟、停滞或以其他方式表现不佳时,受影响的用户(例如,启动过程的用户)创建支持工单并将其提交给技术支持团队。第二用户稍后可能会启动相同的过程并最终注意到所述过程未正确执行,从而导致第二用户创建并提交另一个支持工单。支持工单由支持团队排队,并且通知用户有关其相应工单的持续状态。
[0003]如果过程的问题是由于一个或多个潜在的技术问题(例如,网络连接故障),许多用户将受到影响并且将创建许多支持工单。大量的工单可能会使技术支持团队不堪重负,他们将在尝试识别和解决问题的同时继续接收和排队新的工单。同时,整体用户满意度下降。
[0004]在一个实例中,公司允许其员工提交他们日常工作所需的商品和服务的采购请求。购买任何超过一定价值的物品必须由创建对应采购请求的员工的管理者批准。由于最近的配置更改,基于组织数据确定员工的管理者的规则开始出现故障。所述规则不会确定管理者,而是返回空的结果集。因此,不会发送任何批准请求,并且所有采购请求都未得到批准。
[0005]由于判定规则继续返回技术上有效的结果,因此没有检测到技术问题。过程监测解决方案可能会检测到采购请求批准的平均处理时间的增加,但这种检测对于检测或触发潜在技术问题的解决并不是特别有帮助。因此,只有在多名员工独立注意到异常延迟、与他们的管理者核实、询问其他同事是否有同样的问题并最终创建支持工单时,才会检测到问题。
[0006]希望系统能够有效且主动地识别干扰操作过程的技术问题并通知受影响的用户,同时限制错误的通知。
附图说明
[0007]图1是根据一些实施例的通过监测应用层来检测和解决技术层中的潜在问题的架构的框图。
[0008]图2包括根据一些实施例的通过监测应用层来检测和解决技术层中的潜在问题的过程的流程图。
[0009]图3至图7展示了根据一些实施例的随着时间的推移对应用过程的监测和用户通知的发布。
[0010]图8展示了根据一些实施例的用于应用监测的指标阈值的设置。
[0011]图9是根据一些实施例的通过监测应用层并基于用户工作时间来检测和解决技术层中的潜在问题的架构的框图。
[0012]图10是根据一些实施例的硬件系统的框图。
具体实施方式
[0013]提供以下描述以使本领域的任何人都能够制作和使用所描述的实施例,并提出了为执行一些实施例而设想的最佳模式。然而,各种修改对于本领域技术人员来说将是显而易见的。
[0014]实施例可以减少检测导致操作过程延迟或失败的技术问题的时间和精力。通过加速对此类技术问题的检测,可以比现有系统更快地触发相关联的通知和解决过程。
[0015]实施例可以检测问题并且作为响应启动解决过程并且在用户手动创建一堆支持工单之前主动通知用户。此类特征不仅减少了检测问题所涉及的用户开销并且加快了问题的解决,而且还向支持人员提供了快速的指示,即问题不仅与一个用户特定的过程有关,而且可能更为根本,因为它同样会影响多个用户和过程。
[0016]根据一些实施例的问题的检测可以包括对过程的监测以识别对一些过程相关指标的重复违反。一旦违规次数达到预定义的限制,受影响的用户和支持团队就会收到违规通知。此外,每次后来违反指标都会导致向相关联用户发出通知。这些特征可以允许将相关违规快速聚类成要分析的单个问题,从而减少解决问题所需的努力和冗余工作。
[0017]图1是根据一些实施例的系统100的架构的框图。系统100的每个图示元件可以使用已知或变得已知的计算硬件和/或软件的任何合适组合来实施。这种组合可以包括根据需求、需要、价格和/或任何其他指标来弹性地分配计算资源的实施方式。在一些实施例中,系统100的两个或更多个元件由单个计算设备来实施。系统100的两个或更多个元件可以协同定位。系统100的一个或多个元件可以实施为云服务(例如,软件即服务、平台即服务)。
[0018]通常,系统100操作以向用户132、134和136提供功能。用户132、134和136访问应用112、114和116的软件实施逻辑以接收所述功能。应用112、114和116可以包括已知或变得已知的任何软件应用。
[0019]在一个非穷举实例中,应用112、114和116包括由单个企业操作的客户关系管理应用、人力资源管理应用和供应商关系管理应用。用户132、134和136可以包括企业的员工,并且用户132、134和136中的每一个可以被授权访问应用112、114和116中的一个或多个。取决于授予用户132、134和136中的每一个的相对许可,用户132、134和136中的每一个可以经由应用112、114和116访问不同的数据。
[0020]应用112、114和116与本领域已知的底层平台和基础设施(未示出)通信并利用它们。此类平台和基础设施包括但不限于服务器(独立或在虚拟机中执行)协议、网络、数据库、数据中心等。
[0021]用户132、134和136经由用户界面(UI)层120与应用112、114和116交互。UI层120可以呈现由用户132、134和136操纵以访问应用112、114和116的功能的用户界面。UI层120可以替代地向应用112、114和116的各个UI部件(未示出)提供入口点。
[0022]应用监测部件150可以操作以从应用112、114和116接收数据。基于数据并且如本领域已知的,应用监测部件150可以确定没有满足期望的关键性能指标(KPI)值(例如,过程A没有在7天内完成)并且给启动对应过程的用户发送通知。这种常规操作类似于上述背景中描述的操作,并且需要用户诊断并解决特定过程的问题(例如,预期收件人从未阅读过电子邮件)或者确定KPI值已经由于技术问题未能满足并且生成对应的支持工单。
[0023]问题通知系统160从应用监测部件150接收应用监测数据。基于所述数据和指标定
义164,警报引擎162识别潜在的技术问题并将对应的通知发送到受影响的用户和问题跟踪系统180,如下文将详细描述的。因此,实施例可以与常规的应用过程监测系统并行执行。
[0024]由指标定义164定义的指标可以是基于时间的(例如,过程A的处理时间)、基于发生的(例如,失败的软件模块部署的数量)或基于其他的。如将要描述的,每个指标都与阈值和计数限制两者相关联。指标可以包括在系统100的正常操作期间定义和监测的KPI,但是实施例不限于此。
[0025]与指标相关联的阈值可以与由适用的服务水平协议(SLA)指定的阈值一致,但是实施例也不限于此。例如,指标定义164可以定义与特定过程的完成相关联的指标。操作的SLA可能要求所述过程在一天内完成,并且其他系统可能会运行以监测对所述要求的遵守情况,但与指标定义16本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种方法,包括:监测一个或多个软件应用以确定与第一过程的实例相关联的第一指标的值,所述第一过程包括由所述一个或多个软件应用执行的步骤;确定在所述第一过程的第一数量的正在进行的实例中,所述第一指标的值已经超过与所述第一过程相关联的阈值;确定所述第一数量大于与所述第一过程相关联的第一计数限制;以及响应于确定所述第一数量大于所述第一计数限制,向与所述第一过程的每个正在进行的实例相关联的用户发送错误消息。2.根据权利要求1所述的方法,还包括:响应于确定所述第一数量大于所述第一计数限制,向技术支持部门发送与所述第一过程相关联的错误消息。3.根据权利要求1所述的方法,还包括:在发送所述错误消息之后,确定在所述第一过程的第二正在进行的实例中所述第一指标的值已经超过所述阈值;以及响应于确定在所述第一过程的第二正在进行的实例中所述第一指标的值已经超过所述阈值,向与所述第一过程的第二正在进行的实例相关联的用户发送错误消息。4.根据权利要求1所述的方法,其中确定在所述第一过程的第一数量的正在进行的实例中所述第一指标的值已经超过与所述第一过程相关联的阈值包括确定与所述第一过程的正在进行的实例相关联的用户的工作时间。5.根据权利要求1所述的方法,还包括:监测所述一个或多个软件应用以确定与第二过程的实例相关联的第二指标的值,所述第二过程包括由所述一个或多个软件应用执行的步骤;确定在所述第二过程的第二数量的正在进行的实例中,所述第二指标的值已经超过与所述第二过程相关联的第二阈值;确定所述第二数量大于与所述第二过程相关联的第二计数限制;以及响应于确定所述第二数量大于所述第二计数限制,向与所述第二过程的每个正在进行的实例相关联的用户发送错误消息。6.根据权利要求1所述的方法,还包括:在向与所述第一过程的每个正在进行的实例相关联的用户发送所述错误消息之后,确定在所述第一过程的第二正在进行的实例中所述第一指标的值已经超过所述阈值;响应于确定在所述第一过程的第二正在进行的实例中所述第一指标的值已经超过所述阈值,向与所述第一过程的第二正在进行的实例相关联的用户发送错误消息;在向与所述第二过程的每个正在进行的实例相关联的用户发送所述错误消息之后,确定在所述第二过程的第二正在进行的实例中所述第二指标的值已经超过第二阈值;以及响应于确定在所述第二过程的第二正在进行的实例中所述第二指标的值已经超过所述第二阈值,向与所述第二过程的第二正在进行的实例相关联的用户发送错误消息。7.一种存储可由处理单元执行以使计算系统执行以下操作的程序代码的非暂时性计算机可读介质:监测一个或多个软件应用以确定与第一过程的实例相关联的第一指标的值,所述第一
过程包括由所述一个或多个软件应用执行的步骤;确定在所述第一过程的第一数量的正在进行的实例中,所述第一指标的值已经超过与所述第一过程相关联的阈值;确定所述第一数量大于与所述第一过程相关联的第一计数限制;以及响应于所述确定所述第一数量大于所述第一计数限制,向与所述第一过程的每个正在进行的实例相关联的用户发送错误消息。8.根据权利要求7所述的介质,所述程序代码还可由处理单元执行以使计算系统用于:响应于所述确定所述第一数量大于所述第一计数限制,向技术支持部门发送与所述第一过程相关联的错误消息。9.根据权利要求7所述的介质,所述程序代码还可由处理单元执行以使计算系统用于:在发送所述错误消息之后,确定在所述第一过程的第二正在进行的实例中所述第一指标的值已经超过所述阈值;以及响应于所述确定在所述第一过程的第二正在进行的实例中所述第一指标的值已经超过所述阈值,向与所述第一过程的第二正在进行的实例相关联的用户发送错误消息。10.根据权利要求7所述的介质,其中所述确定在所述第一过程的第一数量的正在进行的实例中所述第一指标的值已经超过与所述第一过程相关联的阈值包括确定与所述第一过程的正在进行的实例相关联的用户的工作时间。11.根据权利要求7所述的介质,所述程序代码还可由处理单元执行以使计算系统用于:监测所述一个或多个软件应用以确定与第二过程的实例相关联的第二指标的值,所述第二过程包括由所述一...

【专利技术属性】
技术研发人员:P埃伯莱恩V德里森
申请(专利权)人:SAP欧洲公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1