The expected value of measurement in the first context is infered, at least in part, based on context signals. The context signal may include (I) having the type that is the same as the expected value and (II) associated with a second context different from the first context (for example, a context may include a geographical area), or a context signal may include (I) having a type different from the expected value type and (II) with the first context or not. The actual value associated with the second context of the first context. If the difference between the expected value and the actual value of the first context is greater than the threshold difference, the condition is considered abnormal. The detected anomalies can be used to identify events that may be important to the user community or user community.
【技术实现步骤摘要】
【国外来华专利技术】使用上下文信号的局部异常检测
技术介绍
异常可以被表征为偏离规范的事物(或不正常的事物)。在一些情况下,数据中的异常可以指示令人惊讶或有趣的事件。例如,车祸的目击者可以在事故发生之后不久使用他们的移动设备将车祸发布到社交媒体服务。由社交媒体服务收集的数据(在这种情况下为用户帖子)可以包括有关车祸的信息,并且因此数据可以因为偏离规范而异常。检测数据中的这种异常可以导致有用的见解,诸如在主要新闻媒体对车祸进行报道之前标识车祸。因此,异常检测适用于各种下游应用,并且需要改进异常检测。
技术实现思路
很多事件可以被表征为时间序列y(t),其中y是事物的测量并且t是时间。因此,时间序列由一系列数据点组成,每个数据点表示在时间间隔ΔT期间的测量值。例如,测量值可以是微博帖子(例如,)的数目、车辆的数目、销售项目的数目、911呼叫的数目或任何其他合适的测量。如果y(t)的实际值与正常条件下的y(t)的期望值相比非常大或小,则发生异常。在正常条件下的y(t)的期望值在本文中被称为“期望值”,称为本文中描述了用于至少部分基于上下文信号来准确推断测量的期望值并且使用期望值来自动检测异常的技术和系统。如果与y(t)的实际值之间的差值大于阈值差值(即,如果在时间t,其中X表示某个阈值),则认为这个条件是异常。使用一个或多个上下文信号来推断测量的期望值允许检测本地化到特定上下文的异常,诸如有限的地理区域内的异常。本文中公开的异常检测技术的一个示例应用用于确定可能对于用户社区是重要的或者用户社区感兴趣的真实世界事件。例如,特定地理区域内的异常可以指示特定地理区域中的重大真实世界事件,诸如车祸、 ...
【技术保护点】
一种计算机实现的方法,包括:至少部分基于第一实际值来推断针对第一上下文的期望值,所述第一实际值:(i)具有与所述期望值相同的类型,以及(ii)与不同于所述第一上下文的第二上下文相关联;通过将所述期望值与第二实际值相比较来确定预测误差,所述第二实际值:(i)具有与所述期望值相同的所述类型,以及(ii)与所述第一上下文相关联;以及至少部分基于所述预测误差来确定所述第一上下文中已经发生了异常。
【技术特征摘要】
【国外来华专利技术】2015.09.16 US 14/856,4611.一种计算机实现的方法,包括:至少部分基于第一实际值来推断针对第一上下文的期望值,所述第一实际值:(i)具有与所述期望值相同的类型,以及(ii)与不同于所述第一上下文的第二上下文相关联;通过将所述期望值与第二实际值相比较来确定预测误差,所述第二实际值:(i)具有与所述期望值相同的所述类型,以及(ii)与所述第一上下文相关联;以及至少部分基于所述预测误差来确定所述第一上下文中已经发生了异常。2.根据权利要求1所述的计算机实现的方法,还包括训练机器学习的推断函数,以根据至少所述第一实际值来推断针对所述第一上下文的所述期望值,其中推断所述期望值包括利用所述机器学习的推断函数。3.根据权利要求1所述的计算机实现的方法,还包括:确定所述预测误差的标准偏差;通过将所述预测误差除以所述标准偏差来对所述预测误差进行标准化,以获取标准化的预测误差;以及将所述标准化的预测误差与预定阈值相比较,其中确定所述第一上下文中已经发生了所述异常包括:确定所述标准化的预测误差超过所述预定阈值。4.根据权利要求1所述的计算机实现的方法,其中所述第一上下文包括第一地理区域,并且所述第二上下文包括位于距所述第一地理区域的预定距离内的第二地理区域,所述方法还包括:至少部分基于所述异常来确定所述第一地理区域中的事件。5.根据权利要求4所述的计算机实现的方法,还包括:将所述事件指定为候选事件;以及使用机器学习的二元分类器来确定所述候选事件是真实事件。6.根据权利要求5所述的计算机实现的方法,还包括:访问与用户相关联的常设查询;确定所述真实事件的属性满足所述常设查询;以及向与所述用户相关联的客户端设备传输所述真实事件的通知。7.根据权利要求5所述的计算机实现的方法,还包括:创建所述真实事件的文本摘要;以及导致所述文本摘要在位于所述第一地理区域内的公共空间中的公共显示器上的呈现。8.根据权利要求1所述的计算机实现的方法,其中所述第一上下文包括第一地理区域,并且所述第二上下文包括第二地理区域,所述方法还包括:将初始地理区域离散化为多个地理区域,所述多个地理区域包括所述第一地理区域和所述第二地理区域;对于所述多个地理区域中的每个地理区域,构建包括随着时间绘制的多个数据点的时间序列,每个数据点表示在时...
【专利技术属性】
技术研发人员:J·C·克鲁姆,E·J·霍维茨,J·K·沃尔克,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。