用于电力欺诈检测的新型非参数统计行为识别生态系统技术方案

技术编号:22174513 阅读:28 留言:0更新日期:2019-09-21 15:10
本公开的实施例针对电力欺诈检测系统,该电力欺诈检测系统涉及提高电力欺诈的检测率同时降低假肯定率的行为检测生态系统。更具体而言,避开机器学习算法有利于顺序地应用的两个单独模型。第一模型旨在通过使用检测器基于参与可疑行为的客户的需求简档来识别这些客户,从而提高电力欺诈的检测率。第二模型旨在通过识别任何可疑行为的潜在合理解释来降低假肯定率。减去具有合理解释的可疑行为只留下识别出的、无法解释的很可能与欺诈活动相关联的可疑行为。

A New Non-parametric Statistical Behavior Recognition Ecosystem for Electric Power Fraud Detection

【技术实现步骤摘要】
【国外来华专利技术】用于电力欺诈检测的新型非参数统计行为识别生态系统相关申请的交叉引用本申请要求标题为“NOVELNON-PARAMETRICSTATISTICALBEHAVIORALIDENTIFICATIONECOSYSTEMFORELECTRICITYFRAUDDETECTION”的于2017年4月13日提交的美国临时申请62/485,319和于2017年11月21日提交的美国非临时申请15/820,326的权益和优先权,上述每个申请出于所有目的通过引用整体并入本文。
技术介绍
电力公用事业公司(electricutilitycompany)的客户有时通过窃取电力而不付费来进行欺诈。这对于电力公用事业公司来说是严重的问题,因为难以检测到广泛的欺诈行为。传统上,电力公用事业公司依赖于三种方法中的一种来检测欺诈:(1)具有资深主题专业知识的人类分析员以及对诸如住房许可之类的各种数据源集合的访问;(2)由电气计量技术的制造商提供的基于规则的系统;或者(3)基于运气(luck-based)的系统,其中其它客户向电力公用事业公司告知明显的欺诈案例(例如,他们的邻居显然在窃电)。这些方法是不可靠的,这由通过基于运气的系统识别出的大多数欺诈案例所证实。这些方法的不可靠性源于低检测率和高假肯定(false-positive)率的组合。一些估计认为这些传统方法的假肯定率为80%,因此绝大多数所检测的欺诈案例实际上并没有发生欺诈。这导致电力公用事业公司花费巨大,从成本/收益的角度来看,抓住欺诈行为不再有利。抓住欺诈行为的这种经济不可行性使现有的欺诈者有胆量并鼓励潜在的欺诈者进行欺诈而进一步加剧了这一问题。因此,需要可靠的电力欺诈检测系统,该电力欺诈检测系统能够在没有低检测率和高假肯定率的情况下检测欺诈,并且足够稳健以应用于住宅和工业电力欺诈检测二者。本公开的实施例旨在至少解决这些需求。
技术实现思路
在一些实施例中,公开了一种计算系统,该计算系统包括一个或多个数据存储库,存储已知数据集和未知数据集,已知数据集包括与已知电欺诈案例相关联的第一数据项,未知数据集包括与多个服务点处的未知电欺诈案例相关联的第二数据项,其中多个服务点中的每个服务点对应于电表,并且其中第二数据项包括与对应于每个服务点的电表相关联的电力需求。计算系统还可以包括计算机处理器和存储程序指令的计算机可读存储介质,该程序指令被配置为由计算机处理器执行,以便使计算机处理器访问已知数据集并通过至少将模型的检测器行为应用于第一数据项来确定可疑已知案例集合。在一些实施例中,指令可以使计算机处理器通过针对模型的一个或多个假肯定解释来分析可疑已知案例集合中的每个已知案例,从可疑已知案例集合中确定已解释的已知案例集合,其中已解释的已知案例集合是可疑已知案例集合的子集。在一些实施例中,指令可以使计算机处理器基于所确定的可疑已知案例集合来验证模型、访问未知数据集,和/或通过至少将检测器行为应用于第二数据项来确定可疑未知案例集合。在一些实施例中,指令可以使计算机处理器通过针对一个或多个假肯定解释来分析可疑未知案例集合中的每个未知案例来从可疑未知案例集合中确定已解释的未知案例集合,其中已解释的未知案例集合是可疑未知案例集合的子集。在一些实施例中,指令可以使计算机处理器通过从可疑未知案例集合中减去已解释的未知案例集合来确定无法解释的未知案例集合,其中无法解释的未知案例集合是不与已解释的未知案例集合重叠的可疑未知案例集合的子集。附图说明图1图示了根据本公开的实施例的用于电力欺诈检测的系统图。图2A图示了根据本公开的实施例的针对检测电力欺诈的算法的框图。图2B图示了根据本公开的实施例的针对检测电力欺诈的算法的框图。图3A图示了根据本公开的实施例的可用于电力欺诈检测的需求数据的示例。图3B图示了根据本公开的实施例的可用于电力欺诈检测的欺诈数据的示例。图4A图示了根据本公开的实施例的可用于电力欺诈检测的示例分布表。图4B图示了根据本公开的实施例的可用于电力欺诈检测的示例分布图。图5图示了根据本公开的实施例的可用于电力欺诈检测的示例分布表。图6A图示了根据本公开的实施例的客户的示例需求简档。图6B图示了根据本公开的实施例的客户的需求的示例曲线图(graph)。图7图示了根据本公开的实施例的示例结果表。图8A图示了根据本公开的实施例的在欺诈案例中检测到的低中位数需求(mediandemand)的示例曲线图。图8B图示了根据本公开的实施例的在欺诈案例中检测到的低中位数需求的示例曲线图。图9A图示了根据本公开的实施例的在欺诈案例中检测到的零中位数需求的示例曲线图。图9B图示了根据本公开的实施例的在欺诈案例中检测到的零中位数需求的示例曲线图。图10图示了根据本公开的实施例的对应于可疑行为的合理(legitimate)解释的示例字段活动标记。图11图示了根据本公开的实施例的用于实现电力欺诈检测的框图。图12图示了根据本公开的实施例的用于电力欺诈检测的混合系统图。图13图示了根据本公开的实施例的用于需求突然减少,随后需求保持低位的示例行为模式。图14图示了根据本公开的实施例的用于需求缓慢减少,随后需求保持低位的示例行为模式。图15图示了根据本公开的实施例的用于在延长的时段内需求缓慢减少的示例行为模式。图16图示了根据本公开的实施例的用于非常低需求的示例行为模式。图17图示了根据本公开的实施例的当预期需求上升而需求未上升时的示例行为模式。图18图示了根据本公开的实施例的需求过于异常稳定的示例行为模式。图19描绘了用于实现实施例之一的分布式系统的简化图。图20是根据本公开的实施例的系统环境的组件的简化框图,通过该系统环境,可以将由实施例系统的组件提供的服务作为云服务供应。图21图示了其中可以实现本专利技术的各种实施例的示例性计算机系统。具体实施方式在以下描述中,出于解释的目的,阐述了具体细节以便提供对本专利技术的实施例的透彻理解。但是,显而易见的是,可以在没有这些具体细节的情况下实践各种实施例。附图和描述不旨在是限制性的。可以以各种配置提供一些图中描绘的系统。在某些实施例中,系统可以被配置为分布式系统,其中系统的一个或多个组件分布在云计算系统中的一个或多个网络上。在某些实施例中,系统可以被配置为在虚拟或非虚拟环境中操作。简介如前所述,电力公用事业公司的客户有时通过窃取电力而不付费来进行欺诈。由于低检测率和高假肯定率的组合,电力公用事业公司难以用现有系统检测这种欺诈。换句话说,系统无法检测到欺诈,并且有在系统确实检测到欺诈的几次,实际上并没有发生任何欺诈。应用于欺诈检测的机器学习算法的使用由于各种原因不太可能解决这些缺点。首先,机器学习算法(诸如被配置为将客户行为分类为欺诈或非欺诈的监督学习方法(例如,分类-SVM)),倾向于从过去的观察记忆模式以便应用于未来预测。不幸的是,过去对实际欺诈的观察数量有限,这为机器学习算法带来了冷启动问题;没有足够的欺诈案例数据来从机器学习算法中产生可靠的预测。因为算法只能检测到与用于训练算法的有限数量的案例类似的案例,因此可能存在许多未被算法检测到的欺诈案例,因为它们在训练集中未被首先识别。机器学习算法受限于它们所能检测到的,因为它们只能检测到过去已经发生的事情。低检测率的问题将持续存在。此外本文档来自技高网
...

【技术保护点】
1.一种用于检测电力欺诈的计算机实现的方法,所述方法包括:访问已知数据集,所述已知数据集包括与已知电力欺诈案例相关联的第一数据项;通过至少将模型的检测器行为应用于第一数据项来确定可疑已知案例集合;通过针对所述模型的一个或多个假肯定解释来分析可疑已知案例集合中的每个已知案例,从可疑已知案例集合中确定已解释的已知案例集合,其中已解释的已知案例集合是可疑已知案例集合的子集;基于所确定的可疑已知案例集合来验证所述模型;访问未知数据集,未知数据集包括与多个服务点处的未知电力欺诈案例相关联的第二数据项,其中所述多个服务点中的每个服务点对应于电表,并且其中第二数据项包括与对应于每个服务点的电表相关联的电力需求;通过至少将所述检测器行为应用于第二数据项来确定可疑未知案例集合;通过针对所述一个或多个假肯定解释来分析可疑未知案例集合中的每个未知案例,从可疑未知案例集合确定已解释的未知案例集合,其中已解释的未知案例集合是可疑未知案例集合的子集;以及通过从可疑未知案例集合中减去已解释的未知案例集合来确定无法解释的未知案例集合,其中无法解释的未知案例集合是与已解释的未知案例集合不重叠的可疑未知案例集合的子集。

【技术特征摘要】
【国外来华专利技术】2017.04.13 US 62/485,319;2017.11.21 US 15/820,3261.一种用于检测电力欺诈的计算机实现的方法,所述方法包括:访问已知数据集,所述已知数据集包括与已知电力欺诈案例相关联的第一数据项;通过至少将模型的检测器行为应用于第一数据项来确定可疑已知案例集合;通过针对所述模型的一个或多个假肯定解释来分析可疑已知案例集合中的每个已知案例,从可疑已知案例集合中确定已解释的已知案例集合,其中已解释的已知案例集合是可疑已知案例集合的子集;基于所确定的可疑已知案例集合来验证所述模型;访问未知数据集,未知数据集包括与多个服务点处的未知电力欺诈案例相关联的第二数据项,其中所述多个服务点中的每个服务点对应于电表,并且其中第二数据项包括与对应于每个服务点的电表相关联的电力需求;通过至少将所述检测器行为应用于第二数据项来确定可疑未知案例集合;通过针对所述一个或多个假肯定解释来分析可疑未知案例集合中的每个未知案例,从可疑未知案例集合确定已解释的未知案例集合,其中已解释的未知案例集合是可疑未知案例集合的子集;以及通过从可疑未知案例集合中减去已解释的未知案例集合来确定无法解释的未知案例集合,其中无法解释的未知案例集合是与已解释的未知案例集合不重叠的可疑未知案例集合的子集。2.如权利要求1所述的计算机实现的方法,其中所述检测器行为包括电力需求的突然增加,随后电力需求保持低位。3.如权利要求1所述的计算机实现的方法,其中所述检测器行为包括电力需求的缓慢减少,随后电力需求保持低位。4.如权利要求1所述的计算机实现的方法,其中所述检测器行为包括在延长的时间段内电力需求的缓慢减少。5.如权利要求1所述的计算机实现的方法,其中所述检测器行为包括非常低的电力需求。6.如权利要求1所述的计算机实现的方法,其中所述检测器行为包括电力需求未按预期那样上升。7.如权利要求1所述的计算机实现的方法,其中所述检测器行为包括异常稳定的电力需求。8.一种计算系统,包括:一个或多个数据存储库,存储:已知数据集,包括与已知电力欺诈案例相关联的第一数据项;未知数据集,包括与多个服务点处的未知电力欺诈案例相关联的第二数据项,其中所述多个服务点中的每个服务点对应于电表,并且其中第二数据项包括与对应于每个服务点的电表相关联的电力需求;计算机处理器;以及存储器,存储程序指令,所述程序指令被配置为由计算机处理器执行,以使得所述计算机处理器执行以下操作:访问已知数据集;通过至少将模型的检测器行为应用于第一数据项来确定可疑已知案例集合;通过针对所述模型的一个或多个假肯定解释来分析可疑已知案例集合中的每个已知案例,从可疑已知案例集合中确定已解释的已知案例集合,其中已解释的已知案例集合是可疑已知案例集合的子集;基于所确定的可疑已知案例集合来验证所述模型;访问未知数据集;通过至少将所...

【专利技术属性】
技术研发人员:H·阿巴斯
申请(专利权)人:甲骨文国际公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1