本申请实施方式公开了一种海量交易日志中基于账户的热点交易识别方法及系统,其中,方法包括:从交易日志中获得每T分钟时间段内交易次数大于阈值M的账户,并保存在高频账户表中;将所述高频账户表中的账户在对应时间段中的所有交易提取出来,保存至热点交易表中;对所述热点交易表中的每一笔交易进行热度值计算,获得热点交易表中每一笔交易的热度值;对热度值大于阈值N的交易进行统计,识别出交易日志中热点交易。
【技术实现步骤摘要】
一种海量交易日志中基于账户的热点交易识别方法及系统
本申请涉及互联网
,特别涉及一种海量交易日志中基于账户的热点交易识别方法及系统。
技术介绍
大型联机交易的核心系统中普遍存在高频账户及其热点交易。如果外围系统对于同一账户,以异步方式持续、并发调用核心,容易形成热点账户交易,严重影响核心系统数据库性能,甚至引发数据库超时或死锁。目前,大型联机交易核心系统日志分析中,将高频账户视为热点账户。这样做很不精确,一方面有些热点账户的交易总次数不多,但在某个时间点很密集形成热点交易,这些热点账户及其交易将会被遗漏;另一方面,有些账户交易量很大,但交易并不密集,也被误归为热点账户。因此,现有技术不能准确识别出热点账户及其交易,不能发现交易来源系统,也不能对热点账户交易的拥挤程度及性能进行定量分析。
技术实现思路
本申请实施方式的目的是提供一种海量交易日志中基于账户的热点交易识别方法及系统,本技术方案解决如何从交易系统的海量交易日志中快速、准确识别出热点交易的技术问题,能够准确识别热点账户及其交易,明确热点交易的来源及性能问题,以便外围系统采取控制措施。为实现上述目的,本申请实施方式提供一种海量交易日志中热点基于账户的交易识别方法,包括:从交易日志中获得每T分钟时间段内交易次数大于阈值M的账户,并保存在高频账户表中;将所述高频账户表中的账户在对应时间段中的所有交易提取出来,保存至热点交易表中;对所述热点交易表中的每一笔交易进行热度值计算,获得热点交易表中每一笔交易的热度值;对热度值大于阈值N的交易进行统计,识别出交易日志中热点交易。优选地,还包括:在识别出交易日志中热点交易时,确定所述热点交易的场景信息和性能信息。优选地,所述热点交易表中每一笔交易的热度值计算方法为:遍历所述热点交易表,统计与本交易同账号、交易时间重叠的交易笔数,所述交易笔数为该笔交易的热度值。优选地,遍历所述热点交易表的方法为:遍历在所述热点交易表中所述账户在当前时间段T对应交易、在前一时间段T对应交易以及后一时间段T对应交易。优选地,所述高频账户表的字段包括:日期、时间段、账号、交易次数。优选地,所述热点交易表的字段包括:日期、起始时间戳、结束时间戳、热度值,以及交易日志的字段。优选地,所述交易日志的字段包括:交易码、流水号、渠道标识、返回码。优选地,所述场景信息包括:交易发起系统和交易码。优选地,所述性能信息包括:交易量、平均处理时间。为实现上述目的,本申请实施方式还提供了一种海量交易日志中基于账户的热点交易识别系统,包括:高频账户表扫描单元,用于从交易日志中获得每T分钟时间段内交易次数大于阈值M的账户,并保存在高频账户表中;热点交易表扫描单元,用于将所述高频账户表中的账户在对应时间段中的所有交易提取出来,保存至热点交易表中;热度值计算单元,用于对所述热点交易表中的每一笔交易进行热度值计算,获得热点交易表中每一笔交易的热度值;识别单元,用于对热度值大于阈值N的交易进行统计,识别出交易日志中热点交易。优选地,所述识别单元还用于在识别出交易日志中热点交易时,确定所述热点交易的场景信息和性能信息。优选地,所述热度值计算单元遍历所述热点交易表,统计与本交易同账号、交易时间重叠的交易笔数,所述交易笔数为该笔交易的热度值。优选地,所述热度值计算单元遍历所述热点交易表的方法为:遍历在所述热点交易表中所述账户在当前时间段T对应交易、在前一时间段T对应交易以及后一时间段T对应交易。由上可见,与现有技术相比较,本技术方案采用热度值指标来识别热点交易,衡量热点交易的密集度,在此基础上统计热点交易的来源和性能。这对于应用系统的联机性能监控、风险评估等维护工作,有着重要的现实意义。附图说明为了更清楚地说明本申请实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提出的一种海量交易日志中基于账户的热点交易识别方法的流程图;图2为本申请实施例提出的一种海量交易日志中基于账户的热点交易识别系统的示意图之一;图3为本申请实施例提供的一种海量交易日志中基于账户的热点交易识别系统的示意图之二。具体实施方式为了使本
的人员更好地理解本申请中的技术方案,下面将结合本申请实施方式中的附图,对本申请实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本申请一部分实施方式,而不是全部的实施方式。基于本申请中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都应当属于本申请保护的范围。在日交易量亿级以上的海量联机交易日志数据中,通常只能挖掘出高频账户,但不能准确识别出哪些高频账户形成了热点交易,也不能对热点交易的拥挤程度及性能进行定量分析,不能确定哪个外围系统产生的热点交易。基于此,本申请提供一种海量交易日志中基于账户的热点交易识别方法,在本实施例中,根据图1所示步骤从高频账户中识别出热点交易。所述方法可以应用于具备数据处理功能的终端设备中。所述终端设备例如可以是台式电脑、笔记本电脑、平板电脑、工作站、智能手机等。所述方法可以包括以下步骤:S11:从交易日志中获得每T分钟时间段内交易次数大于阈值M的账户,并保存在高频账户表中。在本实施例中,从一天的交易日志中,每T分钟时间段内交易次数大于阈值M的账户识别出来,保存在高频账户表中。高频账户表关键字段包括日期、时间段、账号、交易次数。参数T和阈值M根据交易数据的实际情况进行动态调整。阈值M大于1,T值越高,则M值相应越高。S12:将所述高频账户表中的账户在对应时间段中的所有交易提取出来,保存至热点交易表中。在本实施例中,将高频账户表中的账户从一天的交易日志的每段时间中的所有交易提取出来,保证在热点交易表中。其中,热点交易表中的关键字段包括:日期、起始时间戳、结束时间戳、热度值,以及其他来源于交易日志中的任何字段,比如:交易码、流水号、渠道标识、返回码等。S13:对所述热点交易表中的每一笔交易进行热度值计算,获得热点交易表中每一笔交易的热度值。在本实施例中,对热点交易表中的每笔交易进行热度值计算。计算方法是:针对热点交易表中的每笔交易,根据账户信息遍历热点交易表,统计同账号、交易时间重叠的交易笔数,作为该笔交易的热度值。具体如下:设当前交易的起始时间戳为ST1,结束时间戳为ET1。热点交易表中该账户的所有交易中,起始时间戳ST在(ST1,ET1)之间,或者结束时间戳ET在(ST1,ET1)之间的交易量总数,即为当前交易的热度值。由于交易处理时间远小于时间段长度T分钟,因此可以只遍历热点交易表中该交易所处时间段内的交易,以提高遍历效率。同时,为了不遗漏当前时间段起止点附近的热点交易,将当前时间段的前一个时间段和后一个时间段也纳入遍历范围。这种实施方式可以准确地计算当前交易的热度值,同时避免了全表遍历,大大提高了作业效率。S14:对热度值大于阈值N的交易进行统计,识别出交易日志中热点交易。在本实施例中,通过对热度值大于阈值N的交易进行统计,可以得知热点交易是哪些系统发起、本文档来自技高网...

【技术保护点】
一种海量交易日志中热点基于账户的交易识别方法,其特征在于,包括:从交易日志中获得每T分钟时间段内交易次数大于阈值M的账户,并保存在高频账户表中;将所述高频账户表中的账户在对应时间段中的所有交易提取出来,保存至热点交易表中;对所述热点交易表中的每一笔交易进行热度值计算,获得热点交易表中每一笔交易的热度值;对热度值大于阈值N的交易进行统计,识别出交易日志中热点交易。
【技术特征摘要】
1.一种海量交易日志中热点基于账户的交易识别方法,其特征在于,包括:从交易日志中获得每T分钟时间段内交易次数大于阈值M的账户,并保存在高频账户表中;将所述高频账户表中的账户在对应时间段中的所有交易提取出来,保存至热点交易表中;对所述热点交易表中的每一笔交易进行热度值计算,获得热点交易表中每一笔交易的热度值;对热度值大于阈值N的交易进行统计,识别出交易日志中热点交易。2.如权利要求1所述的方法,其特征在于,还包括:在识别出交易日志中热点交易时,确定所述热点交易的场景信息和性能信息。3.如权利要求1所述的方法,其特征在于,所述热点交易表中每一笔交易的热度值计算方法为:遍历所述热点交易表,统计与本交易同账号、交易时间重叠的交易笔数,所述交易笔数为该笔交易的热度值。4.如权利要求3所述的方法,其特征在于,遍历所述热点交易表的方法为:遍历在所述热点交易表中所述账户在当前时间段T对应交易、在前一时间段T对应交易以及后一时间段T对应交易。5.如权利要求1所述的方法,其特征在于,所述高频账户表的字段包括:日期、时间段、账号、交易次数。6.如权利要求1所述的方法,其特征在于,所述热点交易表的字段包括:日期、起始时间戳、结束时间戳、热度值,以及交易日志的字段。7.如权利要求6所述的方法,其特征在于,所述交易日志的字段包括:交...
【专利技术属性】
技术研发人员:袁纯良,杨兆明,李丽,董岩,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。