当前位置: 首页 > 专利查询>浙江大学专利>正文

一种面向金融数据监测的蝴蝶计数方法及装置制造方法及图纸

技术编号:38351798 阅读:11 留言:0更新日期:2023-08-05 17:24
本发明专利技术公开了一种面向金融数据监测的蝴蝶计数方法及装置,该方法包括:获取股市交易信息,每条信息包含投资者、股票和交易时间;将投资者和股票分别建模成投资者结点集合和股票结点集合,将交易建模成边集合,每条边连接一个投资者结点和一个股票结点且带有一个交易时间的信息,从而构建一个时态二部图;基于结点的优先级,枚举时态二部图中由两条交易组成的楔形结构;根据设定的频率阈值,通过树形归并过程将楔形结构两两组合校验,并使用红黑树过滤不能构成高频交易特征的蝴蝶结构的楔形结构;通过两棵红黑树维护楔形结构集合,计算每一种表示不同交易顺序的蝴蝶结构的数量。算每一种表示不同交易顺序的蝴蝶结构的数量。算每一种表示不同交易顺序的蝴蝶结构的数量。

【技术实现步骤摘要】
一种面向金融数据监测的蝴蝶计数方法及装置


[0001]本专利技术属于二部图数据挖掘领域,尤其涉及一种面向金融数据监测的蝴蝶计数方法及装置。

技术介绍

[0002]二部图是一种刻画两类事物之间关系的常用建模方式,已得到了广泛应用。在金融领域中,构建二部图可以有效地描述投资者、股票之间的交易关系。其中,蝴蝶结构是二部图上最重要的基础结构,在股票交易市场被视为最基础的资金流转单元,统计其数量可以帮助金融机构监测市场的动态变化,发现潜在的交易风险和机会。
[0003]近期,时态二部图通过引入时间信息扩展了传统的二部图,受到了越来越多的关注。现有的蝴蝶计数方法只考虑结构特征,没有进一步考虑时态二部图中额外的时间信息,而在实际金融市场中,交易流程、交易频率信息是至关重要的。因此,设计一种面向金融数据监测的蝴蝶计数方法已经成为学术界和工业界的迫切需要。
[0004]在实现本专利技术的过程中,专利技术人发现现有技术中至少存在如下问题:
[0005]首先,现有的蝴蝶计数方法将所有时间的交易信息等价考虑,未能考虑高频交易特征,而这类特征的蝴蝶结构往往要求交易在短时间内发生,因此可能导致错误监测信号的产生。此外,现有方法忽视了同一蝴蝶结构内的交易发生顺序,丢失了交易流程信息,这可能需要金融机构投入额外的成本进行数据分析,从而大大影响了效率。

技术实现思路

[0006]针对现有技术的不足,本申请实施例的目的是提供一种面向金融数据监测的蝴蝶计数方法及装置,能更为精确地捕获高频交易特征的蝴蝶结构的产生,以及详细提供各种交易顺序的蝴蝶结构数量。
[0007]根据本申请实施例的第一方面,提供一种面向金融数据监测的蝴蝶计数方法,包括:
[0008]获取股市交易信息,每条信息包含投资者、股票和交易时间;
[0009]将所述股市交易信息中的投资者和股票分别建模成投资者结点集合和股票结点集合,将投资者和股票之间的交易建模成边集合,每条边连接一个投资者结点和一个股票结点且带有一个交易时间的信息,从而构建一个时态二部图;
[0010]基于结点的优先级,枚举所述时态二部图中由两条交易组成的楔形结构;
[0011]根据设定的频率阈值,通过树形归并过程将所述楔形结构两两组合校验,并使用红黑树过滤不能构成高频交易特征的蝴蝶结构的楔形结构,其中所述蝴蝶结构由两个具有相同开始结点、相同结束结点和不同中间结点的楔形结构组成;
[0012]通过两棵红黑树维护楔形结构集合,计算每一种表示不同交易顺序的蝴蝶结构的数量。
[0013]进一步地,基于结点的优先级,枚举所述时态二部图中由两条交易组成的楔形结
构,包括:
[0014]对所述时态二部图中每一个邻边集合内的边按照到达结点的结点优先级进行排序;
[0015]将每一个结点视作开始结点,遍历其邻边集合确定中间结点,再遍历中间结点的邻边集合确定结束结点,且需满足中间结点和结束结点的结点优先级小于开始结点,从而枚举楔形结构。
[0016]进一步地,对于结点u,w,若u的邻边集合大小大于v的邻边集合大小或u的邻边集合大小等于的v邻边集合大小且u的ID大于v的ID,则节点u的优先级高于节点w的优先级。
[0017]进一步地,根据设定的频率阈值,通过树形归并过程将所述楔形结构两两组合校验,并使用红黑树过滤不能构成高频交易特征的蝴蝶结构的楔形结构,包括:
[0018]过滤时间区间大于设定的频率阈值即无法构成高频交易特征蝴蝶结构的楔形结构;
[0019]对于过滤后具有相同开始结点和相同结束结点的楔形结构,按照中间结点的不同放入不同集合;
[0020]按照时态优先级,对每个集合内的楔形结构进行排序;
[0021]按照时态优先级,通过树形归并所有楔形结构集合,以保证楔形结构两两均可以组成蝴蝶结构,其中在归并过程中使用红黑树进一步校验楔形结构两两组合是否能组成高频交易特征的蝴蝶结构并过滤不能组成高频交易特征的蝴蝶结构的楔形结构。
[0022]进一步地,对于楔形结构∠
i
,∠
j
,若∠
i
的开始时间大于∠
j
的开始时间,或,∠
i
的开始时间等于∠
j
的开始时间且∠
i
的结束时间小于∠
j
的结束时间,则楔形结构∠
i
的时态优先级高于楔形结构∠
j
的时态优先级。
[0023]进一步地,通过两棵红黑树维护楔形结构集合,计算每一种表示不同交易顺序的蝴蝶结构的数量,包括:
[0024]通过两颗红黑树维护同一个楔形结构集合,其中一颗红黑树以楔形结构的开始时间为树的键值,另一颗红黑树以楔形结构的结束时间为树的键值;
[0025]按照不同蝴蝶结构四条边的时间关系,在两棵红黑树上查询以计算各种蝴蝶结构的数量。
[0026]进一步地,该方法还可以包括:
[0027]若其中一类蝴蝶结构的数量超过预定数量阈值,则触发提示。
[0028]根据本申请实施例的第二方面,提供一种面向金融数据监测的蝴蝶计数装置,包括:
[0029]获取模块,用于获取股市交易信息,每条信息包含投资者、股票和交易时间;
[0030]构建模块,用于将所述股市交易信息中的投资者和股票分别建模成投资者结点集合和股票结点集合,将投资者和股票之间的交易建模成边集合,每条边连接一个投资者结点和一个股票结点且带有一个交易时间的信息,从而构建一个时态二部图;
[0031]枚举模块,用于基于结点的优先级,枚举所述时态二部图中由两条交易组成的楔形结构;
[0032]过滤模块,用于根据设定的频率阈值,通过树形归并过程将所述楔形结构两两组合校验,并使用红黑树过滤不能构成高频交易特征的蝴蝶结构的楔形结构,其中所述蝴蝶
结构由两个具有相同开始结点、相同结束结点和不同中间结点的楔形结构组成;
[0033]计算模块,用于通过两棵红黑树维护楔形结构集合,计算每一种表示不同交易顺序的蝴蝶结构的数量。
[0034]根据本申请实施例的第三方面,提供一种电子设备,包括:
[0035]一个或多个处理器;
[0036]存储器,用于存储一个或多个程序;
[0037]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的方法。
[0038]根据本申请实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如第一方面所述方法的步骤。
[0039]本申请的实施例提供的技术方案可以包括以下有益效果:
[0040]由上述实施例可知,本申请针对金融数据监测构建了能充分利用时间信息的蝴蝶计数方法及装置。本申请利用时态二部图,形象地建模了金融数据以供分析挖掘;利用结点优先级,加速了楔形结构的枚举;利用树形归并和红黑树,解决了现有方法无法统计本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向金融数据监测的蝴蝶计数方法,其特征在于,包括:获取股市交易信息,每条信息包含投资者、股票和交易时间;将所述股市交易信息中的投资者和股票分别建模成投资者结点集合和股票结点集合,将投资者和股票之间的交易建模成边集合,每条边连接一个投资者结点和一个股票结点且带有一个交易时间的信息,从而构建一个时态二部图;基于结点的优先级,枚举所述时态二部图中由两条交易组成的楔形结构;根据设定的频率阈值,通过树形归并过程将所述楔形结构两两组合校验,并使用红黑树过滤不能构成高频交易特征的蝴蝶结构的楔形结构,其中所述蝴蝶结构由两个具有相同开始结点、相同结束结点和不同中间结点的楔形结构组成;通过两棵红黑树维护楔形结构集合,计算每一种表示不同交易顺序的蝴蝶结构的数量。2.根据权利要求1所述的方法,其特征在于,基于结点的优先级,枚举所述时态二部图中由两条交易组成的楔形结构,包括:对所述时态二部图中每一个邻边集合内的边按照到达结点的结点优先级进行排序;将每一个结点视作开始结点,遍历其邻边集合确定中间结点,再遍历中间结点的邻边集合确定结束结点,且需满足中间结点和结束结点的结点优先级小于开始结点,从而枚举楔形结构。3.根据权利要求1所述的方法,其特征在于,对于结点u,w,若的邻边集合大小大于v的邻边集合大小或u的邻边集合大小等于的v邻边集合大小且u的ID大于v的ID,则节点u的优先级高于节点w的优先级。4.根据权利要求1所述的方法,其特征在于,根据设定的频率阈值,通过树形归并过程将所述楔形结构两两组合校验,并使用红黑树过滤不能构成高频交易特征的蝴蝶结构的楔形结构,包括:过滤时间区间大于设定的频率阈值即无法构成高频交易特征蝴蝶结构的楔形结构;对于过滤后具有相同开始结点和相同结束结点的楔形结构,按照中间结点的不同放入不同集合;按照时态优先级,对每个集合内的楔形结构进行排序;按照时态优先级,通过树形归并所有楔形结构集合,以保证楔形结构两两均可以组成蝴蝶结构,其中在归并过程中使用红黑树进一步校验楔形结构两两组合是否能组成高频交易特征的蝴蝶结构并过滤不能组成高频交易特征的蝴蝶结构的楔形结构。5.根据权利要求4所述的方法,其特征在于,对于楔形结构∠
i
,∠
j
,若∠
i
...

【专利技术属性】
技术研发人员:高云君蔡鑫伟陈璐柯翔宇柳晴
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1