System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于异质图神经网络的股票价格波动预测方法技术_技高网

一种基于异质图神经网络的股票价格波动预测方法技术

技术编号:43081844 阅读:9 留言:0更新日期:2024-10-26 09:32
本发明专利技术涉及一种基于异质图神经网络的股票价格波动预测方法,属于大数据模型应用技术领域,该方法包括:S1,异质图构建;S2,动态异质图嵌入生成;S3,基于元路径的消息传递;S4,将新闻驱动市场预测整合器和行业新闻融合编码器,分别用于实现特征融合和评估间接连接的股票节点之间的影响力评分,S5,利用宏观经济同步编码器得到宏观嵌入向量,再进行股票嵌入和宏观嵌入向量的交叉融合;S6,节点嵌入的消息传递与更新;S7,经过预测层输出预测结果,并且采用反向传播和梯度下降算法优化模型。本发明专利技术通过量化新闻内容对股票的影响、捕捉多条新闻内容之间的共性,以及精确分析宏观经济因素对股票价格波动的影响,对股票波动进行了更准确的预测。

【技术实现步骤摘要】

本专利技术涉及一种基于异质图神经网络的股票价格波动预测方法,属于大数据模型应用。


技术介绍

1、股价波动预测在金融市场中扮演着至关重要的角色。它不仅赋予投资者制定买入、持有或卖出策略的能力,从而优化其投资组合并降低潜在风险,还使金融机构得以管理资产负债、精确评估风险并制定切实可行的信贷策略。更为重要的是,它赋予政策制定者深刻洞察市场动态的能力,从而有效监管市场,防止过度投机和市场泡沫的产生。

2、以往研究中,股价预测依赖统计和时间序列分析,但这些方法在处理大量数据时受到限制,而数据越多,股价预测就会越加准确。随着大数据深度学习的兴起,研究者能够通过神经网络模型,如循环神经网络(recurrent neural network,rnn)、长短期记忆网络(long short-term memory,lstm)和卷积神经网络(convolutional neural networks,cnn)等,提取更深层次的数据特征,并处理大量数据,从而提高预测准确性。特别地,stocknet通过分析新闻标题增强了模型的预测能力,而多尺度注意网络-浅层特征(multiscale attention networks-shallow features,man-sf)与秩和比(rank-sumratio,rsr)模型通过构建股票关系图捕捉行业和供应链间的相互影响。

3、尽管取得了很大进展,但股价预测仍旧面临诸多挑战,包括如何量化新闻内容对股票产生的影响、捕捉多条新闻内容之间的共性、以及精确分析宏观经济因素对股票价格波动的影响等,这些挑战都在等着人们去有效地应对。


技术实现思路

1、针对现有方法未能充分利用新闻新本信息和情感信息,以及未考虑到宏观经济对股票的影响,专利技术人提出了一种基于异质图神经网络的股票价格波动预测的方法。

2、本专利技术的核心思想为:采用神经网络和通用句子编码器(universal sentenceencoder,use)对股票和新闻的特征进行量化,并且通过领域知识和提示工程(promptengineering)预定义节点之间的连接关系,实现异质图的构建;通过可学习的投影矩阵将原始特征空间线性投影到一个共享的低维嵌入空间;根据人为定义的元路径(meta-path)进行若干轮的消息传递,得到不同元路径下特定的节点嵌入(embedding),并对不同元路径下的节点嵌入进行语义层面的聚合;使用新闻驱动市场预测整合器(press-driven marketforecast integrator)实现新闻内容嵌入和股票价格嵌入的特征融合,同时行业新闻融合编码器(hybrid industry-news encoder)评估间接连接的股票节点之间的影响力评分,至此实现将包含股票、新闻和行业节点的异质图转化为仅包含股票节点的有向同质图,它是由当前状态下的股票嵌入向量集合和邻接矩阵组成,其中邻接矩阵由影响力评分组成;在上述同质图的基础上,将宏观经济层面的数据输入宏观经济同步编码器(macroeconomicsynchronous encoder)中,然后输出与每支股票对应的宏观嵌入向量,并通过双线性(bi-linear)交叉层,实现股票嵌入和宏观嵌入向量的交叉融合;再进行若干轮的消息传递;最后经过预测层输出预测结果。

3、本专利技术一种基于异质图神经网络的股票价格波动预测方法,包括异质图构建、动态异质图嵌入生成、基于元路径的消息传递、特征融合、图注意力机制、宏观经济嵌入和股票价格波动预测七个部分。

4、一种基于异质图神经网络的股票价格波动预测方法,包括如下步骤:

5、步骤1、异质图构建,具体包括下列子步骤:

6、子步骤1.1、数据清洗和预处理。针对股票数据,专利技术人选择交易日当天的最高价、最低价以及调整后的收盘价作为原始特征其中和分别表示最高价、最低价和调整后的收盘价。由于股票价格波动是由相对价格决定的,所以专利技术人用该股票前一个交易日的原始特征对当天的原始特征进行标准化,得到针对新闻数据,专利技术人以新闻标题作为原始数据,通过tensorflow_hub库中提供的通用句子编码器use对每条新闻标题进行编码,得到新闻的内容嵌入

7、子步骤1.2、用提示工程挖掘潜在的影响对象,即可能会受新闻影响的股票。首先专利技术人构造提示词,例如:有一条苹果公司的新闻:“itv will boost apple”,则提示词如下:“忘记先前的指令,从现在开始你是一名经验丰富的金融专家。现在我给你一则财经新闻和一个股票代码集合。你的任务是仔细分析这些股票代码,判断它们是否会受到影响,同时选择出一些最有可能受到影响的股票代码,并确定这种影响是积极的还是消极的。股票代码集合如下:{abb、bac、...、jpm、gmre}。你只需要向我提供json格式的数据,其中的键值表示受到影响的代码,数值表示是正或负面影响,正面影响用1表示、负面影响用0表示。财经新闻如下:itv will boost apple”。将提示词输入到金融大模型提供的应用程序编程接口(application programming interface,api)中,返回一条json格式的数据,其中包括可能会受到新闻影响的股票代码以及该影响的类型,例如正面或负面影响。

8、子步骤1.3、构建数据集,并且对数据集进行划分。数据集文件“dataset”以组织化和分层的方式存储了关于各种股票的信息,由多个文件夹组成,每个文件夹以一只特定股票的代码命名,例如“aapl”。在每个股票代码的文件夹内,数据进一步细分为代表不同交易日的子文件夹,这些子文件夹以“日/月/年”的格式命名,覆盖了一定的时间段,例如01/01/2014至01/01/2016。对于每一个交易日,相应的文件夹包含三类关键信息:一是该股票在当天的预处理后的历史价格特征数据二是与该股票直接相关的新闻文本内容嵌入三是由提示工程生成的json格式文件。对于01/01/2014至01/01/2016这个时间段来说,01/01/2014至01/08/2015之间的数据作为训练集,01/08/2015至01/10/2015之间的数据作为验证集,01/10/2015至01/01/2016之间的数据作为测试集。

9、子步骤1.4、生成新闻情感嵌入在完成子步骤1.3的提示工程后,专利技术人获得了一个json文件,此文件列出了可能受到新闻影响的股票代码,以及这些影响的类型。为了量化这种影响,专利技术人采用了独热编码(one-hot encoding)方法来生成情感嵌入。具体来说,假设新闻a预计会影响股票a、b和c,根据这些影响是正面还是负面,专利技术人分别为每支股票分配一个二元向量:对于股票a的正面影响,其编码为[1,0];而对于股票b和c的负面影响,它们各自的编码为[0,1];对于未受影响的股票,专利技术人分配一个[0,0]的编码,表示既没有正面也没有负面影响。接下来,专利技术人聚合这些独热编码结果,生成一个n×2维的向量其中n代表总的股票数量。

10、子步骤1.5、本文档来自技高网...

【技术保护点】

1.一种基于异质图神经网络的股票价格波动预测方法,所述方法包括下列步骤:S1,异质图构建;S2,动态异质图嵌入生成;S3,基于元路径的消息传递;S4,将新闻驱动市场预测整合器和行业新闻融合编码器,分别用于实现特征融合和评估间接连接的股票节点之间的影响力评分,S5,利用宏观经济同步编码器得到宏观嵌入向量,之后进行股票嵌入和宏观嵌入向量的交叉融合;S6,节点嵌入的消息传递与更新;S7,经过预测层输出预测结果,并且采用反向传播和梯度下降算法优化模型。

2.根据权利要求1所述一种基于异质图神经网络的股票价格波动预测方法,其特征在于:所述步骤S1具体包括如下子步骤:S1.1,数据清洗和预处理,具体包括:选择交易日当天的最高价、最低价以及调整后的收盘价作为原始特征其中和分别表示最高价、最低价和调整后的收盘价,用该股票前一个交易日的原始特征对当天的原始特征进行标准化,得到以新闻标题作为原始数据,通过tensorflow_hub库中提供的通用句子编码器USE对每条新闻标题进行编码,得到新闻的内容嵌入S1.2,用提示工程挖掘潜在的影响对象,即可能会受新闻影响的股票;S1.3,构建数据集DataSet,并且对数据集DataSet进行划分;S1.4,生成新闻情感嵌入具体包括:采用了独热编码方法来生成情感嵌入,为每支股票分配一个二元向量,具体分配方法如下:对股票影响正面,其编码为[1,0];对股票影响负面,其编码为[0,1];对股票无影响,其编码[0,0];聚合这些独热编码结果,生成一个n×2维的向量n代表总的股票数量;S1.5,构建邻接矩阵具体包括:将要构建的异质图包含股票、新闻和行业三种类型节点,从现实世界中提取了两种不同类型的关系作为异质图的边E,并且表示为邻接矩阵至此构建出完整的异质图。

3.根据权利要求2所述一种基于异质图神经网络的股票价格波动预测方法,其特征在于:所述步骤S2具体包括下列子步骤:S2.1,历史价格新闻文本和新闻情感时序嵌入生成:将股票在交易日区间为[t-T,t)的历史价格特征输入时序融合编码器,输出历史价格时序嵌入通过类似的时序融合编码器实现新闻文本和新闻情感时序嵌入的生成;S2.2,生成时序邻接矩阵具体包括:将交易日区间为[t-T,t)的异质图邻接矩阵输入通道加权图网络中,得到时序邻接矩阵

4.根据权利要求3所述一种基于异质图神经网络的股票价格波动预测方法,其特征在于:所述步骤S3具体包括:S3.1,指定元路径;S3.2,采用多头注意力机制聚合每个节点的元路径邻居的信息;S3.3,采用多层注意力机制聚合三个节点嵌入向量。

5.根据权利要求4所述一种基于异质图神经网络的股票价格波动预测方法,其特征在于:所述子步骤S3.1具体包括:定义元路径为形式的路径,以描述节点类型O1和Ol之间的复合关系其中°表示关系上的组合运算符;所述子步骤S3.2具体包括:按下列方式定义元路径邻居:给定异质图的节点i和元路径Φk,节点i的基于元路径的邻居被定义为通过元路径Φk与节点i连接的节点的集合,该节点的邻居包括其自身。

6.根据权利要求5所述一种基于异质图神经网络的股票价格波动预测方法,其特征在于:所述子步骤S3.2包括下列孙步骤:S.3.2.1,通过可学习的矩阵和向量计算注意力系数其中表示节点i与节点j在元路径Φk的第h个头下的注意力系数;S3.2.2,通过多头注意力机制来聚合一个节点i的邻居节点j的特征和节点i的最终聚合特征,具体内容包括:对于在总共H个头中的每个头h,首先计算节点i和其元路径Φk上邻居j之间的加权特征,这个加权是通过注所述意力系数和所述矩阵实现的,然后对于每个头的输出,使用激活函数σ(*)引入非线性,最后将所有头的输出连接起来,表示为形成节点i的最终聚合特征

7.根据权利要求6所述一种基于异质图神经网络的股票价格波动预测方法,其特征在于:所述步骤S4包括下列子步骤:S4.1、通过新闻驱动市场预测整合器实现新闻节点和股票节点嵌入向量的特征融合,具体包括S4.1.1,通过加权聚合策略对股票节点j的邻接新闻节点集进行优化整合,通过加权求和生成嵌入向量如下列公式所示:

8.根据权利要求7所述一种基于异质图神经网络的股票价格波动预测方法,其特征在于:所述步骤S5包括下列子步骤:S5.1,将在交易日区间为[t-T,t)的宏观经济层面数据输入宏观经济同步编码器中,然后输出与股票i对应的宏观嵌入向量S5.2,通过双线性交叉层,实现股票节点嵌入和宏观嵌入向量的交叉融合。

9.根据权利要求8所述一种基于异质图神经网络的股票价格波动预测方法,其特征在于:所述步骤S6包括下列子步骤:S6.1,对节点间的信息进行若干轮消息传递,从而更新其自身的嵌...

【技术特征摘要】

1.一种基于异质图神经网络的股票价格波动预测方法,所述方法包括下列步骤:s1,异质图构建;s2,动态异质图嵌入生成;s3,基于元路径的消息传递;s4,将新闻驱动市场预测整合器和行业新闻融合编码器,分别用于实现特征融合和评估间接连接的股票节点之间的影响力评分,s5,利用宏观经济同步编码器得到宏观嵌入向量,之后进行股票嵌入和宏观嵌入向量的交叉融合;s6,节点嵌入的消息传递与更新;s7,经过预测层输出预测结果,并且采用反向传播和梯度下降算法优化模型。

2.根据权利要求1所述一种基于异质图神经网络的股票价格波动预测方法,其特征在于:所述步骤s1具体包括如下子步骤:s1.1,数据清洗和预处理,具体包括:选择交易日当天的最高价、最低价以及调整后的收盘价作为原始特征其中和分别表示最高价、最低价和调整后的收盘价,用该股票前一个交易日的原始特征对当天的原始特征进行标准化,得到以新闻标题作为原始数据,通过tensorflow_hub库中提供的通用句子编码器use对每条新闻标题进行编码,得到新闻的内容嵌入s1.2,用提示工程挖掘潜在的影响对象,即可能会受新闻影响的股票;s1.3,构建数据集dataset,并且对数据集dataset进行划分;s1.4,生成新闻情感嵌入具体包括:采用了独热编码方法来生成情感嵌入,为每支股票分配一个二元向量,具体分配方法如下:对股票影响正面,其编码为[1,0];对股票影响负面,其编码为[0,1];对股票无影响,其编码[0,0];聚合这些独热编码结果,生成一个n×2维的向量n代表总的股票数量;s1.5,构建邻接矩阵具体包括:将要构建的异质图包含股票、新闻和行业三种类型节点,从现实世界中提取了两种不同类型的关系作为异质图的边e,并且表示为邻接矩阵至此构建出完整的异质图。

3.根据权利要求2所述一种基于异质图神经网络的股票价格波动预测方法,其特征在于:所述步骤s2具体包括下列子步骤:s2.1,历史价格新闻文本和新闻情感时序嵌入生成:将股票在交易日区间为[t-t,t)的历史价格特征输入时序融合编码器,输出历史价格时序嵌入通过类似的时序融合编码器实现新闻文本和新闻情感时序嵌入的生成;s2.2,生成时序邻接矩阵具体包括:将交易日区间为[t-t,t)的异质图邻接矩阵输入通道加权图网络中,得到时序邻接矩阵

4.根据权利要求3所述一种基于异质图神经网络的股票价格波动预测方法,其特征在于:所述步骤s3具体包括:s3.1,指定元路径;s3.2,采用多头注意力机制聚合每个节点的元路径邻居的信息;s3.3,采用多层注意力机制聚合三个节点嵌入向量。

5.根据权利要求4所述一种基于异质图神经网络的股票价格波动预...

【专利技术属性】
技术研发人员:闫波周锦鑫宿红毅高春晓
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1