【技术实现步骤摘要】
一种基于推特和历史股价信息的股价趋势预测方法及系统
[0001]本专利技术属于人工智能
,涉及一种基于推特信息和历史股价的股票趋势预测方法及系统。
技术介绍
[0002]已有研究表明,社交平台上大众的评论与发言反映了大众对股市的看法,一定程度上反映出投资者的决策倾向。社交平台用户可以在各大社交平台随意地发表自己的意见与看法,其中最具代表性的平台就是推特。2020年4月推特的季度报表显示推特每日活跃用户量为1.26亿。因此在数目庞大的公共信息中,推特数据扮演了重要的角色,其囊括了许多有价值的信息。
[0003]而近年来,已有许多研究者将大众情感倾向作为预测股价走势预测任务的输入特征。现有的机器学习方法能够获取社交平台文本数据中的语义及情感信息,通过将推特上的大众评论信息纳入股市市场波动因素将会对投资者的投资决策和完善市场建设等方面具有理论和现实意义。目前根据推特或新闻文本进行股价走势预测的方法基本将文本用情感分析的方法为每天的舆论进行标注,也就是把不同的舆论文本独立来看,忽略了其内在联系,比如推特独有的社交平台的 ...
【技术保护点】
【技术特征摘要】
1.一种基于推特和历史股价信息的股票趋势预测方法,其特征在于,所述方法包括以下步骤:步骤(1)、收集目标股票相关的推特数据和历史股价信息,根据价格数据设置股票涨跌标签,并进行初步的数据处理;步骤(2)、利用改进的TF
‑
IDF算法为分词后的推特文本提取关键词并打分;步骤(3)、利用提取的关键词和推特之间的交互关系构建推特节点关系图并利用Node2vec将节点图中的推特映射到低维空间向量,获得与目标股票相关的推特嵌入向量;步骤(4)、通过BERT提取推特中的情感因素,并根据表达的情感强弱为每条文本分配相应的分值;步骤(5)、将步骤(4)获得的推特情感得分和步骤(3)中提取得到的推特嵌入向量以及步骤(1)中获得的股票涨跌标签一起投入深度学习模型中进行训练测试,预测股价。2.根据权利要求1所述的股票趋势预测方法,其特征在于,所述步骤(1)的具体步骤包括:步骤(11)、选定目标股票及待研究的时间区域,获取目标股票在这段时间中的代码、具体日期、开盘价、收盘价、最高价、最低价、成交量;将目标时间段内目标股票的价格数据计算股票的上涨或下跌变化趋势设置为标签;步骤(12)、选定目标股票的检索关键词,利用推特官方的标签、关键词和推特间回复关系收集与股票相关的推特数据;步骤(13)、对步骤(11)和步骤(12)获得的数据进行分词和名词短语提取。3.根据权利要求1所述的股票趋势预测方法,其特征在于,所述步骤(2)的具体步骤包括:利用改进的TF
‑
IDF算法为每条推特提取关键词并计算其重要性,将tnidf
e,j
记作推特关键词e在所处推特文本t
j
中的得分,T为选用的推特的总量,那么其中分母部分反映了包含关键词e的推特的数量;所述提取的关键词包括形容词和名词;所述j表示推特文本序列号,n
e,j
表示第j个推特中关键词e的个数,t
j
表示第j个推特文本的内容。4.根据权利要求3所述的股票趋势预测方法,其特征在于,所述改进的TF
‑
IDF统计方法用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度;所述字词的重要性随着它在文件或语料库中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降;与传统的TF
‑
IDF算法相比,所述改进的TF
‑
IDF算法将式子分子中的文本中包含的词汇频度改成了文本中包含的词汇个数。5.根据权利要求1所述的股票趋势预测方法,其特征在于,所述步骤(3)的具体步骤包括:步骤(31)、通过步骤(2)得到推特的关键词合集E和对应的得分W,再联合推特合集T构建推特节点关系图G=(T,E,W),将推特节点和其中包含的关键词节点分别进行连接,并对连接的边赋予对应的得分;步骤(32)、在推特节点图中同...
【专利技术属性】
技术研发人员:倪茴茴,王书婷,程鹏,
申请(专利权)人:君烁上海信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。