System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于大语言模型融合领域知识的金融时序预测方法技术_技高网

一种基于大语言模型融合领域知识的金融时序预测方法技术

技术编号:41346181 阅读:4 留言:0更新日期:2024-05-20 10:01
本发明专利技术公开了一种基于大语言模型融合领域知识的金融时序预测方法。其中,所述方法包括:包括:S1、提取非结构化文本数据中与金融相关的情绪指标;S2、对提取到的情绪指标进行权重分配;S3、利用情绪指标及权重进行金融时序预测。本发明专利技术旨将LLM与深度学习结合,应用于金融时间序列预测任务中,利用提示词模板充分融入金融领域知识,从金融时序预测所需的多源数据中提取最重要的信息与特征,提高预测模型的准确性。本发明专利技术所解决的技术问题主要包括:(1)充分利用输入LLM的提示词模板,使其有效承载金融领域信息与知识;(2)利用提示词模板和LLM提取金融时序预测相关的多源非结构化文本数据特征;(3)利用提示词模板和LLM,提取金融时序结构化数据的特征。

【技术实现步骤摘要】

本专利技术涉及时序预测,尤其涉及一种基于大语言模型融合领域知识的金融时序预测方法


技术介绍

1、金融市场的波动受多方面因素的影响,包括但不限于区域因素、新闻舆论和交易数量等多方面因素。预测金融时间序列(如股票、期货、贵金属、汇率等)波动对于金融领域的专家来说是一个重要问题,他们需要找到准确和有效的预测工具或方法,从而为投资者、决策者、监管部门提供更准确和可靠的市场预测和决策依据,有预见性地捕捉金融市场的异常波动,从而降低金融市场风险。

2、金融时间序列预测经历了四个阶段和范式:传统的统计学方法、传统机器学习、深度学习、大模型与提示学习。其中,机器学习模型(如logistic回归、支持向量机)能够克服传统基于统计学的时间序列预测的局限性,一定程度上提高股价预测的准确性,但效果仍有很大提升空间。近十年来,随着人工神经网络理论的完善与不断进步,深度学习以其强大的处理大数据和学习输入特征与预测目标之间非线性关系的能力,在金融市场波动预测任务上表现出了优于其他机器学习模型的性能,逐渐成为金融时间序列预测的常用方法。在最近的前沿研究中,大型语言模型(llm)的快速发展引发了有关其提高量化金融交易策略收益潜力的广泛关注与讨论,有少数学者尝试使用提示学习与llm辅助股价预测,但也仅仅是用llm针对新闻等文本的情绪生成“利好”或“利空”这样的结论,没有将金融领域知识(如文本与特定金融实体的相关性、文本的金融前瞻性等)充分融入llm的提示学习过程中,因此仍有很大的提升空间。主要存在的共性问题有:(1)提示词在指导llm响应特定任务和查询中至关重要,现有研究没有设计有效的提示模板有效承载金融领域信息与知识,辅助llm一次性提取足够的重要信息与特征,包括但不限于情绪指标、公司信息以及公司关联度等。(2)现有方法在使用llm进行预测时仅使用单一且非结构化数据源(如新闻、论坛、公司公告、社交媒体等文本数据),没有尝试将多源非结构化数据结合使用预测金融时序。(3)由于llm主要面向非结构化的文本数据,现有方法也仅使用llm从非结构化数据中提取特征并预测,没有尝试使用llm从结构化数据(结构化表格数据,如股票价格、交易量等)中提取特征并预测。


技术实现思路

1、有鉴于此,本专利技术的目的在于提出一种基于大语言模型融合领域知识的金融时序预测方法,能够至少解决一个
技术介绍
中心提及的技术问题。

2、根据本专利技术的一个方面,提供一种基于大语言模型融合领域知识的金融时序预测方法,包括:

3、s1、提取非结构化文本数据中与金融相关的情绪指标,具体地:

4、将非结构化文本数据转化为词向量后嵌入若干第一提示词模板;将嵌入词向量的若干第一提示词模板输入一大语言模型,大语言模型输出对应该非结构化文本数据的若干特征;将输出的特征作为情绪指标;

5、s2、对提取到的情绪指标进行权重分配,具体地:

6、根据非结构化文本数据对金融时序影响的程度大小来制定,和/或,根据实体与非结构化文本数据的关联程度和内容是否具有前瞻性来制定;

7、s3、利用情绪指标及权重进行金融时序预测。

8、在上述技术方案中,本实施例旨将llm与深度学习结合,应用于金融时间序列预测任务中,利用提示词模板充分融入金融领域知识,从金融时序预测所需的多源数据中提取最重要的信息与特征,提高预测模型的准确性。本专利技术所解决的技术问题主要包括:(1)充分利用输入llm的提示词模板,使其有效承载金融领域信息与知识;(2)利用提示词模板和llm提取金融时序预测相关的多源非结构化文本数据特征;(3)利用提示词模板和llm,提取金融时序结构化数据的特征。需要注意的是,关于根据非结构化文本数据对金融时序影响的程度大小来制定。在金融时序预测中,不同类型的文本数据对模型的影响可能有所不同。例如非结构化数据由财经新闻、公司公告和社交媒体三部分组成。财经新闻通常包含有关市场动态、经济趋势、政策变化等方面的重要信息。因此它的影响程度很高,公司公告包含有关公司内部运营、财务状况、业务计划等信息。虽然公司公告对于相关公司的股价有直接的影响,但其波及范围相对有限,影响程度中等。社交媒体包含市场情绪和投资者情感,但这些信息为主观的,受到噪声的影响。相比于财经新闻和公司公告,社交媒体的信息更容易受到个体投资者情感的波动,因此其影响可能相对较小,可以分配一下权重财经新闻(0.5)、公司公告(0.3)、社交媒体(0.2)。需要注意的是,该种权重的设定本领域技术人员可根据实际需求设定,此处不再展开说明。该设置的目的在于:1、组合多种文本数据的情绪指标,通过权重的设计,可以充分发挥不同数据源的优势,实现更全面的信息融合,提高预测模型的性能。2、不同类型的文本数据受到不同程度的噪声干扰。通过赋予不同权重,可以降低对于噪声较大的数据的关注度,从而提高模型的鲁棒性。在一些实施例中,将非结构化文本数据转化为词向量,具体地:

9、采用word2vec模型将非结构化文本数据中的词语映射为一个固定长度的实数向量。

10、在上述技术方案中,word2vec能够捕捉到词语之间的语义关联性,这对于理解金融领域中的复杂信息非常有帮助。虽然词袋模型和tf-idf在某些任务上可能表现良好,但它们忽略了词汇之间的语义关系和上下文信息。在金融领域,这些信息对于理解市场动态和进行预测非常关键,因此选择word2vec更有利于捕捉这些复杂的语义特征。

11、在一些实施例中,所述若干第一提示词模板用于识别命名实体。

12、在上述技术方案中,第一提示词模板起到命名实体识别的作用,简化训练新模型提取实体、实体之间联系的步骤。进而实现不需要重新训练情绪分类器,直接使用大语言模型即可从文本数据中提取情绪倾向。大语言模型针对自然语言处理任务而设计,提示词模板能充分利用大语言模型对自然语言的理解这一特征,判断文本数据本身是否具有前瞻性以及文本的关联程度。进一步的,根据提示词模板大语言模型输出的结果是否正确可由领域专家做批注,进而对模型进行调整。

13、在一些实施例中,根据实体与非结构化文本数据的关联程度和内容是否具有前瞻性来制定具体地:

14、(1)关联程度

15、利用若干第一提示词模板建立提示词实体之间的关系;大语言模型根据输入的数据,输出0~100的影响程度分数;

16、(2)前瞻性

17、如果非结构化文本数据中提及的事件还未发生,则该文本具有前瞻性,否则不具备前瞻性;

18、如果事件已经发生,而非结构化文本数据是对事件发生后的分析产生影响,则文本具有前瞻性,否则不具备前瞻性。

19、在上述技术方案中,关于实体与非结构化文本数据的关联程度和内容是否具有前瞻性来制定。是否具有前瞻性主要从两个方面结合判断。首先从时间上,如果文本中提及的事件还未发生,则该文本具有前瞻性,否则不具备前瞻性。其次如果事件已经发生,而文本是对事件发生后分析产生什么影响等见解,则文本具有前瞻性。否则不具备本文档来自技高网...

【技术保护点】

1.一种基于大语言模型融合领域知识的金融时序预测方法,其特征在于,包括:

2.如权利要求1所述的一种基于大语言模型融合领域知识的金融时序预测方法,其特征在于,

3.如权利要求1所述的一种基于大语言模型融合领域知识的金融时序预测方法,其特征在于,

4.如权利要求1所述的一种基于大语言模型融合领域知识的金融时序预测方法,其特征在于,

5.如权利要求1所述的一种基于大语言模型融合领域知识的金融时序预测方法,其特征在于,

6.如权利要求1所述的一种基于大语言模型融合领域知识的金融时序预测方法,其特征在于,

7.如权利要求1所述的一种基于大语言模型融合领域知识的金融时序预测方法,其特征在于,

8.一种基于大语言模型融合领域知识的金融时序预测装置,其特征在于,基于权利要求1-7任一项所述的一种基于大语言模型融合领域知识的金融时序预测方法;包括依序连接的提取模块、权重模块以及预测模块;

9.一种基于大语言模型融合领域知识的金融时序预测设备,其特征在于,包括:

10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的一种基于大语言模型融合领域知识的金融时序预测方法。

...

【技术特征摘要】

1.一种基于大语言模型融合领域知识的金融时序预测方法,其特征在于,包括:

2.如权利要求1所述的一种基于大语言模型融合领域知识的金融时序预测方法,其特征在于,

3.如权利要求1所述的一种基于大语言模型融合领域知识的金融时序预测方法,其特征在于,

4.如权利要求1所述的一种基于大语言模型融合领域知识的金融时序预测方法,其特征在于,

5.如权利要求1所述的一种基于大语言模型融合领域知识的金融时序预测方法,其特征在于,

6.如权利要求1所述的一种基于大语言模型融合领域知识的金融时序预测方法,其特征在于,

【专利技术属性】
技术研发人员:陈伟思张旭刘武龙肖伟东刘斌谢奇峰
申请(专利权)人:厦门理工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1