当前位置: 首页 > 专利查询>复旦大学专利>正文

基于多层次对比学习的金融新闻主题建模方法技术

技术编号:46224818 阅读:9 留言:0更新日期:2025-08-26 19:26
本发明专利技术提供一种基于多层次对比学习的金融新闻主题建模方法,将对比学习微调任务应用于金融新闻的主题建模方法,采用多层次对比学习的方法,通过对预训练语言模型生成的向量表示进行调整,使得生成的文本向量表示更适用于主题建模任务,并且,由于该方法通过社区发现算法进行主题建模,因此不需要预先指定主题数量,也不需要预先设置繁多的超参数,应用更为方便,也避免了超参数的设置对主题建模结果的影响。经过发明专利技术人的实验测试,与现有的主题建模方法相比,本发明专利技术提供的方法在应用于金融新闻文本数据集时,建模得到的主题在主题一致性和主题多样性这两项指标上均有相当程度的提升。

【技术实现步骤摘要】

本专利技术属于文本主题挖掘,具体涉及一种基于多层次对比学习的金融新闻主题建模方法


技术介绍

1、随着互联网及经济的发展,人们能够在网络上获取大量金融相关的新闻信息,而这些金融新闻中的部分内容对特定金融领域投资者或者相关领域研究者都是十分重要的信息。但由于金融新闻数量过于庞大,金融领域投资者或者相关领域研究者不可能能够浏览全部的金融新闻,并且这些人群往往对于特定领域的新闻更加感兴趣,这个领域往往要小于新闻平台提供的板块名称;同时还有一些金融领域投资者或者相关领域研究者感兴趣的新闻内容针对于某一事件,该事件的新闻在新闻平台中可能同时在多个板块出现。主题建模方法能够为金融新闻以不同的颗粒度划分出主题,主题即是某一细分领域新闻的集合或是某一事件新闻的集合,帮助金融领域投资者或者相关领域研究者更好地了解某一时间段发生的金融事件。

2、目前学界和工业界得到最广泛认可的经典主题模型是2003年提出的lda主题模型。lda主题模型是基于概率的生成式主题模型,其假设文本的生成过程是先从主题分布中依照概率选取某一主题,之后从主题词语分布中依照概率选取出词语,逐个本文档来自技高网...

【技术保护点】

1.一种基于多层次对比学习的金融新闻主题建模方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多层次对比学习的金融新闻主题建模方法,其特征在于:

3.根据权利要求1所述的基于多层次对比学习的金融新闻主题建模方法,其特征在于:

4.根据权利要求3所述的基于多层次对比学习的金融新闻主题建模方法,其特征在于:

5.根据权利要求4所述的基于多层次对比学习的金融新闻主题建模方法,其特征在于:

6.根据权利要求1所述的基于多层次对比学习的金融新闻主题建模方法,其特征在于:

7.根据权利要求6所述的基于多层次对比学习的...

【技术特征摘要】

1.一种基于多层次对比学习的金融新闻主题建模方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多层次对比学习的金融新闻主题建模方法,其特征在于:

3.根据权利要求1所述的基于多层次对比学习的金融新闻主题建模方法,其特征在于:

4.根据权利要求3所述的基于多层次对比学习的金融新闻主题建模方法,其特征在于:

5.根据权利要求4所述的基于多层次对比学习的...

【专利技术属性】
技术研发人员:曾剑平胡世嘉李智鑫吴杰
申请(专利权)人:复旦大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1