基于多元因素融合的深层逻辑推理金融文本分析方法及系统技术方案

技术编号：29615248 阅读：16 留言：0更新日期：2021-08-10 18:30

本发明专利技术公开了一种基于多元因素融合的深层逻辑推理金融文本分析方法及系统，该方法基于多维数据融合的深层逻辑推理模型，该模型通过三种不同的机制——堆叠循环神经网络、插槽记忆模块和交叉注意力模块来分别实现语义解析、多因素融合、深层逻辑推理。通过这三个模块，一个金融文本和多个外部特征在进入到本方法提出的模型后，会依次进行文本编码、记忆存储、信息交互理解，通过三个流程来一步步提取蕴含在文本中的深层信息，从而做出一个合理的推断。

全部详细技术资料下载

【技术实现步骤摘要】
基于多元因素融合的深层逻辑推理金融文本分析方法及系统
本专利技术涉及金融文本分析，特别是涉及一种基于多元因素融合的深层逻辑推理金融文本分析方法及系统。
技术介绍
在金融文本分析方面，主流技术已经从以往的特征提取为主的方法过渡到以神经网络驱动为主的方法，传统的特征，如情感词计数、关键段匹配、文本流重构等，这些方法在构造过程中需要耗费过多人力，而且针对不同领域的文本需要重新构造特征，迁移性不足。以神经网络为主的方法只需要在特定的数据上面进行训练，消耗计算力资源就可以很好的完成特定场景下的金融文本分析任务，所以神经网络为主的方法是近几年来的主流技术。目前在金融文本方面的应用和研究上，更多的工作关注于神经网络的选择层面，这类方法关注点在于利用神经网络对文本进行表示学习，通过设计神经网络来学习文本的向量化表示，期待探索出能更好实现文本建模的神经网络，但是这些方法存在以下两个问题：1)这些方法关注点在于文本表层的表示学习，忽视了在文本语义上面的推理。然而金融文本分析需要帮助金融业务本身，所以在搭建神经网络模型的时候，更应该关注所设计算法在语义理解和逻辑推理上面的能力。2)金融现象的产生，都是由多个外部因素的结合影响发挥作用的，利用单一的因素进行推断容易陷入局部最优，而现有的工作更多关注于文本本身，利用单一的文本因素进行推理，对于一些潜在外部的因素没有给予足够的关注，使得模型在做结论推理的时候，会形成一定的片面性，对于一些夹杂着噪音的数据，也会缺乏足够的泛化性。
技术实现思路
为了弥补上...

【技术保护点】
1.一种基于多元因素融合的深层逻辑推理金融文本分析方法，其特征在于包括如下步骤：/nS1、将输入的文本转换为语义向量表示；/nS2、通过一个编码模块来对文本进行语义解析；/nS3、将外部因素转换为记忆向量；/nS4、采用交叉注意力模块计算文本向量与外部因素的交叉表示形式，并将其重新表达为一个更高层的语义特征，实现语义的抽象化理解。/n

【技术特征摘要】
1.一种基于多元因素融合的深层逻辑推理金融文本分析方法，其特征在于包括如下步骤：
S1、将输入的文本转换为语义向量表示；
S2、通过一个编码模块来对文本进行语义解析；
S3、将外部因素转换为记忆向量；
S4、采用交叉注意力模块计算文本向量与外部因素的交叉表示形式，并将其重新表达为一个更高层的语义特征，实现语义的抽象化理解。

2.如权利要求1所述的基于多元因素融合的深层逻辑推理金融文本分析方法，其特征在于所述步骤S1包括：将输入的文本先转换为词嵌入向量。

3.如权利要求2所述的基于多元因素融合的深层逻辑推理金融文本分析方法，其特征在于，使用双重嵌入向量作为初始的所述词嵌入向量；所述双重嵌入向量包含两种类型：通用词嵌入向量和特定领域词嵌入向量，它们是根据词嵌入向量在指定领域内语料库进行训练来区分的。

4.如权利要求3所述的基于多元因素融合的深层逻辑推理金融文本分析方法，其特征在于，通用词嵌入向量根据互联网文本数据进行训练，特定领域词嵌入向量利用本方法构建的金融文本数据集进行训练，将两个向量按照指定维度拼接在一起。

5.如权利要求4所述的基于多元因素融合的深层逻辑推理金融文本分析方法，其特征在于，训练时，按照批次来读取数据，对于同一个批次里的数据，对各个文本的长度进行统一。

6.如权利要求1所述的基于多元因素融合的深层逻辑推理金融文本分析方法，其特征在于，步骤S2中，通过一个编码模块来对文本进行语义解析,所述编...

【专利技术属性】
技术研发人员：李鑫，王智，
申请(专利权)人：清华大学深圳国际研究生院，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人