金融舆情要素抽取方法及装置制造方法及图纸

技术编号:37202610 阅读:14 留言:0更新日期:2023-04-20 22:57
本发明专利技术实施例公开了一种金融舆情要素抽取方法及装置,可用于金融领域或其他技术领域,该方法包括:通过预设的舆情编码器将金融舆情描述转化为句子级别的金融舆情描述表示;通过预设的金融专业知识编码器将金融专业知识转化为句子级别的金融专业知识描述表示;根据所述金融舆情描述表示以及所述金融专业知识描述表示确定金融舆情与金融专业知识的关联度;根据所述关联度以及所述金融舆情描述表示确定金融专业知识加权的金融舆情描述表示;将金融专业知识加权的金融舆情描述表示输入到预设的金融舆情描述

【技术实现步骤摘要】
金融舆情要素抽取方法及装置


[0001]本专利技术涉及要素抽取,具体而言,涉及一种金融舆情要素抽取方法及装置。

技术介绍

[0002]随着信息技术的快速发展,互联网已经成为人们传播和获取各种信息的重要手段。鉴于网络发展速度的突飞猛进及网络舆情存在的匿名性、易传播等特点,对舆情中事件要素准确抽取尤为必要。事件抽取是舆情监控领域和金融领域的重要任务之一,“事件”在金融领域是投资分析、资产管理的重要决策,事件抽取是进行图谱推理、事件分析的必要过程,而事件要素抽取是事件抽取任务中的首要环节。
[0003]目前大多采用文本分类的思想处理金融舆情要素抽取任务,将其转换为多标签分类任务,以识别舆情事件中多种关键要素。通过对大量真实金融舆情事件的分析发现,金融舆情事件要素通常与银行专业知识有紧密的联系,但现有方法经常忽略银行专业知识的相关信息,导致舆情要素抽取不够准确。
[0004]在现实的金融舆情监测中,金融知识描述部分是完整舆情事件的重要组成,其不同描述将影响舆情事件的严重程度。相关监测人员在审查舆情事件时,一般都以银行专业知识为指导,寻找可以决定判断结果的关键要素句。显然,金融舆情事件要素抽取与银行专业知识有着密切的联系,而传统的要素抽取办法往往忽略这一关键信息。因此,如何基于银行专业知识进行金融舆情事件要素抽取,以提高金融舆情要素抽取的准确性,是本领域急需解决的技术问题。

技术实现思路

[0005]本专利技术为了解决上述
技术介绍
中的至少一个技术问题,提出了一种金融舆情要素抽取方法及装置。/>[0006]为了实现上述目的,根据本专利技术的一个方面,提供了一种金融舆情要素抽取方法,该方法包括:
[0007]通过预设的舆情编码器将金融舆情描述转化为句子级别的金融舆情描述表示;
[0008]通过预设的金融专业知识编码器将金融专业知识转化为句子级别的金融专业知识描述表示;
[0009]根据所述金融舆情描述表示以及所述金融专业知识描述表示确定金融舆情与金融专业知识的关联度;
[0010]根据所述关联度以及所述金融舆情描述表示确定金融专业知识加权的金融舆情描述表示;
[0011]将金融专业知识加权的金融舆情描述表示输入到预设的金融舆情描述

要素预测器中,得到所述金融舆情描述

要素预测器输出的要素。
[0012]为了实现上述目的,根据本专利技术的另一方面,提供了一种金融舆情要素抽取装置,该装置包括:
[0013]金融舆情描述表示生成单元,用于通过预设的舆情编码器将金融舆情描述转化为句子级别的金融舆情描述表示;
[0014]金融专业知识描述表示生成单元,用于通过预设的金融专业知识编码器将金融专业知识转化为句子级别的金融专业知识描述表示;
[0015]关联度计算单元,用于根据所述金融舆情描述表示以及所述金融专业知识描述表示确定金融舆情与金融专业知识的关联度;
[0016]金融专业知识加权的金融舆情描述表示确定单元,用于根据所述关联度以及所述金融舆情描述表示确定金融专业知识加权的金融舆情描述表示;
[0017]要素提取单元,用于将金融专业知识加权的金融舆情描述表示输入到预设的金融舆情描述

要素预测器中,得到所述金融舆情描述

要素预测器输出的要素。
[0018]为了实现上述目的,根据本专利技术的另一方面,还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述金融舆情要素抽取方法的步骤。
[0019]为了实现上述目的,根据本专利技术的另一方面,还提供了一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现上述金融舆情要素抽取方法的步骤。
[0020]为了实现上述目的,根据本专利技术的另一方面,还提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述金融舆情要素抽取方法的步骤。
[0021]本专利技术的有益效果为:
[0022]本专利技术实施例根据金融舆情描述表示以及金融专业知识描述表示确定金融舆情与金融专业知识的关联度,然后根据所述关联度以及所述金融舆情描述表示确定金融专业知识加权的金融舆情描述表示,最后将金融专业知识加权的金融舆情描述表示输入到预设的金融舆情描述

要素预测器中,得到所述金融舆情描述

要素预测器输出的要素,本专利技术将金融专业知识作为金融舆情貌似与真实要素的“桥梁”,在金融舆情要素抽取时结合了金融专业知识,有助于提高金融舆情要素抽取的准确性。
附图说明
[0023]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
[0024]图1是本专利技术实施例金融舆情要素抽取方法的第一流程图;
[0025]图2是本专利技术实施例金融舆情要素抽取方法的第二流程图;
[0026]图3是本专利技术实施例金融舆情要素抽取方法的第三流程图;
[0027]图4是本专利技术实施例金融舆情要素抽取方法的第四流程图;
[0028]图5是本专利技术实施例金融舆情要素抽取方法的第五流程图;
[0029]图6是本专利技术的模型示意图;
[0030]图7是本专利技术注意力机制序列编码器示意图;
[0031]图8是本专利技术实施例金融舆情要素抽取装置的结构框图;
[0032]图9是本专利技术实施例计算机设备示意图。
具体实施方式
[0033]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0034]本领域内的技术人员应明白,本专利技术的实施例可提供为方法、系统、或计算机程序产品。因此,本专利技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本专利技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD

ROM、光学存储器等)上实施的计算机程序产品的形式。
[0035]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0036]需要说明本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种金融舆情要素抽取方法,其特征在于,包括:通过预设的舆情编码器将金融舆情描述转化为句子级别的金融舆情描述表示;通过预设的金融专业知识编码器将金融专业知识转化为句子级别的金融专业知识描述表示;根据所述金融舆情描述表示以及所述金融专业知识描述表示确定金融舆情与金融专业知识的关联度;根据所述关联度以及所述金融舆情描述表示确定金融专业知识加权的金融舆情描述表示;将金融专业知识加权的金融舆情描述表示输入到预设的金融舆情描述

要素预测器中,得到所述金融舆情描述

要素预测器输出的要素。2.根据权利要求1所述的金融舆情要素抽取方法,其特征在于,所述根据所述金融舆情描述表示以及所述金融专业知识描述表示确定金融舆情与金融专业知识的关联度,具体包括:将所述金融专业知识描述表示中的每个句子输入到预设的金融专业知识

要素预测器中,得到每个句子各自对应的要素,进而根据每个句子各自对应的要素生成金融专业知识要素表示;计算所述金融舆情描述表示中的每一项与所述金融专业知识要素表示中的每一项的关联度,得到第一关联度矩阵。3.根据权利要求2所述的金融舆情要素抽取方法,其特征在于,还包括:将所述第一关联度矩阵输入到多层感知机中通过ReLU激活函数对所述第一关联度矩阵中的各行进行处理得到第一参数;对所述第一参数进行最大池化处理,得到第二参数;根据所述第二参数确定第二关联度矩阵。4.根据权利要求1所述的金融舆情要素抽取方法,其特征在于,所述根据所述金融舆情描述表示以及所述金融专业知识描述表示确定金融舆情与金融专业知识的关联度,具体包括:计算所述金融舆情描述表示中的每一项与所述金融专业知识描述表示中的每一项的关联度,得到第一关联度矩阵。5.根据权利要求1所述的金融舆情要素抽取方法,其特征在于,所述通过预设的舆情编码器将金融舆情描述转化为句子级别的金融舆情描述表示,具体包括:将所述金融舆情描述的词向量输入到双向门控循环单元中,得到词语隐层表示;根据所述词语隐层表示计算注意力值;根据所述词语隐层表示以及所述注意力值计算出句子级别的金融舆情描述表示。6.根据权利要求1所述的金融舆情要素抽取方法,其特征在于,所述通过预设的金融专业知识编码器将金融专业知识转化为句子级别的金融专业知识描述表示,具体包括:将所述金融专业知识的词向量输入到双向门控循环单元中,得到词语隐层表示;根据所述词语隐层表示计算...

【专利技术属性】
技术研发人员:王冲吴珂田超
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1