【技术实现步骤摘要】
一种金融领域事理图谱构建方法、装置、设备及存储介质
[0001]本专利技术涉及自然语言处理领域,特别涉及一种金融领域事理图谱构建方法
、
装置
、
设备及存储介质
。
技术介绍
[0002]事理图谱是以结构化的方式描述客观世界中的事件及其关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织
、
管理和理解互联网海量信息的能力
。
在金融领域,每天产生大量金融事件,以及事件之间因果逻辑关系
。
识别金融事件的因果逻辑,构建事理图谱,有助于金融事件的影响因素探究以及因果逻辑推理,进而可对未来经济指标进行预测,并指导投资建议
。
[0003]现有技术中,定义事理图谱,大多数采用“事件1,关系,事件
2”的三元组结构,技术上主要涉及事件关系抽取和事件对齐等,但通过现有技术构建的事理图谱结构太过简单,难以满足更复杂业务场景的需求,并且没有对事件进行细粒度拆分处理,导致事件涵盖的实体信息,如公司
、
行业
、
产品
、
指标等信息无法知道,并且缺乏对抽取的知识有效的质量控制,容易导致数据噪声大,会对下游应用带来不利影响
。
技术实现思路
[0004]有鉴于此,本专利技术的目的在于提供一种金融领域事理图谱构建方法
、
装置
、
设备及存储介质,可以对事件进行细粒度操作,并基于得到的三元组构建事理图谱 ...
【技术保护点】
【技术特征摘要】
1.
一种金融领域事理图谱构建方法,其特征在于,包括:基于预训练模型对输入的金融文本数据进行编码处理,以得到与所述金融文本数据对应的若干三元组;所述若干三元组包括因事件
、
事件关系
、
果事件;基于预设实体类型对所述若干三元组中的所述因事件以及所述果事件进行细粒度实体识别,以得到与所述因事件以及所述果事件对应的事件论元;对所述事件论元进行相似度计算,并对确定的相似论元进行对齐操作,以得到对齐论元;对所述若干三元组进行筛选,并基于所述对齐论元对筛选后三元组再次进行筛选,以确定目标三元组,并基于所述目标若干三元组构建目标事理图谱
。2.
根据权利要求1所述的金融领域事理图谱构建方法,其特征在于,所述基于预训练模型对输入的金融文本数据进行编码处理,以得到与所述金融文本数据对应的若干三元组,包括:将接收的金融文本数据输入至第一预训练模型,以将所述金融文本数据转换为序列数据;将所述序列数据转换为序列数据表格,以基于所述序列数据表格确定与所述金融文本数据中对应的若干三元组
。3.
根据权利要求2所述的金融领域事理图谱构建方法,其特征在于,所述将所述序列数据转换为序列数据表格,以基于所述序列数据表格确定与所述金融文本数据中对应的若干三元组,包括:将所述序列数据转换为因事件序列数据表格
、
事件关系序列数据表格
、
果事件序列数据表格;判断所述因事件序列数据表格以及所述果事件序列数据表格中首尾索引单元格的单元格值是否为预设单元格值,以基于第一当前判断结果生成事件预测值;判断所述事件关系序列数据表格中首索引单元格的单元格值是否为预设单元格值,以基于第二当前判断结果生成关系预测值;基于预设第一
S
型生长曲线函数对所述生成事件预测值以及所述关系预测值处理,得到与所述金融文本数据中对应的若干三元组
。4.
根据权利要求1所述的金融领域事理图谱构建方法,其特征在于,所述基于预设实体类型对所述若干三元组中的所述因事件以及所述果事件进行细粒度实体识别,以得到与所述因事件以及所述果事件对应的事件论元,包括:基于第二预训练模型对所述若干三元组中的所述因事件以及所述果事件进行编码学习,以得到与所述因事件以及所述果事件对应的表征向量;通过所述表征向量生成初始预测表格,并对所述初始预测表格进行最大池化操作,以得到全局特征向量;通过所述全局特征向量生成最终预测表格,以通过预设激活函数对所述最终预测表格进行解码得到与所述因事件以及所述果事件对应的事件论元
。5.
根据权利要求1所述的金融领域事理图谱构建方法,其特征在于,所述对所述事件论元进行相似度计算,并对确定的相似论元进行对齐操作,以得到对齐论元,包括:将所述...
【专利技术属性】
技术研发人员:陈家银,吴海胖,章汗雨,
申请(专利权)人:杭州同花顺数据开发有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。