一种综合金融服务系统技术方案

技术编号:38349722 阅读:26 留言:0更新日期:2023-08-02 09:29
本发明专利技术涉及金融系统领域,且公开了一种综合金融服务系统,包括知识查询模块、信息抽取模块以及前端交互模块,所述知识查询模块包括数据获取单元、数据存储单元以及查询业务单元,所述信息抽取模块主要负责信息抽取模型的建立和信息抽取功能的逻辑实现,所述信息抽取模块包括数据抽取单元以及金融公告抽取单元,通过设有数据抽取单元以及金融公告抽取单元,有利于通过构建金融领域知识图谱来对上市公司金融公告进行信息抽取,能够有效减少监管机构在信息审查时消耗的人力成本,从而更高效地对上市公司进行监管,同时能够通过结构化的公司信息形成对于公司现状的全面认知,从而在投资时能快速做出正确的决策。资时能快速做出正确的决策。资时能快速做出正确的决策。

【技术实现步骤摘要】
一种综合金融服务系统


[0001]本专利技术涉及金融系统领域,更具体地涉及一种综合金融服务系统。

技术介绍

[0002]在中国经济飞速发展和社会不断进步的背景下,伴随着计算机行业的兴起,社会中的各个行业对于信息和知识的需求也越来越多,在各个垂直行业中,金融领域对于信息的需要尤为明显,金融从业人员可以从互联网上获取大量金融领域的相关信息,然而来自互联网的大量数据多源异质,需要从业人员仔细甄别,并且金融领域的大部分信息是通过公司公告的形式进行发布,需要从文本公告中准确而及时的得到关键信息,然后随着经济的发展,上市公司的数量不断增多,专业人员需要消耗大量精力阅读文档,现有的综合金融服务系统大多未采用知识图谱。
[0003]并且现有的综合金融服务系统大多无法进行信息抽取,信息抽取是知识图谱构建的基础,为整个知识图谱提供数据支撑,信息抽取是将文本中的信息抽取出来,从非结构化数据得到一种机构化数据,因此现有的综合金融服务系统,造成了人力资源与时间资源的严重浪费。

技术实现思路

[0004]为了克服现有技术的上述缺陷,本专利技术提供了本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种综合金融服务系统,包括知识查询模块、信息抽取模块以及前端交互模块,其特征在于:所述知识查询模块包括数据获取单元、数据存储单元以及查询业务单元,所述信息抽取模块主要负责信息抽取模型的建立和信息抽取功能的逻辑实现,所述信息抽取模块包括数据抽取单元以及金融公告抽取单元,所述数据抽取单元负责从互联网中抽取出金融信息,将数据组织成构建金融知识图谱需要的形式,包括以下步骤:步骤S01:首先进行数据源选取;步骤S02:对页面类数据与接口类数据进行分别抽取;步骤S03:对两者抽取到的信息分别进行数据清洗;步骤S04:利用规则化的手段进行数据清洗和融合,去掉信息不一致的数据,形成一个可靠完整的信息库;所述金融公告抽取单元包括数据预处理子单元、事件句定位子单元以及事件抽取子单元,所述数据预处理子单元通过文本分类模型与命名实体识别模型对上市公司发布的公告文本信息进行预处理,从大量文本类数据中筛选出含有丰富知识信息的公告,所述数据预处理子单元对数据进行预处理后,筛选出特定的几个类别的公告数据,将其传输至事件句定位子单元,所述事件句定位子单元接收数据预处理子单元传输的公告数据后,对公告正文中专业的表述性语言进行迅速准确的定位,定位到中心事件句,选取实体信息、触发词信息、数量词信息、与标题相似度四个特征作为句子分类的特征,所述实体信息特征计算公式为:S
entity
(S
i
)=C(S
i
),其中,C(S
i
)表示句子S
i
当中所包含的组织机构名和人名的数量,所述触发词信息特征计算公式为:所述数量词信息特征计算公式为:S
number
(S
i
)=count(S
i
),其中,count(S
i
)表示句子S
i
当中所包含的表征数量和日期词汇的数量,所述标题相似度特征计算公式为:其中,w
si
表示句向量,S
c
os是两个句子的余弦相似度,所述公告正文中语句Sk的特征计算公式为上述四个特征指标的线性组合,即:S(S
k
)=∑w
i
s
i
(S

【专利技术属性】
技术研发人员:林娜赵小静苏抒慧
申请(专利权)人:南方电网数字企业科技广东有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1