基于云平台的金融文本核查分析系统技术方案

技术编号:33275328 阅读:36 留言:0更新日期:2022-04-30 23:33
本发明专利技术公开了基于云平台的金融文本核查分析系统,涉及金融文本核查技术领域,解决了现有技术中用户无法在海量的金融文本内提取有价值的信息的技术问题,根据金融文本的特征初选,提高了金融文本分析的准确性,通过特征初选将无关文本进行筛除,提高了金融文本的特征核查的工作效率以及可靠性;在初特征文本生成后进行特征精选,提高了金融文本的特征选择力度,提高了实时特征核查的依据性,降低了金融文本特征选择异常的风险;通过比对获取金融文本的核查分析结果,从而判定当前金融文本是否存在有价值信息,此外能够将存在价值信息的金融文本进行价值信息提取,节省了用户的参考时间,降低了金融文本无价值信息对应用户的影响。响。响。

【技术实现步骤摘要】
基于云平台的金融文本核查分析系统


[0001]本专利技术涉及金融文本核查
,具体为基于云平台的金融文本核查分析系统。

技术介绍

[0002]金融文档是一种包含大量非结构化数据的文本,大多数金融文档核查工作者都在纯手工地做重复且低技术含量的文档核查工作,工作任务非常繁重;因此,随着互联网普及以及随着网络信息的猛增,如何快速、准确的为用户提供其关心的金融信息成为人们关心的话题。
[0003]但是在现有技术中,用户无法在海量的金融文本内提取有价值的信息,导致金融文本参考的投入时间巨大且效率低下;同时无法保证用户在金融文本参考能够做出准确的操作,使得金融文本参考的可靠性以及准确性无法保证。
[0004]针对上述的技术缺陷,现提出一种解决方案。

技术实现思路

[0005]本专利技术的目的就在于为了解决上述提出的问题,而提出基于云平台的金融文本核查分析系统,对应用户参考文本进行有效性分析,判断用户对应参考文本是否能够符合参考标准,从而提高了用户参考的可靠性,同时对实时特征核查分析进行检验,能够分析特征核查分析的准确性,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于云平台的金融文本核查分析系统,其特征在于,包括:金融样本集合获取单元,用于根据当前时间段的金融行业内特征词汇进行获取;并将获取的金融样本集合与对应的样本效应集合发送至实时特征核查分析单元;特征词汇为用户进行金融股票选择的参考值;实时文本特征初选单元,用于将当前金融文本进行特征初选,并根据特征初选获取到初特征文本;实时文本特征精选单元,用于将特征初选生成的初特征文本进行特征精选,并根据特征精选获取到精选特征文本;将精选特征文本发送至实时特征核查分析单元;实时特征核查分析单元,用于将金融样本集合和精选特征文本进行比对通过比对获取核查样本集合,并将核查样本集合内子集进行重要性排序,并将完成排序的核查样本集合作为用户参考文本;有效性分析单元,用于将对应用户参考文本进行有效性分析,通过有效性分析生成有效性分析合格信号和效性分析不合格信号,并将其发送至实时特征核查分析单元;文本情感分析单元,用于将用户参考文本进行情感分析,通过情感分析将用户参考文本划分为负影响文本和正影响文本;用户根据负影响文本和正影响文本的分类进行选择性金融文本查阅。2.根据权利要求1所述的基于云平台的金融文本核查分析系统,其特征在于,金融样本集合获取单元的运行过程如下:根据当前时间段的金融行业内特征词汇进行获取,在完成金融样本集合构建后,根据金融样本集合对应构建样本效应集合,提取金融样本集合内的特征子集,并将特征子集进行分析,获取到实时特征子集出现时用户执行的股票操作以及用户持有股票的收益,并将实时特征子集出现时用户执行的股票操作以及用户持有股票的收益进行分析;若实时特征子集出现时用户执行的股票操作为停止持有,或者用户持有股票的收益为减少趋势,则将对应实时特征子集判定为负效应,并将对应实时特征子集在样本效应集合内的对应子集标记为0;若实时特征子集出现时用户执行的股票操作为继续持有,且用户持有股票的收益为增长趋势,则将对应实时特征子集判定为正效应,并将对应实时特征子集在样本效应集合内的对应子集标记为1;将金融样本集合内所有子集进行分析构建样本效应集合,且金融样本集合与样本效应集合的子集位置一一对应;将完成构建的金融样本集合与对应的样本效应集合一同发送至实时特征核查分析单元。3.根据权利要求1所述的基于云平台的金融文本核查分析系统,其特征在于,实时文本特征初选单元的运行过程如下:将待初选的金融文本进行特征初选,将待初选的金融文本内语气词进行删除;完成语气词删除后将待初选金融文本按照文本内的断句进行文本语句提取,完成文本语句提取后将各个文本语句内存在的词语进行分析,若对应文本语句内存在金融行业术语,则将对应文本语句标记为存特征语句,并根据存特征语句汇总构建成初特征文本,且初特征文本内存特征语句断句方式与待初选金融文本断句方式一致;若对应文本语句内不存在金融行业术语,则将对应文本语句标记为无特征语句,并根据无特征语句汇总构建成无特征文本;将初特征文本发送至实时文本特征精选单元。4.根据权利要求1所述的基于云平台的金融文本核查分析系统,其特征在于,实时文本特征精选单元的运行过程如下:
将初特征文本内各个存特征语句进行分析,将存特征语句内存在的金融行业术语进行提取,并将其标记为初特征词;获取到金融行业内用户将初特征词作为参考值的频率以及金融行业内初特征词出现后用户进行股票操作的频率:若金融行业内用户将初特征词作为参考值的频率超过作参考频率阈值,且金融行业内初特征词出现后用户进行股票操作的频率超过操作频率阈值,则将对应初特征词标记为精特征词,精特征词对应的存特征语句标记为精选特征语句;若金融行业内用户将初特征词作为参考值的频率未超过作参考频率阈值,或者金融行业内初特征词出现后用户进行股...

【专利技术属性】
技术研发人员:陈凌程何月顺黄杰亭
申请(专利权)人:东华理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1