一种基于自然语言处理的金融风险预警方法技术

技术编号:35736028 阅读:38 留言:0更新日期:2022-11-26 18:38
本发明专利技术属于金融信用服务的技术高领域,公开了一种基于自然语言处理的金融风险预警方法,包括步骤一、搜集金融语料集,建立正、负面词典和金融主题词典;步骤二、搜集客户所关注的金融数据,以句子为单位,提取包含金融主题词典中词的句子,组成集合S

【技术实现步骤摘要】
一种基于自然语言处理的金融风险预警方法


[0001]本专利技术属于金融信用服务的技术高领域,具体涉及一种基于自然语言处理的金融风险预警方法。

技术介绍

[0002]我国融资融券业务从2011年才开始,可以说是一个较新的金融业务,更是一项高风险业务。对金融机构和金融客户,风险控制都是及其重要的,是金融机构首先要解决的任务,风险控制的目的就是为了防患大风险事件的发生,投资理财的风险控制,就是要为了防止理财人因为过度投资而带来的危害。所以金融管理机构要实时监控所有客户,希望实时监控系统能够在大数据背景下,通过各方面的信息,帮助他的客户找到客户投资标的潜在风险的先导信号,及时发出预警,以保持一颗理智的头脑,规避风险。
[0003]互联网上每天都会发布许多公司的公告、新闻、评论等文本信息,有正面的、负面的和中性的,于是掀起了基于自然语言的处理技术在金融风险预警中的应用,例如融资融券业务中客户信用账户动态管理中客户担保品的实时监控。目前已经产生了各种成熟并且效果非常好的结构化数据的过滤技术,但是对于文本等非结构化数据的信息过滤还有很大的困难。由于语本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于自然语言处理的金融风险预警方法,其特征在于包括以下步骤:步骤一、搜集金融语料集,建立正、负面词典W
±
=W
+
∪W

和金融主题词典W
(finterm)
;步骤二、搜集客户所关注的金融数据,以句子为单位,提取包含金融主题词典W
(finterm)
中词的句子,组成集合S
(Concern)
;步骤三、对于集合S
(Concern)
中的每一个句子,利用相似性替换法,将当中的词对应替换为正、负面词典中的正面词、负面词,计算替换后的各个句子的情感极性,然后将情感极性为负面的句子筛选出来,组成集合S
(neg)
;步骤四、利用情感波谷搜索法遍历集合S
(neg)
中的每个句子,找出处于最深情感波谷处的句子集并展示给客户,以帮助客户快速找到潜在风险,有效实施风险管控。2.根据权利要求1所述的基于自然语言处理的金融风险预警方法,其特征在于:在所述步骤一中,基于正、负面词典中的各个正面词、负面词在金融语料集出现的总频数,标注金融预料集中各个句子的极性,再计算各个正面词、负面词的极性值,从而重新划分正、负面词典中的正面词、负面词。3.根据权利要求2所述的基于自然语言处理的金融风险预警方法,其特征在于重新划分正面词、负面词的方法包括以下步骤:记所述金融语料集中所有文档的集合为所有句子的集合正面词词典负面词词典步骤Ⅰ、分别统计正面词、负面词在语料集中出现的总频次f
(posw)
、f
(negw)
,计算总频次比步骤Ⅱ、标注金融语料集中各个句子的极性分别统计正面词和负面词在句子s
i
中出现的词频总数,记为f
i(posw)
,f
i(negw)
,其中i=1,2...N
(s)
;若f
i(posw)
>f
i(negw)
·
λ,则标注句子s
i
的极性偏正面,赋予标签L
i
=0;若f
i(posw)
<f
i(negw)
·
λ,则标注句子s
i
的极性偏负面,赋予标签记L
i
=1;若f
i(posw)
=f
i(negw)
·
λ,则不对句子s
i
标注,即表明句子中性;步骤Ⅲ、利用如下方程式,计算各个正面词、负面词的极性值其中,w∈W
±
,f
(0)
(w)表示词w在所有标签为0的句子中出现的词频总和,f
(1)
(w)表示词w在所有标签为1的句子中出现的词频总和,通常负面词有:x=1,2...N1,正面词有:y=1,2...N2;步骤Ⅳ、重新划分正面词、负面词若某个正面词的极性值小于零,则将该正面词调整为负面词;若某个负面词的极性值大于零,则将该负面词调整为正面词。4.根据权利要求3所述的基于自然语言处理的金融风险预警方法,其特...

【专利技术属性】
技术研发人员:江开忠王国强
申请(专利权)人:上海工程技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1