一种动态调整的企业信用风险评估方法技术

技术编号:19512446 阅读:267 留言:0更新日期:2018-11-21 08:28
本发明专利技术公开了一种动态调整的企业信用风险评估方法,其包括:通过网络爬虫以预设的周期抓取设定的新闻采集网站上的新闻;在新闻中进行企业主体提取,标注出新闻文本中的企业主体名称;对于一定数量含有企业主体的新闻,对其进行情感标注;使用专家标注的金标数据,采用机器学习模型训练新闻情感的分类器;对于获取的未标注新闻数据,使用训练的模型进行分类;根据与一个企业主体相关的正面、负面、中性新闻数量,分别计算一个累计分值;综合新闻的数量和情感类型的分布,计算新闻舆情的总体评分值;结合财务指标和舆情指标,采用加权求和的方式计算总体信用风险评分,该评分能够基于实时的新闻进行动态更新;进行信用评分和相应信用评级的输出。

【技术实现步骤摘要】
一种动态调整的企业信用风险评估方法
本专利技术涉及数据分析和处理领域,尤其涉及一种动态调整的企业信用风险评估方法。
技术介绍
企业的信用水平是决定银行和投资机构进行贷款或投资时考虑的重要因素。然而,目前我国信用市场发展不成熟,缺乏统一的信用记录标准和客观的风险评估规范,导致很大一部分企业信用缺失。这样的市场状态,一方面严重阻碍了对诚信企业的投资行为,导致企业融资困难,成本高企不下,业务发展受阻;另一方面,也给银行和投资机构造成了沉重的不良资产负担,降低其利润和市场竞争力。建立一套公正客观的企业信用评估模型,对于合理衡量企业风险水平,创建健康的信用市场,具有重要意义。目前,在信用风险评估和金融产品定价等方面,多数机构还是采用传统的计算方式,例如在穆迪的评分公式中,影响企业信用评分的主要因素包括利息备付率(CV)、杠杆率(LV)、投资回报率(ROA)、营收稳定性(RS)、波动性调整后的杠杆率(vLV)和总资产(AT)等,并不考虑外部因素的影响,只依赖财务指标进行计算。以下为穆迪使用的基本评分公式:FR=WCVRCV+WLVRLV+WROARROA+WRSRRS+WvLVRvLV+WATRAT+WCV×ATRCV×AT类似地,大多数信用评级机构采用类似的公式,使用企业周期性公布的财务数据,计算相关财务指标,计算信用评分,并相应建立评级。此外,现有的技术方案主要包括:1、使用传统信用评分模型,定期计算企业财务指标,代入公式进行计算。该方案存在以下不足:由于财务指标更新周期较长,并存在数据延迟、不完整、不真实等各种可能的情况,导致信用评分更新缓慢,不能客观全面地反映在某个时间点的企业风险状态。对于各种突发事件无法做出及时的反映,导致可能出现的违约损失。2、在财务指标之外,考虑反映企业风险的其他因素,如和企业主体相关的舆情,主要是负面舆情。通过将舆情与企业主体关联,在信用评分和评级之外,增加影响信用风险的额外信息,供投资/贷款主体进行主观判断,全面衡量企业的风险指标。舆情等额外风险因素的引入给投资者提供了全面判断企业风险状况的可能,但因为舆情数据量非常大,而且更新迅速,对于大多数人来说无法保证及时获取完整信息,即使这些数据都能够取得,对于企业风险有多大影响,还是需要依赖投资者的主观经验判断,存在多种漏判或误判的可能。缺少量化的指标,导致此类方法缺乏客观公正性和实际中的可操作性。
技术实现思路
针对现有技术之不足,本专利技术提出了一种动态调整的企业信用风险评估方法,其包括以下步骤:步骤1:通过网络爬虫以预设的周期抓取设定的新闻采集网站上的大量新闻;步骤2:在新闻中进行企业主体提取,标注出新闻文本中的企业主体名称。步骤3:对于一定数量含有企业主体的新闻,对其进行情感标注,情感标签分为正面/中性/负面三种;对于正面和负面新闻,将其分为高/中/低三类;步骤4:使用专家标注的金标数据,采用机器学习模型训练新闻情感的分类器;步骤5:对于获取的大量未标注新闻数据,使用步骤4中训练的模型对其进行分类;步骤6:根据与一个企业主体相关的正面、负面、中性新闻数量,分别计算一个分类累计分值;步骤7:综合新闻的数量和其中情感类型的分布,计算新闻舆情的总体评分值;步骤8:结合财务指标和舆情指标,采用加权求和的方式计算总体信用风险评分,该评分能够基于实时的新闻进行动态更新;步骤9:进行信用评分和相应信用评级的输出,并根据预设规则在特定场景下对客户进行相应的提示或告警。根据一个优选实施方式,在步骤1中,设定的新闻采集网站包括:主要门户网站的财经新闻模块、专业性的金融、投资、债券、股票、衍生品相关网站,以及政策、法律、企业主管行政机构、法院、公安机关等的网站公告。根据一个优选实施方式,在步骤2中,采用深度学习模型从新闻文本中提取企业主体名称,所述深度学习模型的输入是文本序列的每个词转化成的多维向量,该序列进入由LSTM单元组成的双向循环神经网络,输出后再使用条件随机场(CRF)对其进行全局优化。根据一个优选实施方式,在步骤4中,所述分类器采用的分类算法包括支持向量机、贝叶斯模型、决策树和神经网络算法。本专利技术具有以下有益效果:本专利技术针对传统信用风险模型中只使用静态财务数据,不能实时跟踪最新企业经营状况的特点,设计了一种结合企业相关的新闻舆情和财务指标综合评估企业信用风险的方法。该方法在大规模采集网络舆情的基础上,使用人工标注的金标数据训练分类器,然后对于未标注数据进行情感方向和严重性的划分。下一步,对新闻文本中的企业主体名称进行提取,并统计与该主体相关的新闻数量和情感类型分布,综合计算其舆情得分,再结合传统的财务数据指标得到一个综合的信用评分和评级,并基于预设的规则提供数据的提示及告警服务。与现有技术方案相比,该方法的主要优势在于:可以动态跟踪与企业相关的最新舆情,及时发现与信用风险相关的因素,第一时间更新风险指标,为客户提供及时的提示和告警,帮助其抓住获利机会,避免风险损失。附图说明图1示出了本专利技术的方法流程图;图2示出了本专利技术从新闻文本中提取企业主体名称的深度学习模型。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本专利技术进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本专利技术的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本专利技术的概念。如图1所示,本专利技术的动态调整的企业信用风险评估方法包括以下步骤:步骤1:采用网络爬虫或类似方式,覆盖主要门户网站的财经新闻模块和专业性的金融、投资、债券、股票、衍生品相关网站,以及政策、法律、企业主管行政机构、法院、公安机关等的公告模型,使用较短的周期准实时抓取最新的大量新闻。前述时间周期可以根据用户需求以及特定情况下的数据量来进行调整,通常为1天。步骤2:在新闻中进行企业主体提取,标注出新闻文本中的企业主体名称。步骤3:对于一定数量的含有企业主体新闻,对其进行情感标注,情感标签分为正面/中性/负面三种,分别表示该新闻对于企业的经营情况有相同方向的影响,以及对其信用风险有相反方向的影响。可选地,对于正面和负面新闻,根据其影响的严重程度以及预先设定的规则,将其分为高/中/低三类。步骤4:使用专家标注的高质量(金标)数据,使用各种机器学习模型训练新闻情感的分类器,分类器模型可以在各种通用分类算法中选择,包括支持向量机、贝叶斯模型、决策树、神经网络等。步骤5:对于获取的大量未标注新闻数据,使用步骤4中训练的模型对其进行分类。根据使用模型的不同,对于接近分类边缘(如支持向量机)或分类置信度不高(如贝叶斯模型等)的样本,为了不影响评分模型的精度,不参与后续的计算。步骤6:根据与一个主体相关的正面、负面、中性新闻数量,分别计算一个分类累计分值,该分值的计算中考虑到了新闻的时效性,进行一定的衰减,从而保证最新的新闻具有较大的影响。步骤7:综合新闻的数量和其中不同情感类型的分布情况,计算新闻舆情的总体评分值。步骤8:结合财务指标和舆情指标,采用加权求和的方式计算总体信用风险评分,该评分可以基于实时的新闻进行动态更新。步骤9:进行信用评分和评级的输出,并根据预设规则,在特定场景下对客户进行相应的提示或告警。前述预设规则包括但不限于:1、在特定企业本文档来自技高网
...

【技术保护点】
1.一种动态调整的企业信用风险评估方法,其特征在于,包括以下步骤:步骤1:通过网络爬虫以预设的周期抓取设定的新闻采集网站上的大量新闻;步骤2:在新闻中进行企业主体提取,标注出新闻文本中的企业主体名称;步骤3:对于一定数量含有企业主体的新闻,对其进行情感标注,情感标签分为正面/中性/负面三种;对于正面和负面新闻,将其分为高/中/低三类;步骤4:使用专家标注的金标数据,采用机器学习模型训练新闻情感的分类器;步骤5:对于获取的大量未标注新闻数据,使用步骤4中训练的模型对其进行分类;步骤6:根据与一个企业主体相关的正面、负面、中性新闻数量,分别计算一个分类累计分值;步骤7:综合新闻的数量和其中情感类型的分布,计算新闻舆情的总体评分值;步骤8:结合财务指标和舆情指标,采用加权求和的方式计算总体信用风险评分,该评分能够基于实时的新闻进行动态更新;步骤9:进行信用评分和相应信用评级的输出,并根据预设规则在特定场景下对客户进行相应的提示或告警。

【技术特征摘要】
1.一种动态调整的企业信用风险评估方法,其特征在于,包括以下步骤:步骤1:通过网络爬虫以预设的周期抓取设定的新闻采集网站上的大量新闻;步骤2:在新闻中进行企业主体提取,标注出新闻文本中的企业主体名称;步骤3:对于一定数量含有企业主体的新闻,对其进行情感标注,情感标签分为正面/中性/负面三种;对于正面和负面新闻,将其分为高/中/低三类;步骤4:使用专家标注的金标数据,采用机器学习模型训练新闻情感的分类器;步骤5:对于获取的大量未标注新闻数据,使用步骤4中训练的模型对其进行分类;步骤6:根据与一个企业主体相关的正面、负面、中性新闻数量,分别计算一个分类累计分值;步骤7:综合新闻的数量和其中情感类型的分布,计算新闻舆情的总体评分值;步骤8:结合财务指标和舆情指标,采用加权求和的方式计算总体信用风险评分,该评分能够基于...

【专利技术属性】
技术研发人员:冯翱吴锡
申请(专利权)人:成都信息工程大学成都智睿通拓科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1