一种基于大数据分析的企业信用评估方法及系统技术方案

技术编号:38663887 阅读:21 留言:0更新日期:2023-09-02 22:45
本发明专利技术公开了一种基于大数据分析的企业信用评估方法及系统,涉及企业信用评估技术领域,该系统采集目标企业的财务数据,并基于大数据采集信息数据,识别分析从而获得信息声誉系数Yqx;通过构建信息数据的用户互动关系网络和目标企业与其他用户之间的关系网络,并计算节点的度中心性指标,可以得到企业的影响力系数Yxx;并将信息声誉系数Yqx和企业影响力系数Yxx作为额外的输入信用评估模型中,能够提供更全面的信息来评估企业的信用状况。综合考虑财务数据、信息声誉和影响力,有助于决策者更全面地了解企业的信用状况,降低评估的偏差和风险,促进提高反应企业所处的市场环境和经济形势的变化。济形势的变化。济形势的变化。

【技术实现步骤摘要】
一种基于大数据分析的企业信用评估方法及系统


[0001]本专利技术涉及企业信用评估
,具体为一种基于大数据分析的企业信用评估方法及系统。

技术介绍

[0002]基于大数据分析的企业信用评估系统是一种利用大数据技术和分析方法来评估企业信用状况的系统。它结合了多种数据源和算法,通过对大量的企业数据进行收集、整合和分析,从而评估企业的信用风险和信用能力。
[0003]现有的企业信用评估系统,大部分是通过财务数据对企业信用进行综合性评估,然而财务数据只能反映企业在财务方面的情况,无法全面评估企业的信用状况。企业的信用涉及更广泛的方面,如品牌声誉、市场地位、竞争优势等,且财务数据通常有一定的滞后性,无法及时反映企业所处的市场环境和经济形势的变化。企业的信用评估需要考虑到宏观经济因素、行业趋势以及信息对企业的影响,而这些信息无法通过财务数据单独获取,进而导致无法准确捕捉到企业的实际信用风险。

技术实现思路

[0004]解决的技术问题:针对现有技术的不足,本专利技术提供了一种基于大数据分析的企业信用评估方法及系统,综合考虑财务数据、信息声誉和影响力,评估模型可以更准确地反映企业的整体信用风险和信用能力。这有助于决策者更全面地了解企业的信用状况,降低评估的偏差和风险,促进提高反应企业所处的市场环境和经济形势的变化。
[0005]技术方案:为实现以上目的,本专利技术通过以下技术方案予以实现:一种基于大数据分析的企业信用评估方法,包括以下方法步骤:S1、采集目标企业财务数据,并通过网络爬虫技术或API接口手段,基于大数据收集与目标企业相关的信息数据,获得信息数据;S2、对收集到的信息数据进行情感分析,将收集到的信息数据分类为积极性数据、消极性数据和中性数据;S3、对积极性数据、消极性数据和中性数据进行特征提取,提取特征关键词和若干个主题,识别与目标企业信用相关的特征关键词和主题,获取信息声誉系数Yqx;所述信息声誉系数Yqx通过以下公式进行计算:;
[0006]其中,Jj表示积极性数据的数量;Xj表示消极性数据的数量;Zx表示中性数据的数量;Sl表示综合情感数量,通过将积极性数据和消极性数据相加得到,即Sl=Jj+Xj;Hy表示综合主题活跃度,用来反映讨论和关注度的活跃程度;这个值根据具体情况进行定义和计算;表示为修正常数;S4、通过社交网络分析方法,分析信息数据中的关系网络,分析网络中的节点和度
中心的指标,获取企业影响力系数Yxx;所述企业影响力系数Yxx通过以下公式计算获取:;式中,C表示度中心性指标,取值为节点的度中心性、入度中心性或出度中心性数量的平均值;minC表示度中心性指标的最小值;maxC表示度中心性指标的最大值;表示修正常数,具体按照实际情况进行修正;通过该公式,将度中心性指标归一化到[0,1]的范围内,使得不同节点的度中心性值进行比较,并计算得到企业的影响力系数Yxx;S5、预设标准信用评估模型,将目标企业所述信息声誉系数Yqx、企业影响力系数Yxx和财务数据输入信用评估模型中,获取评估结果。
[0007]优选的,所述S1中具体包括:(1)收集与目标企业相关的新闻报道,包括财经新闻、行业新闻和公司公告数据;(2)收集目标企业在社交媒体平台上的用户评论、留言和讨论数据;(3)收集目标企业在各类行业论坛、问答平台上的讨论和提问数据;(4)收集用户对目标企业产品或服务的评价评分数据,包括电商平台上的用户评价、酒店评分和餐厅点评数据;(5)收集与目标企业相关的来自消费者投诉平台的投诉记录信息数据;(6)收集目标企业的财务数据,按照周期月、季度和年周期进行采集。
[0008]优选的,所述S2具体包括:(1)对收集到的信息数据进行预处理,包括去除特殊字符、标点符号和停用词,进行文本清洗处理;(2)构建情感词典,其中包括积极情感词、消极情感词和中性词,获取情感数据集,并依据情感数据集建立情感分析模型;(3)将预处理后的信息数据输入训练好的情感分析模型,对每个文本进行情感分类;根据情感分析模型的输出结果,将文本分类为积极性数据、消极性数据和中性数据。
[0009]优选的,将积极性数据、消极性数据和中性数据再次细致分类,其具体方式包括:对比设定阈值进行再次细致分类,具体包括设定一个积极情感得分阈值和消极情感得分阈值,将得分高于积极情感阈值的文本划分为积极性数据Jj,得分低于消极情感阈值的文本划分为消极性数据Xj,得分介于两个阈值之间的文本划分为中性数据Zx。
[0010]优选的,所述S3中提取方式包括:(1)关键词提取,依据积极性数据、消极性数据和中性数据,提取其中情感修饰词、感叹号、问号,以及情感强度的表示词、程度副词,来量化积极性数据Jj、消极性数据Xj和中性数据Zx,获得综合情感数量Sl;(2)主题特征提取,依据积极性数据Jj、消极性数据Xj和中性数据Zx,对其文本中提取主题信息,并结合文本的互动行为,如点赞数、评论数和转发数作为特征,获得综合主题活跃度Hy;(3)依据积极性数据Jj、消极性数据Xj和中性数据Zx中的综合情感数量Sl和综合主题活跃度Hy,计算获得信息声誉系数Yqx。
[0011]优选的,所述S4中具体步骤包括:(1)构建信息数据的用户互动关系网络和目标企业与其他用户之间的关系网络,网络中的节点表示用户,边表示用户之间的关系;(2)计算每个节点的度中心性指标,度中心性表示节点与其他节点之间的连接数量,获取度中心性、入度中心性和出度中心性数量;(3)将度中心性、入度中心性和出度中心性数量进行归一化处理,根据度中心性的归一化值,计算企业影响力系数Yxx。
[0012]优选的,所述S5具体包括:(1)建立标准信用评估模型,使用验证集对标准信用评估模型进行评估和验证,计算标准信用评估模型的准确率、精确度、召回率和F1值指标;(2)利用建立好的信用评估模型对目标企业进行信用评估和预测,将目标企业所述信息声誉系数Yqx、企业影响力系数Yxx和财务数据输入信用评估模型中,获取评估结果,评估结果设置为打分和排名形式的评估结果。
[0013]一种基于大数据分析的企业信用评估系统,包括信息数据收集模块:通过网络爬虫技术或API接口手段,基于大数据收集与目标企业相关的信息数据,获得信息数据;财务数据采集模块:采集企业按照月、季度和年周期采集目标企业的财务数据;数据预处理模块:对收集到的信息数据进行清洗、去除噪声和重复内容,处理缺失值和异常值;情感分析模块:对收集到的信息数据进行情感分析,将收集到的信息数据分类为积极性数据、消极性数据和中性数据;特征主题提取模块:对积极性数据、消极性数据和中性数据进行特征提取,提取特征关键词和若干个主题,识别与目标企业信用相关的特征关键词和主题,获取信息声誉系数Yqx;节点分析模块:分析信息数据中的关系网络,分析网络中的节点和度中心的指标,获取企业影响力系数Yxx;评估模型模块:将目标企业的所述信息声誉系数Yqx、企业影响力系数Yxx和财务数据输入预设信用评估模型中,获取评估结果;实时监测和预警模块:实时监测信息数据的变化,及时发现对企业本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据分析的企业信用评估方法,其特征在于,包括以下方法步骤:S1、采集目标企业财务数据,并通过网络爬虫技术或API接口手段,基于大数据收集与目标企业相关的信息数据,获得信息数据;S2、对收集到的信息数据进行情感分析,将收集到的信息数据分类为积极性数据、消极性数据和中性数据;S3、对积极性数据、消极性数据和中性数据进行特征提取,提取特征关键词和若干个主题,识别与目标企业信用相关的特征关键词和主题,获取信息声誉系数Yqx;所述信息声誉系数Yqx通过以下公式进行计算:;其中,Jj表示积极性数据的数量;Xj表示消极性数据的数量;Zx表示中性数据的数量;Sl表示综合情感数量,通过将积极性数据和消极性数据相加得到,即Sl=Jj+Xj;Hy表示综合主题活跃度,用来反映讨论和关注度的活跃程度;这个值根据具体情况进行定义和计算; 表示为修正常数;S4、通过社交网络分析方法,分析信息数据中的关系网络,分析网络中的节点和度中心的指标,获取企业影响力系数Yxx;所述企业影响力系数Yxx通过以下公式计算获取:;式中,C表示度中心性指标,取值为节点的度中心性、入度中心性或出度中心性数量的平均值;minC表示度中心性指标的最小值;maxC表示度中心性指标的最大值;表示修正常数,具体按照实际情况进行修正;通过该公式,将度中心性指标归一化到[0,1]的范围内,使得不同节点的度中心性值进行比较,并计算得到企业的影响力系数Yxx;S5、预设标准信用评估模型,将目标企业所述信息声誉系数Yqx、企业影响力系数Yxx和财务数据输入信用评估模型中,获取评估结果。2.根据权利要求1所述的一种基于大数据分析的企业信用评估方法,其特征在于,所述S1中具体包括:(1)收集与目标企业相关的新闻报道,包括财经新闻、行业新闻和公司公告数据;(2)收集目标企业在社交媒体平台上的用户评论、留言和讨论数据;(3)收集目标企业在各类行业论坛、问答平台上的讨论和提问数据;(4)收集用户对目标企业产品或服务的评价评分数据,包括电商平台上的用户评价、酒店评分和餐厅点评数据;(5)收集与目标企业相关的来自消费者投诉平台的投诉记录信息数据;(6)收集目标企业的财务数据,按照周期月、季度和年周期进行采集。3.根据权利要求1所述的一种基于大数据分析的企业信用评估方法,其特征在于,所述S2具体包括:(1)对收集到的信息数据进行预处理,包括去除特殊字符、标点符号和停用词,进行文本清洗处理;
(2)构建情感词典,其中包括积极情感词、消极情感词和中性词,获取情感数据集,并依据情感数据集建立情感分析模型;(3)将预处理后的信息数据输入训练好的情感分析模型,对每个文本进行情感分类;根据情感分析模型的输出结果,将文本分类为积极性数据、消极性数据和中性数据。4.根据权利要求3所述的一种基于大数据分析的企业信用评估方法,其特征在于,将积极性数据、消极性数据和中性数据再次细致分类,其具体方式包括:对比设定阈值进行再次细致分类,具体包括设定一个积极情感得分阈值和消极情感...

【专利技术属性】
技术研发人员:朱飞
申请(专利权)人:深圳市爱为物联科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1