信用违约预测方法、装置及电子设备制造方法及图纸

技术编号:28297304 阅读:22 留言:0更新日期:2021-04-30 16:22
本发明专利技术提供了一种信用违约预测方法、装置及电子设备,涉及数据处理技术领域,在对待预测企业进行信用违约预测时,先获取待预测企业的预测数据和舆情信息;其中,该预测数据包括财务数据,该舆情信息包括多个舆情事件;分别对预测数据和舆情信息进行特征提取,得到待预测企业对应的结构化特征和序列特征;根据待预测企业对应的结构化特征和序列特征以及训练后的预测模型,确定待预测企业的信用违约预测结果;该预测模型用于对待预测企业对应的结构化特征和序列特征进行特征拼接,并输出与拼接后特征对应的信用违约预测结果。这样能够最大限度的利用结构化特征和序列特征中蕴含的信息,提高了预测结果的准确度。

【技术实现步骤摘要】
信用违约预测方法、装置及电子设备
本专利技术涉及数据处理
,尤其是涉及一种信用违约预测方法、装置及电子设备。
技术介绍
信用违约风险是指在商业交易中由于交易一方的违约,使另一方得到的预期现金流量现值减少而遭受的风险。可以基于企业的舆情信息对企业的信用违约风险进行预测。其中,舆情信息是对舆情的一种描述和反映,从理论上讲,所谓舆情信息,就是指在民众社会政治态度的收集、整理、分析、报送、利用和反馈的信息运动过程中,用以客观反映舆情状态及其运动情况的资讯、消息、音信、情报、指令、数据和信号。然而现有的信用违约预测方法无法有效地利用企业的舆情信息,使得预测结果不够准确。
技术实现思路
本专利技术的目的在于提供一种信用违约预测方法、装置及电子设备,以提高预测结果的准确度。本专利技术实施例提供了一种信用违约预测方法,包括:获取待预测企业的预测数据和舆情信息;其中,所述预测数据包括财务数据,所述舆情信息包括多个舆情事件;分别对所述预测数据和所述舆情信息进行特征提取,得到所述待预测企业对应的结构化特征和序列特征;根据所述待预测企业对应的结构化特征和序列特征以及训练后的预测模型,确定所述待预测企业的信用违约预测结果;所述预测模型用于对所述待预测企业对应的结构化特征和序列特征进行特征拼接,并输出与拼接后特征对应的信用违约预测结果。进一步地,分别对所述预测数据和所述舆情信息进行特征提取,得到所述待预测企业对应的结构化特征和序列特征的步骤,包括:对所述预测数据进行特征筛选、空缺值填充、异常值处理和数据归一化处理,得到所述待预测企业对应的结构化特征;按照各个所述舆情事件发生的时间,构建目标舆情事件序列;对所述目标舆情事件序列进行数字编码,得到所述待预测企业对应的序列特征。进一步地,按照各个所述舆情事件发生的时间,构建目标舆情事件序列的步骤,包括:按照各个所述舆情事件发生的时间先后顺序,构建初始舆情事件序列;对所述初始舆情事件序列进行相邻位置重复元素的去除,得到目标舆情事件序列。进一步地,对所述目标舆情事件序列进行数字编码,得到所述待预测企业对应的序列特征的步骤,包括:对所述目标舆情事件序列中所有不同的元素依次分别赋予一个从0开始递增的数字,得到所述待预测企业对应的序列特征。进一步地,所述待预测企业为发债企业;所述方法还包括:获取训练样本集,所述训练样本集包括历史发债企业在预测窗口内的历史预测数据和历史舆情信息以及预测时间点的实际债券违约结果;分别对所述历史预测数据和所述历史舆情信息进行特征提取,得到所述历史发债企业对应的结构化特征和序列特征;根据所述历史发债企业对应的结构化特征、序列特征和所述实际债券违约结果,对初始预测模型进行训练,得到训练后的预测模型。进一步地,所述预测模型包括第一输入层、与所述第一输入层连接的第一全连接层、第二输入层、与所述第二输入层连接的嵌入层、与所述嵌入层连接的双向长短时记忆网络层、与所述双向长短时记忆网络层连接的第二全连接层、分别与所述第一全连接层和所述第二全连接层连接的特征融合层、以及与所述特征融合层连接的第三全连接层;所述第一输入层用于将结构化特征输入到所述第一全连接层;所述第二输入层用于将序列特征输入到所述嵌入层;所述特征融合层用于对所述第一全连接层的输出和所述第二全连接层的输出进行拼接,并将拼接后特征输入到所述第三全连接层;所述第三全连接层用于输出与所述拼接后特征对应的信用违约预测结果。进一步地,所述特征融合层与所述第三全连接层之间还设置有Dropout层。本专利技术实施例还提供了一种信用违约预测装置,包括:获取模块,用于获取待预测企业的预测数据和舆情信息;其中,所述预测数据包括财务数据,所述舆情信息包括多个舆情事件;提取模块,用于分别对所述预测数据和所述舆情信息进行特征提取,得到所述待预测企业对应的结构化特征和序列特征;确定模块,用于根据所述待预测企业对应的结构化特征和序列特征以及训练后的预测模型,确定所述待预测企业的信用违约预测结果;所述预测模型用于对所述待预测企业对应的结构化特征和序列特征进行特征拼接,并输出与拼接后特征对应的信用违约预测结果。本专利技术实施例还提供了一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的信用违约预测方法。本专利技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述的信用违约预测方法。本专利技术实施例提供的信用违约预测方法、装置及电子设备,在对待预测企业进行信用违约预测时,先获取待预测企业的预测数据和舆情信息;其中,该预测数据包括财务数据,该舆情信息包括多个舆情事件;分别对预测数据和舆情信息进行特征提取,得到待预测企业对应的结构化特征和序列特征;根据待预测企业对应的结构化特征和序列特征以及训练后的预测模型,确定待预测企业的信用违约预测结果;该预测模型用于对待预测企业对应的结构化特征和序列特征进行特征拼接,并输出与拼接后特征对应的信用违约预测结果。这样能够最大限度的利用结构化特征和序列特征中蕴含的信息,并且采用端到端的预测模型,减少了人工干预的过程,使得训练得到的预测模型更能反映数据本身,提高了预测结果的准确度。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种信用违约预测方法的流程示意图;图2为本专利技术实施例提供的一种训练预测模型的流程示意图;图3为本专利技术实施例提供的一种预测模型的架构示意图;图4为本专利技术实施例提供的一种预测模型的结构示意图;图5为本专利技术实施例提供的一种信用违约预测装置的结构示意图;图6为本专利技术实施例提供的一种电子设备的结构示意图。具体实施方式下面将结合实施例对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。信用违约包括信贷违约和债券违约等,其中债券违约是指债券发行主体不能按照事先达成的债券协议履行其义务的行为。通常基于构建的模型进行信用违约预测,因此模型构建方法(建模方法)至关重要。以对发债企业进行债券违约预测为例,企业的财务数据等包含结构化特征,企业的舆情信息包含序列特征。结构化特征是指在建模时那种数据结构固定的特征,如年龄、性别、收入、民族、学历等,这5个特征中的每一个都有确定的取值范围和数据长度,在建模过程中,结构化本文档来自技高网...

【技术保护点】
1.一种信用违约预测方法,其特征在于,包括:/n获取待预测企业的预测数据和舆情信息;其中,所述预测数据包括财务数据,所述舆情信息包括多个舆情事件;/n分别对所述预测数据和所述舆情信息进行特征提取,得到所述待预测企业对应的结构化特征和序列特征;/n根据所述待预测企业对应的结构化特征和序列特征以及训练后的预测模型,确定所述待预测企业的信用违约预测结果;所述预测模型用于对所述待预测企业对应的结构化特征和序列特征进行特征拼接,并输出与拼接后特征对应的信用违约预测结果。/n

【技术特征摘要】
1.一种信用违约预测方法,其特征在于,包括:
获取待预测企业的预测数据和舆情信息;其中,所述预测数据包括财务数据,所述舆情信息包括多个舆情事件;
分别对所述预测数据和所述舆情信息进行特征提取,得到所述待预测企业对应的结构化特征和序列特征;
根据所述待预测企业对应的结构化特征和序列特征以及训练后的预测模型,确定所述待预测企业的信用违约预测结果;所述预测模型用于对所述待预测企业对应的结构化特征和序列特征进行特征拼接,并输出与拼接后特征对应的信用违约预测结果。


2.根据权利要求1所述的信用违约预测方法,其特征在于,分别对所述预测数据和所述舆情信息进行特征提取,得到所述待预测企业对应的结构化特征和序列特征的步骤,包括:
对所述预测数据进行特征筛选、空缺值填充、异常值处理和数据归一化处理,得到所述待预测企业对应的结构化特征;
按照各个所述舆情事件发生的时间,构建目标舆情事件序列;
对所述目标舆情事件序列进行数字编码,得到所述待预测企业对应的序列特征。


3.根据权利要求2所述的信用违约预测方法,其特征在于,按照各个所述舆情事件发生的时间,构建目标舆情事件序列的步骤,包括:
按照各个所述舆情事件发生的时间先后顺序,构建初始舆情事件序列;
对所述初始舆情事件序列进行相邻位置重复元素的去除,得到目标舆情事件序列。


4.根据权利要求2所述的信用违约预测方法,其特征在于,对所述目标舆情事件序列进行数字编码,得到所述待预测企业对应的序列特征的步骤,包括:
对所述目标舆情事件序列中所有不同的元素依次分别赋予一个从0开始递增的数字,得到所述待预测企业对应的序列特征。


5.根据权利要求1所述的信用违约预测方法,其特征在于,所述待预测企业为发债企业;所述方法还包括:
获取训练样本集,所述训练样本集包括历史发债企业在预测窗口内的历史预测数据和历史舆情信息以及预测时间点的实际债券违约结果;
分别对所述历史预测数据和所述历史舆情信息进行特征提取,得到所述历史发债企业对应的结构化特征和序列特征;...

【专利技术属性】
技术研发人员:任亮傅雨梅罗刚
申请(专利权)人:北京知因智慧科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1