一种风险信息确定方法、装置、设备及存储介质制造方法及图纸

技术编号:32180805 阅读:11 留言:0更新日期:2022-02-08 15:42
本发明专利技术实施例涉及数据处理技术领域,尤其涉及一种风险信息确定方法、装置、设备及存储介质。该方法包括:获取预先构建完成的投行业务风控词典和目标企业的舆情文本数据;针对每个舆情文本数据,基于投行业务风控词典对舆情文本数据进行分词,并对分词结果进行向量化,得到舆情特征向量;将舆情特征向量输入至已训练完成的舆情分类模型中,根据舆情分类模型的输出结果,确定目标企业的风险信息;其中,投行业务风控词典中存储有属于投行业务风控类别的多个投行业务风控词汇,投行业务风控类别包括重大事项披露类别、召集持有人会议类别和加入重点关注类别中的至少一个。本发明专利技术实施例的技术方案,可以在投行业务中准确确定目标企业的风险信息。的风险信息。的风险信息。

【技术实现步骤摘要】
一种风险信息确定方法、装置、设备及存储介质


[0001]本专利技术实施例涉及数据处理
,尤其涉及一种风险信息确定方法、装置、设备及存储介质。

技术介绍

[0002]随着我国市场经济的迅速发展和国际化水平的不断提高,各大企业面临的国内外的竞争压力越来越大。为了保证企业的长足发展,需要提前预判企业在未来可能面临的风险,以便企业的决策者能够及时规避潜在的风险。
[0003]在实现本专利技术的过程中,专利技术人发现现有技术中存在以下技术问题:现有的风险信息确定方案的确定精度较低。

技术实现思路

[0004]本专利技术实施例提供了一种风险信息确定方法、装置、设备及存储介质,以实现在投行业务中准确确定目标企业的风险信息的效果。
[0005]第一方面,本专利技术实施例提供了一种风险信息确定方法,可以包括:
[0006]获取预先构建完成的投行业务风控词典和目标企业的舆情文本数据;
[0007]针对每个舆情文本数据,基于投行业务风控词典对舆情文本数据进行分词,并对分词结果进行向量化,得到舆情特征向量;
[0008]将舆情特征向量输入至已训练完成的舆情分类模型中,根据舆情分类模型的输出结果,确定目标企业的风险信息;
[0009]其中,在投行业务风控词典中存储有隶属于投行业务风控类别的多个投行业务风控词汇,投行业务风控类别包括重大事项披露类别、召集持有人会议类别和加入重点关注类别中的至少一个。
[0010]第二方面,本专利技术实施例还提供了一种风险信息确定装置,可以包括:
[0011]舆情文本数据获取模块,用于获取预先构建完成的投行业务风控词典以及目标企业的舆情文本数据;
[0012]舆情特征向量得到模块,用于针对每个舆情文本数据,基于投行业务风控词典对舆情文本数据进行分词,并对分词结果进行向量化,得到舆情特征向量;
[0013]风险信息确定模块,用于将舆情特征向量输入至已经训练完成的舆情分类模型中,根据舆情分类模型的输出结果,确定目标企业的风险信息;
[0014]其中,在投行业务风控词典中存储有隶属于投行业务风控类别的多个投行业务风控词汇,投行业务风控类别包括重大事项披露类别、召集持有人会议类别和加入重点关注类别中的至少一个。
[0015]第三方面,本专利技术实施例还提供了一种风险信息确定设备,可以包括:
[0016]一个或多个处理器;
[0017]存储器,用于存储一个或多个程序;
[0018]当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现本专利技术任意实施例所提供的风险信息确定方法。
[0019]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本专利技术任意实施例所提供的风险信息确定方法。
[0020]本专利技术实施例的技术方案,通过获取预先构建完成的投行业务风控词典和目标企业的舆情文本数据,该投行业务风控词典中记载有隶属于投行业务风控类别的多个投行业务风控词汇,该投行业务风控类别可包括重大事项披露类别、召集持有人会议类别以及加入重点关注类别中的至少一个;针对每个舆情文本数据,基于投行业务风控词典对舆情文本数据进行分词,得到了舆情文本数据中与投行业务在风控实施方面强关联的分词结果,进而对分词结果进行向量化,得到能够被计算机程序理解和处理的舆情特征向量,由此降低了舆情文本数据的处理难度、减少了处理时间且提高了处理准确性;将舆情特征向量输入至已训练完成的舆情分类模型中,由于舆情分类模型的输出结果可以表示上述舆情文本数据是否能够表示目标企业在未来可能面临一定的风险、面临的风险是否严重等,因此根据输出结果可以确定目标企业的风险信息,这有助于目标企业的决策者基于风险信息及时规避潜在的风险,也有助于第三方基于风险信息为目标企业进行准确的风控预警。上述技术方案,通过投行业务风控词典对目标企业的舆情文本数据进行分析,由此达到了在投行业务中准确确定目标企业的风险信息的效果。
附图说明
[0021]图1是本专利技术实施例一中的一种风险信息确定方法的流程图;
[0022]图2是本专利技术实施例一中的一种风险信息确定方法中SVM的分类示意图;
[0023]图3是本专利技术实施例二中的一种风险信息确定方法的流程图;
[0024]图4是本专利技术实施例三中的一种风险信息确定方法的流程图;
[0025]图5是本专利技术实施例四中的一种风险信息确定方法的流程图;
[0026]图6是本专利技术实施例五中的一种风险信息确定装置的结构框图;
[0027]图7是本专利技术实施例六中的一种风险信息确定设备的结构示意图。
具体实施方式
[0028]下面结合附图和实施例对本专利技术作进一步详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0029]实施例一
[0030]图1是本专利技术实施例一中提供的一种风险信息确定方法的流程图。本实施例可适用于在投行业务中根据目标企业的舆情文本数据确定其风险信息的情况。该方法可以由本专利技术实施例提供的风险信息确定装置来执行,该装置可由软件和/或硬件的方式实现,该装置可以集成在风险信息确定设备上,该设备可以是各种用户终端或是服务器。
[0031]参见图1,本专利技术实施例的方法具体包括如下步骤:
[0032]S110、获取预先构建完成的投行业务风控词典和目标企业的舆情文本数据,其中,在投行业务风控词典中存储有隶属于投行业务风控类别的多个投行业务风控词汇,投行业
务风控类别包括重大事项披露类别、召集持有人会议类别和加入重点关注类别中的至少一个。
[0033]其中,投行业务风控词典可以是已预先构建完成的与投行业务在风控实施方面强关联的词典,其内可以存储有隶属于投行业务风控类别的多个投行业务风控词汇,该投行业务风控类别可以是根据实际的投行业务需求提出的类别,如重大事项披露类别、召集持有人会议类别和加入重点关注类别等。具体的,
[0034]重大事项披露类别可以是披露出重大事项的类别,如企业名称、经营方针和经营范围发生重大变化;如企业生产经营的外部条件发生重大变化或者产业或行业政策变化、重大灾害、特许经营权变化等;如企业涉及可能对其资产、负债、权益和经营成果产生重要影响的重大合同;如企业发生可能影响其偿债能力的资产抵押、质押、出售、转让、划转或报废;如企业发生未能清偿到期重大债务的违约情况,未能按照相关约定偿还债务;如企业发生大额赔偿责任或因赔偿责任影响正常生产经营且难以消除的;如企业因未能履行合同约定、产品质量存在问题、发生安全事故、履行担保责任等或是因履行赔偿责任影响企业正常生产经营且难以消除的事项;再如企业做出减资、合并、分立、解散及申请破产的决定,或依法进入破产程序、被责令关闭;等等,在此未做具体限定。在此基础上,可选的,隶属于重大事项披露类别的投行业务风控词汇可包括赔偿、违法、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种风险信息确定方法,其特征在于,包括:获取预先构建完成的投行业务风控词典和目标企业的舆情文本数据;针对每个所述舆情文本数据,基于所述投行业务风控词典对所述舆情文本数据进行分词,并对分词结果进行向量化,得到舆情特征向量;将所述舆情特征向量输入至已训练完成的舆情分类模型中,根据所述舆情分类模型的输出结果,确定所述目标企业的风险信息;其中,在所述投行业务风控词典中存储有隶属于投行业务风控类别的多个投行业务风控词汇,所述投行业务风控类别包括重大事项披露类别、召集持有人会议类别和加入重点关注类别中的至少一个。2.根据权利要求1所述的方法,其特征在于,所述对分词结果进行向量化,得到舆情特征向量,包括:针对每个所述投行业务风控词汇,根据分词结果确定所述投行业务风控词汇在所述舆情文本数据中的出现数据;根据各所述投行业务风控词汇的所述出现数据,得到舆情特征向量。3.根据权利要求2所述的方法,其特征在于,所述根据各所述投行业务风控词汇的所述出现数据,得到舆情特征向量,包括:针对每个所述投行业务风控词汇,确定所述投行业务风控词汇在待得到的舆情特征向量中的向量维度,并将所述投行业务风控词汇的所述出现数据作为所述向量维度下的数值;根据各所述投行业务风控词汇在与所述投行业务风控词汇对应的所述向量维度下的所述数值,得到所述舆情特征向量。4.根据权利要求2所述的方法,其特征在于,所述出现数据包括出现频次数据。5.根据权利要求1所述的方法,其特征在于,所述舆情文本数据包括舆情文本语句,所述基于所述投行业务风控词典对所述舆情文本数据进行分词包括:针对每个所述舆情文本语句,将所述舆情文本语句拆分为舆情文本词汇;针对每个所述舆情文本词汇,将所述舆情文本词汇与记载在所述投行业务风控词典中的各所述投行业务风控词汇进行对比;如果根据对比结果确定所述舆情文本词汇属于各所述投行业务风控词汇,则将所述舆情文本词汇作为所述分词结果。6.根据权利要求5所述的方法,其特征在于,在所述将所述舆情文本词汇与记载在所述投行业务风控词典中的各所述投行业务风控词汇进行对比之后,还包括:如果根据所述对比结果确定所述舆情文本词汇不属于各所述投行业务风控词汇,则将所述舆情文本词汇作为所述舆情文本语句;重复执行所述针对每个所述舆情文本语句的步骤。7.根据权利要求6所述的方法,其特征在于,还包括:如果所述舆情文本词汇中的舆情文本字的字数小于或是等于预设数量阈值,则停止对所述舆情文本词汇执行的拆分处理。8.根据权利要求1所述的方法,其特征在于,在所述根据所述舆情分类模型的输出结果,确定所述目标企业的风险信息之后,还包括:
根据所述风险信息的信息类别确定是否对所述舆情文本数据进行推送;如果是,则根据所述信息类别确定舆情文本数据接收设备,并将所述舆情文本数据推送到所述舆情文本数据接收设备上。9.根据权利要求8所述的方法,其特征在于,所述目标企业是被投资企业,所述根据所述信息类别确定舆情文本数据接收设备,包括:根据所述信息类别确定待投资企业的舆情文本数据接收设备,其中所述待投资企业是待对所述被投资企业进行投资的企业。10.根据权利要求1所述的方法,其特征在于,还包括:获取各样本企业的训练样本,其中每个所述训练样本包括所述样本企业的舆情样本数据和所述舆情样本数据的风险类别;分别获取各所述舆情样本数据中隶属于所述投行业务风控类别的所述投行业务风控...

【专利技术属性】
技术研发人员:林质锐朱富荣庄佳和林宜领何易超
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1