识别上市企业风险的方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35575331 阅读:26 留言:0更新日期:2022-11-12 16:00
本申请提供了一种识别上市企业风险的方法、装置、电子设备及存储介质,该识别上市企业风险的方法包括:获取待识别上市企业句子文本;将待识别上市企业句子文本输入预设风险信息抽取模型中的RoBERTa

【技术实现步骤摘要】
识别上市企业风险的方法、装置、电子设备及存储介质


[0001]本申请涉及人工智能
,具体涉及一种识别上市企业风险的方法、装置、电子设备及存储介质。

技术介绍

[0002]近年来新冠疫情肆虐,全球经济下行压力持续加大,通胀压力持续上升,以能源品为代表的关键物资陷入短缺,国际供应链出现局部瘫痪,全球经济环境面临着诸多挑战。与此同时,国内市场竞争日趋激烈,人才流失日益严重,上市公司存在的信用违约、股价动荡、债券波动等风险因素持续增加,投资者对上市公司进行风险评估的要求也不断提高。2012年,中国证监会发布了《公开发行证券的公司信息披露内容与格式准则第2号》,规定上市公司必须在年报中披露可能会对企业未来发展产生不利影响的风险因素。研究表明,企业年报中披露的风险因素具有前瞻性,反映了公司未来的发展状况,描述了企业在经营过程中可能面对的风险;其中,风险因素文本包含了大量的风险术语,为投资者对企业进行风险评估提供了结构化的知识单元,能够给投资者提供更多的特质信息,缓解投资者与企业之间的信息不对称,帮助投资者进行决策;因此,如何有效地从企业年报中自动抽取本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种识别上市企业风险的方法,其特征在于,所述识别上市企业风险的方法包括:获取待识别上市企业句子文本;将待识别上市企业句子文本输入预设风险信息抽取模型中的RoBERTa

wwm模块,得到包含上下文语义信息的字符级向量;将所述字符级向量输入预设风险信息抽取模型中的BILSTM模块,得到双向语义特征向量;将字符级向量和双向语义特征向量输入预设风险信息抽取模型的Attention模块中进行特征融合,得到调整权重后的句子文本特征向量;将所述句子文本特征向量输入CRF模块,得到预测序列结果。2.根据权利要求1所述的识别上市企业风险的方法,其特征在于,所述获取待识别上市企业句子文本,之前,包括:获取历史年份的多个第一上市企业年报数据;将多个第一上市企业年报数据中名称包含预设标识的第一上市企业年报数据剔除,得到多个第二上市企业年报数据;根据多个第二上市企业年报数据对所述预设风险信息抽取模型进行训练。3.根据权利要求2所述的识别上市企业风险的方法,其特征在于,所述根据多个第二上市企业年报数据对所述预设风险信息抽取模型进行训练,包括:将多个第二上市企业年报数据中每个第二上市企业年报数据中的第一章节和第四章节的内容保留,得到多个第三上市企业年报数据;根据多个第三上市企业年报数据对所述预设风险信息抽取模型进行训练。4.根据权利要求3所述的识别上市企业风险的方法,其特征在于,所述根据多个第三上市企业年报数据对所述预设风险信息抽取模型进行训练,包括:获取多个第三上市企业年报数据中各个章节下的标题文本,得到风险文本数据集;基于预设的风险短语分类规则和BIO三元标记法使用YEDDA轻量级协作文本跨度注释工具对风险文本数据集进行风险短语标注,得到标注文本数据集;基于所述标注文本数据集对所述预设风险信息抽取模型进行训练。5.根据权利要求4所述的识别上市企业风险的方法,其特征在于,所述基于所述标注文本数据集对所述预设风险信息抽取模型进行训练,包括:按...

【专利技术属性】
技术研发人员:廖列法杨长沛
申请(专利权)人:江西理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1