基于知识图谱的企业风险预警方法及系统技术方案

技术编号:26260513 阅读:27 留言:0更新日期:2020-11-06 17:56
本发明专利技术公开一种基于知识图谱的企业风险预警方法及系统,涉及人工智能技术领域。该方法包括:获取企业信息的结构化数据和半结构化数据,处理后形成标准化结构数据汇入数据池;获取企业信息的非结构化数据,处理后形成企业关系数据汇入语料库;基于所述数据池中的标准化结构数据以及所述语料库中的企业关系数据构建目标企业的知识图谱;利用预先训练的风险识别模型从知识图谱中挖掘出目标企业的风险信息,实现风险预警。该系统应用有上述所提的方法。

【技术实现步骤摘要】
基于知识图谱的企业风险预警方法及系统
本专利技术涉及人工智能
,尤其涉及一种基于知识图谱的企业风险预警方法及系统。
技术介绍
金融大数据分析和金融领域文本的语义处理是金融行业知识提取的关键性基础技术,可以为知识发现和推理决策提供技术支撑。因此,越来越多的金融机构及企业加入构建金融领域的企业风险预警研究,为企业的应用决策提供精准可靠的依据。金融领域由于对数据强烈的依赖性,被认为是人工智能技术最适合落地的领域之一,海量的数据为人们更好地掌握与认知事物规律,提供了越来越丰富的来源。但是,由于数据量的急剧增长,对数据的分析与理解的要求已经远远超过人类的生理极限,这对分析的方式提出了新的要求与挑战。传统的数据处理和文本搜索的方式已经很难适应现实瞬息万变的市场行情,无法满足金融分析的实时性、穿透性和全局性的要求。现有金融分析获取的数据源结构单一,仅能够从结构化数据中挖掘风险因子,无法对相关的非结构化数据加以利用,如公开的网页文本信息,而这些公开的网页文本信息往往蕴藏着有效的风险因子。综上,由于数据源的结构单一,降低了企业风险预警结果的准确性。本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的企业风险预警方法,其特征在于,包括:/n获取企业信息的结构化数据和半结构化数据,处理后形成标准化结构数据汇入数据池;/n获取企业信息的非结构化数据,处理后形成企业关系数据汇入语料库;/n基于所述数据池中的标准化结构数据以及所述语料库中的企业关系数据构建目标企业的知识图谱;/n利用预先训练的风险识别模型从知识图谱中挖掘出目标企业的风险信息,实现风险预警。/n

【技术特征摘要】
1.一种基于知识图谱的企业风险预警方法,其特征在于,包括:
获取企业信息的结构化数据和半结构化数据,处理后形成标准化结构数据汇入数据池;
获取企业信息的非结构化数据,处理后形成企业关系数据汇入语料库;
基于所述数据池中的标准化结构数据以及所述语料库中的企业关系数据构建目标企业的知识图谱;
利用预先训练的风险识别模型从知识图谱中挖掘出目标企业的风险信息,实现风险预警。


2.根据权利要求1所述的方法,其特征在于,获取企业信息的结构化数据和半结构化数据,处理后形成标准化结构数据汇入数据池的方法包括:
在第一处理器中配置结构化处理模板,以及在第二处理器中配置半结构化处理模板;
将获取的结构化数据输入第一处理器,经数据清洗后按照结构化处理模板提取字段后得到标准化结构数据;
将获取的半结构化数据输入第二处理器,经数据清洗后按照半结构化处理模板提取字段后得到标准化结构数据;
将得到标准化结构数据汇入数据池。


3.根据权利要求1或2所述的方法,其特征在于,所述结构化数据包括工商数据、税务数据、财务数据、行业指标数据中的一种或多种,所述半结构化数据包括法院公告数据和/或判决文书数据。


4.根据权利要求1所述的方法,其特征在于,爬取关于企业信息的非结构化数据,处理后形成企业关系数据的方法包括:
通过分布式爬虫技术从多个网站上抓取网页信息,采用文本处理器解析清洗后,从中抽取能够反映企业间关系的谓词三元组形成企业关系数据。


5.根据权利要求4所述的方法,其特征在于,从中抽取能够反映企业间关系的谓词三元组形成企业关系数据的方法包括:
将清洗后的网页文本分词后输入训练完成的BiLSTM编码模型中,抽取包括主语、关系、宾语结构的谓词三元组形成企业关系数据。

【专利技术属性】
技术研发人员:沈春泽李加庆周张泉孙华蔚
申请(专利权)人:苏宁金融科技南京有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1