【技术实现步骤摘要】
投融资数据管理方法、装置、计算机设备及存储介质
本专利技术涉及投融资
,尤其涉及一种投融资数据管理方法、装置、计算机设备及存储介质。
技术介绍
随着经济的飞速发展,诞生了大量的投资机构和创业公司。但由于现有相关数据存储分散、关联性较差、可视化难度较高,导致机构和公司在进行投融资的时候很难找准定位、做出抉择。现有技术存在如下缺陷:1.现有的智能投融资系统较少,且基本信息的关联性较差。2.人工整理投融资数据,提取需要信息工作量太大。3.当数据量大时,保证数据实时的更新和查询的高效率有难度。
技术实现思路
本专利技术实施例提供了一种投融资数据管理方法、装置、计算机设备及存储介质,旨在解决现有技术中难以展示投融资机构间关系、投融资数据整理效率差以及投融资数据查询慢的问题。第一方面,本专利技术实施例提供了一种投融资数据管理方法,其包括:通过预设的网络爬虫爬取互联网上的投融资新闻数据以及预设企业的工商数据,所述网络爬虫爬取的内容包括公司/机构名称、注册地址 ...
【技术保护点】
1.一种投融资数据管理方法,其特征在于,包括:/n通过预设的网络爬虫爬取互联网上的投融资新闻数据以及预设企业的工商数据,所述网络爬虫爬取的内容包括公司/机构名称、注册地址、法人、成立日期、所属行业、注册资本、公司状态以及新闻内容;/n对爬取的数据进行数据清理处理,并将数据清理处理后的数据存入到Hive数据仓库中;/n从所述Hive数据仓库中提取新闻文本数据,并通过预设的NLP模型从所述新闻文本数据中提取实体,所述实体包括融资公司名称、投资机构名称、人物名称、投融资轮次、投融资金额、公司估值、投融资时间以及投资类型;/n根据从所述新闻文本数据中提取的实体建立投融资知识图谱,并 ...
【技术特征摘要】
1.一种投融资数据管理方法,其特征在于,包括:
通过预设的网络爬虫爬取互联网上的投融资新闻数据以及预设企业的工商数据,所述网络爬虫爬取的内容包括公司/机构名称、注册地址、法人、成立日期、所属行业、注册资本、公司状态以及新闻内容;
对爬取的数据进行数据清理处理,并将数据清理处理后的数据存入到Hive数据仓库中;
从所述Hive数据仓库中提取新闻文本数据,并通过预设的NLP模型从所述新闻文本数据中提取实体,所述实体包括融资公司名称、投资机构名称、人物名称、投融资轮次、投融资金额、公司估值、投融资时间以及投资类型;
根据从所述新闻文本数据中提取的实体建立投融资知识图谱,并将所述投融资知识图谱储存到预设的Neo4j图形数据库中;
将所述Hive数据仓库中的统计数据以及冗长属性数据储存到预设的Mysql关系型数据库中;
将所述Hive数据仓库中的复杂型数据储存到预设的ES数据库中。
2.根据权利要求1所述的投融资数据管理方法,其特征在于,所述NLP模型为BERT模型,所述通过预设的NLP模型从所述新闻文本数据中提取实体,包括:
采用BIO标注体系对所述新闻文本数据进行数据实体标注;
通过数据实体标注后的所述新闻文本数据对预设的BERT模型进行微调训练,并通过微调训练后的BERT模型对所述新闻文本数据中的实体进行识别。
3.根据权利要求1所述的投融资数据管理方法,其特征在于,所述方法还包括:
若接收到用户端发送的投融资关系查询请求,则根据所述投融资关系查询请求在所述...
【专利技术属性】
技术研发人员:赵寒枫,乔胜,刘新宇,黄鸿康,严博宇,
申请(专利权)人:深圳市新国都金服技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。