当前位置: 首页 > 专利查询>徐佳慧专利>正文

面向投融资关系网络链路预测的方法、装置和设备制造方法及图纸

技术编号:24518444 阅读:15 留言:0更新日期:2020-06-17 07:05
本发明专利技术实施例公开了面向投融资关系网络链路预测的方法、装置和设备,该方法包括:获取目标风投机构的特征向量;获取创业公司特征向量组;对目标风投机构的中最近一次所投创业公司的特征进行处理生成目标风投机构投资的最近一次创业公司的特征向量;根据特征向量、创业公司的成立时间差和创业公司的时间差的特征进行处理并更新;筛选出在目标时间段内初创公司或者获得过投资的创业公司;构建面向投融资关系网络链路预测的深度学习模型;基于模型对目标风投机构进行未来投资关系的预测,并按照模型的预测值显示预设数量的创业公司。本发明专利技术可以挖掘风投机构自身投资特点以及创业公司特征,发现符合自身投资特点的创业公司。

【技术实现步骤摘要】
面向投融资关系网络链路预测的方法、装置和设备
本专利技术实施例涉及信息处理领域,具体涉及面向投融资关系网络链路预测的方法、装置和设备。
技术介绍
风险投资在创业公司的融资过程中起到了很大的作用。风险投资是拥有充足资金的投资机构对具备良好的发展前景,缺乏启动资金的创业公司进行投资,但同时承担在该阶段投资失败的投资。风投机构关心的是企业的发展前景,通常采用股权方式投资,失败时无偿还风险。根据美国全美风险投资协会的定义,风险投资是由职业金融家投入到新兴的、迅速发展的、具有巨大竞争潜力的企业中的一种权益资本。风投机构从市场上选择未上市的创业企业中选出最具有获利潜力的投资项目,而风投机构通常需要投入大量的人力物力对创业企业进行调研,耗时耗力,在此期间极有可能错过适合自身的优秀企业。如何挖掘风投机构自身投资特点以及创业公司特征,发现符合自身投资特点的创业公司是一个亟待解决的问题。
技术实现思路
本专利技术实施例的目的在于提供面向投融资关系网络链路预测的方法、装置和设备,用以挖掘风投机构自身投资特点以及创业公司特征,发现符合自身投资特点的创业公司。为实现上述目的,本专利技术实施例主要提供如下技术方案:第一方面,本专利技术实施例提供了一种面向投融资关系网络链路预测的方法,包括:S1:从投融资新闻和投资关系中提取目标风投机构的特征向量;S2:从各风投机构历史投资关系中提取的创业公司特征向量组;S3:对所述目标风投机构的中最近一次所投创业公司的特征进行处理生成所述目标风投机构投资的最近一次创业公司的特征向量;S4:根据所述特征向量、创业公司的成立时间差和所述创业公司的时间差的特征进行处理,并更新所述特征向量、所述创业公司的特征向量组和所述目标风投机构投资的最近一次创业公司的特征向量;S5:筛选出在目标时间段内初创公司或者获得过投资的创业公司,对所述目标风投机构投资过的创业机构和未投资的创业机构进行标记;S6:构建初始面向投融资关系网络链路预测的深度学习模型;S7:对所述初始面向投融资关系网络链路预测的深度学习模型进行训练和测试得到目标面向投融资关系网络链路预测的深度学习模型;S8:基于所述目标面向投融资关系网络链路预测的深度学习模型对所述目标风投机构进行未来投资关系的预测,并按照模型的预测值显示预设数量的创业公司。根据本专利技术的一个实施例,步骤S1包括:S1-1:选取特定的投融资新闻文本,采用训练模式为Skip-gram的Word2Vec算法对其进行训练,获得基于新闻文本的目标风投机构的词向量Vvc1;S1-2:从投资关系有向图中计算所述目标风投机构的重要性指标,获得基于投资关系有向图的目标风投机构的词向量Vvc2;S1-3:从投资历史行为中统计投资行为特征,分别为所述目标风投机构以往各投资轮次的创业公司数量、投资时间间隔平均值、投资时间间隔中位数、投资时间间隔众数,获得基于投资历史行为统计信息的风投机构的词向量Vvc3;S1-4:对词向量Vvc1、词向量Vvc2和词向量Vvc3进行拼接生成所述目标风投机构的特征向量Vvc。根据本专利技术的一个实施例,步骤S2包括:S2-1:将各创业公司的离散行业标签以及对应的投资轮次由One-Hot编码处理生成创业公司特征向量Vs1;S2-2:计算创业公司的成立时间差衰减值te1,添加到创业公司特征向量Vs1中;S2-3:筛选出所述目标风投机构中除最近一次所投创业公司之外,其他所投资的前Ni家创业公司,按照投资时间次序组合,生成所述目标风投机构的历史投资创业公司的特征向量组Vh-starups。根据本专利技术的一个实施例,在步骤S4中还包括:通过以下公式对特征向量Vvc、创业公司的特征向量组Vh-starups和目标风投机构投资的最近一次创业公司的特征向量Vl-starups进行Z-score标准化处理:其中:x为所有样本数据的原始值,μ为所有样本数据的均值,σ为所有样本数据的标准差,x*为所有样本数据归一化后的数值。根据本专利技术的一个实施例,步骤S6包括:S6-1:对所述目标风投机构投资的最近一次创业公司的特征向量Vl-starup中的行业标签以及投资轮次这两项维度的离散稀疏部分进行embedding数据压缩处理,转换成稠密向量,并与对应的创业公司的稠密向量进行拼接,生成最新投资领域特征向量Vl-field,构建神经元数量为Nl-embd的新投资的创业公司嵌入层;S6-2:对所述目标风投机构的历史投资创业公司的特征向量组Vh-starups中的行业标签以及投资轮次这两项维度的离散稀疏部分进行embedding数据压缩处理,转换成稠密向量,并与对应的创业公司的稠密向量进行拼接,构建各个神经元数量为Nh-embd的历史投资的创业公司组嵌入层;S6-3:将各个神经元数量为Nh-embd的历史投资的创业公司组嵌入层连接Transformer模型网络结构,对输出进行平均池化处理后生成历史投资领域特征向量Vh-field,构建历史投资领域提取层;S6-4:将历史投资领域特征向量Vh-field与最新投资领域特征向量Vl-field,通过一个神经元数量为Na的注意力网络结构,训练各特征的权重wa,输出投资领域组合特征Vfield。S6-5:将投资领域组合层的输出Vfield和特征向量Vvc进行拼接,生成新的特征向量Vinput,将特征向量Vinput输入进一个各层神经元个数为Nd的Ld层全连接神经网络层来训练获得向量通过Sigmoid激活函数生成最终的预测值向量Voutput。第二方面,本专利技术实施例还提供一种面向投融资关系网络链路预测的装置,包括:获取模块,用于获取投融资新闻和投资关系;控制处理模块,用于从投融资新闻和投资关系中提取目标风投机构的特征向量,并从各风投机构历史投资关系中提取的创业公司特征向量组;所述控制处理模块还用于对所述目标风投机构的中最近一次所投创业公司的特征进行处理生成所述目标风投机构投资的最近一次创业公司的特征向量,并根据所述特征向量、创业公司的成立时间差和所述创业公司的时间差的特征进行处理,并更新所述特征向量、所述创业公司的特征向量组和所述目标风投机构投资的最近一次创业公司的特征向量;所述控制处理模块还用于筛选出在目标时间段内初创公司或者获得过投资的创业公司,对所述目标风投机构投资过的创业机构和未投资的创业机构进行标记;所述控制处理模块还用于构建初始面向投融资关系网络链路预测的深度学习模型,并对所述初始面向投融资关系网络链路预测的深度学习模型进行训练和测试得到目标面向投融资关系网络链路预测的深度学习模型;预测显示模块,用于基于所述目标面向投融资关系网络链路预测的深度学习模型对所述目标风投机构进行未来投资关系的预测,并按照模型的预测值显示预设数量的创业公司。根据本专利技术的一个实施例,所述控制处理模块用于选取特定的投融资新闻文本,采用训练模式为Skip-gram的Word2Vec算法对其进行训练,获得基于新闻文本的目标风投机构的词向量Vvc1;从投资关系有向图中计算所述目标风投机构的重要性指标,获得基于投资关系有向图的目标风投机构的本文档来自技高网...

【技术保护点】
1.一种面向投融资关系网络链路预测的方法,其特征在于,包括:/nS1:从投融资新闻和投资关系中提取目标风投机构的特征向量;/nS2:从各风投机构历史投资关系中提取的创业公司特征向量组;/nS3:对所述目标风投机构的中最近一次所投创业公司的特征进行处理生成所述目标风投机构投资的最近一次创业公司的特征向量;/nS4:根据所述特征向量、创业公司的成立时间差和所述创业公司的时间差的特征进行处理,并更新所述特征向量、所述创业公司的特征向量组和所述目标风投机构投资的最近一次创业公司的特征向量;/nS5:筛选出在目标时间段内初创公司或者获得过投资的创业公司,对所述目标风投机构投资过的创业机构和未投资的创业机构进行标记;/nS6:构建初始面向投融资关系网络链路预测的深度学习模型;/nS7:对所述初始面向投融资关系网络链路预测的深度学习模型进行训练和测试得到目标面向投融资关系网络链路预测的深度学习模型;/nS8:基于所述目标面向投融资关系网络链路预测的深度学习模型对所述目标风投机构进行未来投资关系的预测,并按照模型的预测值显示预设数量的创业公司。/n

【技术特征摘要】
1.一种面向投融资关系网络链路预测的方法,其特征在于,包括:
S1:从投融资新闻和投资关系中提取目标风投机构的特征向量;
S2:从各风投机构历史投资关系中提取的创业公司特征向量组;
S3:对所述目标风投机构的中最近一次所投创业公司的特征进行处理生成所述目标风投机构投资的最近一次创业公司的特征向量;
S4:根据所述特征向量、创业公司的成立时间差和所述创业公司的时间差的特征进行处理,并更新所述特征向量、所述创业公司的特征向量组和所述目标风投机构投资的最近一次创业公司的特征向量;
S5:筛选出在目标时间段内初创公司或者获得过投资的创业公司,对所述目标风投机构投资过的创业机构和未投资的创业机构进行标记;
S6:构建初始面向投融资关系网络链路预测的深度学习模型;
S7:对所述初始面向投融资关系网络链路预测的深度学习模型进行训练和测试得到目标面向投融资关系网络链路预测的深度学习模型;
S8:基于所述目标面向投融资关系网络链路预测的深度学习模型对所述目标风投机构进行未来投资关系的预测,并按照模型的预测值显示预设数量的创业公司。


2.根据权利要求1所述的面向投融资关系网络链路预测的方法,其特征在于,步骤S1包括:
S1-1:选取特定的投融资新闻文本,采用训练模式为Skip-gram的Word2Vec算法对其进行训练,获得基于新闻文本的目标风投机构的词向量Vvc1;
S1-2:从投资关系有向图中计算所述目标风投机构的重要性指标,获得基于投资关系有向图的目标风投机构的词向量Vvc2;
S1-3:从投资历史行为中统计投资行为特征,分别为所述目标风投机构以往各投资轮次的创业公司数量、投资时间间隔平均值、投资时间间隔中位数、投资时间间隔众数,获得基于投资历史行为统计信息的风投机构的词向量Vvc3;
S1-4:对词向量Vvc1、词向量Vvc2和词向量Vvc3进行拼接生成所述目标风投机构的特征向量Vvc。


3.根据权利要求2所述的面向投融资关系网络链路预测的方法,其特征在于,步骤S2包括:
S2-1:将各创业公司的离散行业标签以及对应的投资轮次由One-Hot编码处理生成创业公司特征向量Vs1;
S2-2:计算创业公司的成立时间差衰减值te1,添加到创业公司特征向量Vs1中;
S2-3:筛选出所述目标风投机构中除最近一次所投创业公司之外,其他所投资的前Ni家创业公司,按照投资时间次序组合,生成所述目标风投机构的历史投资创业公司的特征向量组Vh-starups。


4.根据权利要求3所述的面向投融资关系网络链路预测的方法,其特征在于,在步骤S4中还包括:
通过以下公式对特征向量Vvc、创业公司的特征向量组Vh-starups和目标风投机构投资的最近一次创业公司的特征向量Vl-starups进行Z-score标准化处理:



其中:x为所有样本数据的原始值,μ为所有样本数据的均值,σ为所有样本数据的标准差,x*为所有样本数据归一化后的数值。


5.根据权利要求4所述的面向投融资关系网络链路预测的方法,其特征在于,步骤S6包括:
S6-1:对所述目标风投机构投资的最近一次创业公司的特征向量Vl-starup中的行业标签以及投资轮次这两项维度的离散稀疏部分进行embedding数据压缩处理,转换成稠密向量,并与对应的创业公司的稠密向量进行拼接,生成最新投资领域特征向量Vl-field,构建神经元数量为Nl-embd的新投资的创业公司嵌入层;
S6-2:对所述目标风投机构的历史投资创业公司的特征向量组Vh-starups中的行业标签以及投资轮次这两项维度的离散稀疏部分进行embedding数据压缩处理,转换成稠密向量,并与对应的创业公司的稠密向量进行拼接,构建各个神经元数量为Nh-embd的历史...

【专利技术属性】
技术研发人员:徐佳慧裴乐琪郝庆一
申请(专利权)人:徐佳慧
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1