【技术实现步骤摘要】
一种基于科研多维特征的项目可行性预测分析方法
本专利技术属于大数据分析(BigDataAnalysis)
,是一种通过获取科研项目可行性报告中研究内容、技术路线、团队等信息,形成研究先进性、团队实力、内容相似性等多维特征,在与历史项目库对比比较的基础上,构建可行性预测模型判断项目先进性,并结合多类规则实现项目可行性分析和评价。
技术介绍
在项目可行性分析评估过程中,涉及到对项目研究内容是否与项目指南相匹配,研究内容是否具有先进性,项目团队是否具备实力等诸多因素。由于各类项目类型跨度大、研究方向多样、填写内容不一,缺少统一的评价方法和评价规则,使得项目是否可行主要通过人工方式来进行评价。即项目是否具备可行性主要基于专家经验来判断,具有较大的主观性。通过合理的特征提取,可以从项目可行性报告中提取相关关键字和主题、项目团队人员科研能力和研究基础,即转化为文本内容、关系网络和时间等特征属性,通过特征属性计算将项目可行性问题转变为二分类问题,判断项目是否可行或不可行,并提出可行性的判断理由和依据。因此,通过合理的选择特征,提取相 ...
【技术保护点】
1.一种基于科研多维特征的项目可行性预测分析方法,其特征在于,包括以下步骤:/n步骤一、定义项目可行性特征属性分类和表达方法,细粒度表示项目可行性特征以及约束,并通过主成分分析方式学习特征属性的权重;/n步骤二、评价特征属性提取和计算,提取本文内容特征和关系网络特征,计算相应评价特征属性的数值;/n步骤三、基于多层神经网络的项目可行性预测;/n步骤四、评分规则与特征属性的映射,并实现特征属性值计算;/n步骤五、基于评分规则的项目可行性分析;/n步骤六、给出项目可行性分析报告。/n
【技术特征摘要】
1.一种基于科研多维特征的项目可行性预测分析方法,其特征在于,包括以下步骤:
步骤一、定义项目可行性特征属性分类和表达方法,细粒度表示项目可行性特征以及约束,并通过主成分分析方式学习特征属性的权重;
步骤二、评价特征属性提取和计算,提取本文内容特征和关系网络特征,计算相应评价特征属性的数值;
步骤三、基于多层神经网络的项目可行性预测;
步骤四、评分规则与特征属性的映射,并实现特征属性值计算;
步骤五、基于评分规则的项目可行性分析;
步骤六、给出项目可行性分析报告。
2.根据权利要求1所述的方法,其特征在于,在所述步骤二中,本文内容特征包括题目、关键词、研究内容、科学问题、技术路线段落中抽取的关键词;关系网络特征包括人物合著网络中的学者地位中心性、基于PageRank的人物领域内影响力、团队聚类系数、相关成果影响力,以及关键词热度、团队实力;针对本文内容特征,采用LDA文档主题生成模型来表示和计算,其公式为:
表示文本特征属性poj在主题lti上的概率分布,该概率分布由LDA模型计算得到;越大说明文本特征属性poj与主题lti的相关度越高;则表示所有文本特征属性在主题上的概率分布加和。
3.根据权利要求2所述的方法,其特征在于,在所述步骤二中,考虑基于时间因素的特征叠加,即研究方向的热度;研究方向可表示为关键词的热度,通过以下公式表示:
其中Num(Δt)表示在规定的周期时间的数量,Sum(kw)表示获得得到的关键词数量;通过Nmax用于归一化为[0,1]值。
4.根据权利要求1或2所述的方法,其特征在于,在所述步骤二中,关系网络特征特征计算方法包括:
通过以下公式计算项目成员地位中心性:
其中,N代表学者关系网络中总节点的个数;代表网络中任意两节点i和j之间的最短路径,常用是用Dijkstra方法进行计算;
通过以下公式计算PageRank值:
其中是所有和该人物pi有直接合作关系的作者集合,L(pj)是作者pj的直接连接作者的数量,N是作者总数,α通常取0.85。
团队聚类系数定义为聚类系数Ci表达了节点i的所有邻节点间彼此连接的程度,ki是节...
【专利技术属性】
技术研发人员:王月,于建军,
申请(专利权)人:中国科学院计算机网络信息中心,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。