科技项目的运维风险评估方法、系统及存储介质技术方案

技术编号:38346692 阅读:14 留言:0更新日期:2023-08-02 09:26
本发明专利技术公开了一种科技项目的运维风险评估方法、系统及存储介质,该方法包括:对科技项目申报材料及其对应的评审报告材料进行数据特征提取,构建样本数据集;根据对样本数据集过采样处理后得到的均衡样本数据集,对混合随机森林算法的径向基神经网络进行训练,得到科技项目风险评估模型;对当前上传的科技项目文件进行数据特征提取,得到科技项目文件的项目评估指标;根据科技项目文件的项目评估指标,采用科技项目风险评估模型进行预测,得到科技项目文件的运维风险等级;本发明专利技术采用混合随机森林算法的径向基神经网络对上传的科技项目文件进行风险预测,可以减少传统专家评估模式导致的误差,提高科技项目文件进行运维风险评估的准确性。估的准确性。估的准确性。

【技术实现步骤摘要】
科技项目的运维风险评估方法、系统及存储介质


[0001]本专利技术涉及图像处理
,尤其涉及一种科技项目的运维风险评估方法、系统及存储介质。

技术介绍

[0002]科技项目是科技管理过程中的重要内容和抓手,当前科技竞争与科技自立自强对我国的科技项目管理提出了更高要求,并且面对激增的科学基金项目申请量,如何降低管理过程中人力、时间成本,并保证评审质量,便成为一个亟待解决的问题,对科技项目管理基本过程中进行智能审查,已成为提升科技项目选题合理性、立项客观性、执行合理性等方面评价的重要手段。在实际的科技项目管理过程中,将涉及到项目全生命周期的管理,这对科技管理能否取得良好的社会经济效益均起到重要作用,其中,有一大部分的科技项目管理工作,是需要进行项目的各方面审查。
[0003]传统的科技项目审查往往采用专家评估的形式,这形式可以较大程度的保障项目评估计的客观性,从第三方的视角出发,筛选出合适的项目立项,同时在项目执行和验收过程中,通过专家的评议意见,来判断项目是否达到了验收的标准,是否取得较好的经济社会效益。然而,该方法仍具有一定的局限性,在科技项目审查过程中,科技项目所需要上传的评审材料涉及范围广泛,评审材料质量参齐不齐,特征数据来源广泛等等特征,进而容易导致科技项目在人工审查阶段中消耗大量人力资源的同时,对某些评审结论无法给出合理的判断,因此,如何研究一种科技项目的智能辅助审查引擎,融合到项目管理中,以辅助科技项目管理成为本领域亟待解决的技术问题。

技术实现思路

[0004]本专利技术实施例提供一种科技项目的运维风险评估方法、系统及存储介质,其在充分利用历史专家评审知识的基础上,采用混合随机森林算法的径向基神经网络对上传的科技项目文件进行风险预测,可以减少传统专家评估模式导致的误差,提高科技项目文件进行运维风险评估的准确性。
[0005]第一方面,本专利技术实施例提供了一种科技项目的运维风险评估方法,包括:对预先采集的科技项目申报材料及其对应的评审报告材料进行数据特征提取,构建样本数据集;其中,所述样本数据集中每一个样本数据包括多个项目评估指标;对所述样本数据集进行过采样处理,得到均衡样本数据集;根据所述均衡样本数据集,对混合随机森林算法的径向基神经网络进行训练,得到科技项目风险评估模型;对当前上传的科技项目文件进行数据特征提取,得到当前上传的科技项目文件的项目评估指标;根据当前上传的科技项目文件的项目评估指标,采用所述科技项目风险评估模型进行项目运维风险预测,得到当前上传的科技项目文件的运维风险等级。
[0006]作为上述方案的改进,所述对预先采集的科技项目申报材料及其对应的评审报告材料进行数据特征提取,构建样本数据集,包括:对于每一份科技项目申报材料,对所述科技项目申报材料及其对应的评审报告材料进行电子化扫描处理;对电子化扫描处理后的科技项目申报材料及其对应的评审报告材料进行目标检测和OCR识别,获得相应科技项目申报材料的项目评估表单;所述项目评估表单记录了多个项目评估指标及其评分;将每一份科技项目申报材料的项目评估表单作为一个样本数据,构建样本数据集。
[0007]作为上述方案的改进,所述项目评估指标包括:查重率指标、投入与产出效率指标、可行性审查指标、技术可行性指标、真实性审查指标、达标性审查指标。
[0008]作为上述方案的改进,所述对所述样本数据集进行过采样处理,得到均衡样本数据集,包括:计算所述样本数据集中各个样本数据的缺失值;根据各个样本数据的缺失值,将所述样本数据集中的样本数据划分为多数类子数据集和少数类子数据集;对所述少数类子数据集进行过采样处理;根据过采样处理后的少数类子数据集和所述多数类子数据集,更新所述样本数据集;计算更新后的样本数据集的非均衡尺度,并判断更新后的样本数据集的非均衡尺度是否满足预设的阈值;若是,则将更新后的样本数据集作为均衡样本数据集;若否,则重新对更新后的样本数据集进行过采样处理。
[0009]作为上述方案的改进,所述计算所述样本数据集中各个样本数据的缺失值,包括:对于每一个样本数据,计算所述样本数据中缺失的项目评估指标的数量与项目评估指标总数量的比值,作为相应样本数据的缺失值。
[0010]作为上述方案的改进,所述根据各个样本数据的缺失值,将所述样本数据集中的样本数据划分为多数类子数据集和少数类子数据集,包括:判断各个样本数据的缺失值所属的数值区间;将属于最小数值区间的样本数据划分为多数类子数据集;将属于其他数值区间的样本数据划分为相应的少数类子数据集;其中,一个少数类子数据集对应一个其他数值区间的样本数据。
[0011]作为上述方案的改进,所述根据所述均衡样本数据集,对混合随机森林算法的径向基神经网络进行训练,得到科技项目风险评估模型,包括:对所述均衡样本数据集采用有放回随机抽取的方式,生成多个训练子集;对各个所述训练子集分别建立决策树,并设置分裂节点,获得决策森林;通过所述决策森林对样本数据中的多个项目评估指标进行特征选择,并将特征选择后得到项目评估指标输入到径向基神经网络进行训练,得到科技项目风险评估模型。
[0012]作为上述方案的改进,所述对当前上传的科技项目文件进行数据特征提取,得到
当前上传的科技项目文件的项目评估指标,包括:对于当前上传的科技项目文件进行电子化扫描处理;对电子化扫描处理后的科技项目文件进行数据增强处理;对数据增强处理后的科技项目文件进行目标检测和OCR识别,得到相应科技项目文件的多个项目评估指标。
[0013]第二方面,本专利技术实施例提供了一种科技项目的运维风险评估系统,包括:处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面中任意一项所述的科技项目的运维风险评估方法。
[0014]第三方面,本专利技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如第一方面中任意一项所述的科技项目的运维风险评估方法。
[0015]相对于现有技术,本专利技术实施例的有益效果在于:对预先采集的科技项目申报材料及其对应的评审报告材料进行数据特征提取,构建样本数据集;其中,所述样本数据集中每一个样本数据包括多个项目评估指标;对所述样本数据集进行过采样处理,得到均衡样本数据集;根据所述均衡样本数据集,对混合随机森林算法的径向基神经网络进行训练,得到科技项目风险评估模型;对当前上传的科技项目文件进行数据特征提取,得到当前上传的科技项目文件的项目评估指标;根据当前上传的科技项目文件的项目评估指标,采用所述科技项目风险评估模型进行项目运维风险预测,得到当前上传的科技项目文件的运维风险等级;本专利技术实施例通过过采样技术对样本数据进行均衡,以解决在科技项目评估过程中存在的数据样本量不足/不均衡情况以及某些低质量的负面样本稀缺的问题,从而提高预测结果的可靠性,同时在充分利用历史专家评审知识的基础上,采用混合随机森林算法的径向基神经网络对上传的科技项目文本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种科技项目的运维风险评估方法,其特征在于,包括:对预先采集的科技项目申报材料及其对应的评审报告材料进行数据特征提取,构建样本数据集;其中,所述样本数据集中每一个样本数据包括多个项目评估指标;对所述样本数据集进行过采样处理,得到均衡样本数据集;根据所述均衡样本数据集,对混合随机森林算法的径向基神经网络进行训练,得到科技项目风险评估模型;对当前上传的科技项目文件进行数据特征提取,得到当前上传的科技项目文件的项目评估指标;根据当前上传的科技项目文件的项目评估指标,采用所述科技项目风险评估模型进行项目运维风险预测,得到当前上传的科技项目文件的运维风险等级。2.如权利要求1所述的科技项目的运维风险评估方法,其特征在于,所述对预先采集的科技项目申报材料及其对应的评审报告材料进行数据特征提取,构建样本数据集,包括:对于每一份科技项目申报材料,对所述科技项目申报材料及其对应的评审报告材料进行电子化扫描处理;对电子化扫描处理后的科技项目申报材料及其对应的评审报告材料进行目标检测和OCR识别,获得相应科技项目申报材料的项目评估表单;所述项目评估表单记录了多个项目评估指标及其评分;将每一份科技项目申报材料的项目评估表单作为一个样本数据,构建样本数据集。3.如权利要求2所述的科技项目的运维风险评估方法,其特征在于,所述项目评估指标包括:查重率指标、投入与产出效率指标、可行性审查指标、技术可行性指标、真实性审查指标、达标性审查指标。4.如权利要求1所述的科技项目的运维风险评估方法,其特征在于,所述对所述样本数据集进行过采样处理,得到均衡样本数据集,包括:计算所述样本数据集中各个样本数据的缺失值;根据各个样本数据的缺失值,将所述样本数据集中的样本数据划分为多数类子数据集和少数类子数据集;对所述少数类子数据集进行过采样处理;根据过采样处理后的少数类子数据集和所述多数类子数据集,更新所述样本数据集;计算更新后的样本数据集的非均衡尺度,并判断更新后的样本数据集的非均衡尺度是否满足预设的阈值;若是,则将更新后的样本数据集作为均衡样本数据集;若否,则重新对更新后的样本数据集进行过采样处理。5.如权利要求4所述的科技...

【专利技术属性】
技术研发人员:陈建敏罗亮马志平蔡建新林珠石慧芳
申请(专利权)人:广东省科技基础条件平台中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1