一种基于学科发展的科研能力评估用数据采集系统技术方案

技术编号:33133347 阅读:39 留言:0更新日期:2022-04-17 00:54
本发明专利技术公开了一种基于学科发展的科研能力评估用数据采集系统,具体涉及科研能力评估技术领域,本发明专利技术通过随机选择聚类阈值,并通过随机算法确定类聚类数据的基本重要特征,再通过聚类算法对特征进行聚类,得到归类完成的特征数据,然后进行深度计算类别特征的平均区分数值,并通过降维排列得到数据特征通过折线图明确表示,即可得出准确评估数据,并通过置信度和支撑度的建立找出给定满足的最小支持度及最小可信度,并进行关联规则的挖掘分析,随后通过量化计算得出量化成果指标值,则通过以上聚类处理,降维排列及数据的关联分析处理确保提取准确的信息,进而可以为后续评估奠定切实基础,提高科研成果评估的可信性真实性。提高科研成果评估的可信性真实性。提高科研成果评估的可信性真实性。

【技术实现步骤摘要】
一种基于学科发展的科研能力评估用数据采集系统


[0001]本专利技术涉及科研能力评估
,更具体地说,本专利技术涉及一种基于学科发展的科研能力评估用数据采集系统。

技术介绍

[0002]科技是第一生产力,科学研究是高等医学院校的基本职能之一,附属医院作为医学院校的重要组成部分,除承担着治病救人的职能外,科研工作也是其重要组成部分,同时科研能力是衡量医学院校综合实力的重要指标之一,医学作为一门高度分化又高度综合的学科,强势的学科建设是实现医院可持续发展的关键之一,学科建设作为医院建设发展的一项基础工程,承担着长期的战略性任务。
[0003]科研能力评估是旨在提高科技管理与科技决策水平的科技咨询活动,按照特定的目的,遵循一定的原则、程序和指标,运用科学、公正和可行的方法对科技活动及其相关环境进行综合分析和判断,并作出定性及定量的评价与估量,科研能力评估不能只局限于科技活动本身,还要考虑科技活动所处的环境条件因素及其所产生的效果,要全面地描述科研实力、准确地把握科研实力,应该采用若干指标来橘述科研实力的内部结构,以完整的指标体系来全面综合描述科研实力,充分发挥指标体系的科学评价考核作用及对于科研发展的导向作用。
[0004]而一所医院的科研水平取决于医生的科研能力,其中科研能力评估是检验科研水平的有效办法之一,同时也为加强医院科研管理和制定科研发展规划策略提供参考依据,而在对科研能力进行评估的过程中往往需要先对评估数据进行采集,现有技术中一般根据量化评价的特点,为了更好地描述科研成果的定性特征,经常需要对所评估人员的科研成果进行数据采集,但是一般采集时只是单单的考虑科研成果的数量,没有考虑到科研人员在科研成果中的排名,使得科研评估的准确性较低,而且由于信息来源的多样性和数据结构的复杂性等原因,从而很难提取到准确的有效信息,并且也不会对采集到的数据进行关联性分析,使得数据较为分散,不便于后续评估使用,因此,研究一种基于学科发展的科研能力评估用数据采集系统来解决上述问题具有重要意义。

技术实现思路

[0005]为了克服现有技术的上述缺陷,本专利技术提供了一种基于学科发展的科研能力评估用数据采集系统,本专利技术所要解决的技术问题是:现有技术中一般根据量化评价的特点,为了更好地描述科研成果的定性特征,经常需要对所评估人员的科研成果进行数据采集,但是一般采集时只是单单的考虑科研成果的数量,没有考虑到科研人员在科研成果中的排名,使得科研评估的准确性较低,而且由于信息来源的多样性和数据结构的复杂性等原因,从而很难提取到准确的有效信息,并且也不会对采集到的数据进行关联性分析,使得数据较为分散,不便于后续评估使用的问题。
[0006]为实现上述目的,本专利技术提供如下技术方案:一种基于学科发展的科研能力评估
用数据采集系统,包括数据挖掘模块、数据上报模块和互联网,所述互联网的输出端与数据挖掘模块的输入端电连接,所述数据挖掘模块的输出端与数据预处理模块的输入端电连接,所述数据上报模块的输出端与数据预处理模块的输入端电连接,所述数据预处理模块的输出端与特征提取模块的输入端电连接,所述特征提取模块的输出端与调研校正模块的输入端电连接。
[0007]所述调研校正模块的输出端与聚类分析模块的输入端电连接,所述聚类分析模块的输出端与关联模块的输入端电连接,所述关联模块的输出端与量化计算模块的输入端电连接,所述量化计算模块的输出端与数据降维模块的输入端电连接,所述数据降维模块的输出端与数据库的输入端电连接,所述数据库的输出端与特征提取模块的输入端电连接。
[0008]作为本专利技术的进一步方案:所述数据上报模块包括文字录入模块、语音录入模块和图像录入模块,所述文字录入模块、语音录入模块和图像录入模块的输出端与数据预处理模块的输入端电连接。
[0009]作为本专利技术的进一步方案:所述数据挖掘中挖掘的相关数据为:与科研能力相关的数据,所述科研能力包括科技创新能力、科技转化能力、科技竞争能力和科技支撑能力,所述科技创新能力理论创新、技术创新和协同创新三个要素,所述科技转换能力包括军事效益和经济效益两个要素,所述科技竞争能力包括学术竞争、人才竞争和发展潜力三个要素,所述科技支撑能力包括平台支撑和管理支撑两个要素。
[0010]作为本专利技术的进一步方案:所述数据挖掘模块的具体挖掘步骤为:借助网络爬虫工具进行爬取数据,借助Scrapy抓取框架快速高层次的跨屏幕抓取网络上数据,同时从页面中抓取结构化数据,利用基于Python的Scrapy技术框架实现在网站中进行数据抓取,然后根据评估数据的需要,通过数据挖掘对抓取的数据进行关联算法分析。
[0011]作为本专利技术的进一步方案:所述数据预处理的具体步骤为:先将爬取的数据转换为计算机可以识别和运算的数据集,剔除异常数据,并检查数据拼写错误、去掉数据重复记录,然后通过推导计算缺失的数据并补上不完全的记录数据,通过滤波技术和数据清洗去除数据中的干扰和噪声,并对有用信息进行加强处理。
[0012]作为本专利技术的进一步方案:所述聚类分析模块的具体实现步骤如下:
[0013]S1、随机选择聚类的阈值,通过随机算法进行确定每个簇的类别,并使用聚类算法对调研校正后的数据进行聚类,得到具有类别的聚类: C={C1,C2,

,C
k
},然后计算每个特征中任何一个簇到其他簇之间的区分度。
[0014]S2、并计算其在不同类别之间的区分度的平均值Mean
i
,然后进一步计算每个特征上不同类别之间平均区分度的最大值Max
i
和最小值Min
i
,然后计算每个特征在不同类别上的区分度,即f
i
=(Max
i

Min
i
)/Mean
i
,然后对特征按照f
i
降序排列得到f
i*
(i=1,2,

,m)。
[0015]S3、将上述得到的结果通过折线图来表示,并在折线图中找到变化剧烈的点或拐点i0,即为选择的特征子集,并由此特征子集共同构成特征聚类分析文档。
[0016]作为本专利技术的进一步方案:所述关联模块的具体关联步骤和规则为:
[0017]设I={i1,i2,

i
m
}是m个不同的项目的集合,给定一个事务数据库D,其中的每一个事务T是I中一组项目的集合,即T有唯一的标识符TID,关联规则是形如的蕴含式,其中X∩Y=Φ,关联规则成立的条件是支持度S和置信度C,所述支
持度S中,D中至少有S%的事务包含 X∪Y,即所述置信度C中,在D所包含X的事务中,至少有C%的事务同时也包含Y,即关联规则的挖掘问题就是在事务数据库D中找出具有用户给定的满足最小支持度S
min
和最小置信度C
min
的关联规则。
[0018]作为本专利技术的进一步方案:所述量化计算模块的计算公式为:
...

【技术保护点】

【技术特征摘要】
1.一种基于学科发展的科研能力评估用数据采集系统,包括数据挖掘模块、数据上报模块和互联网,其特征在于:所述互联网的输出端与数据挖掘模块的输入端电连接,所述数据挖掘模块的输出端与数据预处理模块的输入端电连接,所述数据上报模块的输出端与数据预处理模块的输入端电连接,所述数据预处理模块的输出端与特征提取模块的输入端电连接,所述特征提取模块的输出端与调研校正模块的输入端电连接;所述调研校正模块的输出端与聚类分析模块的输入端电连接,所述聚类分析模块的输出端与关联模块的输入端电连接,所述关联模块的输出端与量化计算模块的输入端电连接,所述量化计算模块的输出端与数据降维模块的输入端电连接,所述数据降维模块的输出端与数据库的输入端电连接,所述数据库的输出端与特征提取模块的输入端电连接。2.根据权利要求1所述的一种基于学科发展的科研能力评估用数据采集系统,其特征在于:所述数据上报模块包括文字录入模块、语音录入模块和图像录入模块,所述文字录入模块、语音录入模块和图像录入模块的输出端与数据预处理模块的输入端电连接。3.根据权利要求1所述的一种基于学科发展的科研能力评估用数据采集系统,其特征在于:所述数据挖掘中挖掘的相关数据为:与科研能力相关的数据,所述科研能力包括科技创新能力、科技转化能力、科技竞争能力和科技支撑能力,所述科技创新能力理论创新、技术创新和协同创新三个要素,所述科技转换能力包括军事效益和经济效益两个要素,所述科技竞争能力包括学术竞争、人才竞争和发展潜力三个要素,所述科技支撑能力包括平台支撑和管理支撑两个要素。4.根据权利要求3所述的一种基于学科发展的科研能力评估用数据采集系统,其特征在于:所述数据挖掘模块的具体挖掘步骤为:借助网络爬虫工具进行爬取数据,借助Scrapy抓取框架快速高层次的跨屏幕抓取网络上数据,同时从页面中抓取结构化数据,利用基于Python的Scrapy技术框架实现在网站中进行数据抓取,然后根据评估数据的需要,通过数据挖掘对抓取的数据进行关联算法分析。5.根据权利要求4所述的一种基于学科发展的科研能力评估用数据采集系统,其特征在于:所述数据预处理的具体步骤为:先将爬取的数据转换为计算机可以识别和运算的数据集,剔除异常数据,并检查数据拼写错误、去掉数据重复记录,然后通过推导计算缺失的数据并补上不完全的记录数据,通过滤波技术和数据清洗去除数据中的干扰和噪声,并对有用信息进行加强处理。6.根据权利要求1所述的一种基于学科发展的科研能力评估用数据采集系统,其特征在于:所述聚类分析模块的具体实现步骤如下:S1、随机选择聚类的阈值,通过随机算法进行确定每个簇的类别,并使用聚类算法对调研校正后的数据进行聚类,得到具有类别的聚类:C={C1,C2,

,C
k
},然后计算每个特征中任何一个簇到其他簇之间的区分度;S2、并计算其在不同类别之间的区分度的平均值Mean
i
,然后进一步计算每个特征上不同类别之间平均区分度的最大值Max
i
和最小值Min
i

【专利技术属性】
技术研发人员:武青松张颖聪马鸣向璨陈实吴建才
申请(专利权)人:华中科技大学同济医学院附属协和医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1