科技人才数据加工方法、系统、存储介质及终端技术方案

技术编号:28745082 阅读:25 留言:0更新日期:2021-06-06 18:07
本发明专利技术提供一种科技人才数据加工方法、系统、存储介质及终端,获取并标准化处理多个数据源的科技人才数据,以获得标准化科技人才数据;所述科技人才数据包括:身份识别数据和科研成果数据;基于所述科研成果数据的业务逻辑和所述身份识别数据,合并所述标准化科技人才数据以获得合并人才数据;编辑并审核所述合并人才数据,以建立科技人才数据库。本发明专利技术创建了为各企事业单位挖掘所需的科技人才提供了一个良好的平台;基于信息熵对数据进行类别划分,基于科研成果数据的业务逻辑对数据进行精准合并,基于爬虫技术对数据进行补充完善,从而实现科技人才数据的高效加工,不仅大幅度节约了人力成本,而且提高了数据的完整性、数据加工的质量和效率。加工的质量和效率。加工的质量和效率。

【技术实现步骤摘要】
科技人才数据加工方法、系统、存储介质及终端


[0001]本专利技术涉及数据处理
,特别是涉及科技人才数据加工方法、系统、存储介质及终端。

技术介绍

[0002]随着政府和社会对科研关注度的增加,科技人才的挖掘与查询服务已成为各企事业单位一个重要的需求,而科技人才的挖掘和查询的基础是一个准确而全面的人才数据库。目前,科技人才数据有着信息分散、数据更新不及时、数据不全面等问题。一方面,学术产出的成果分散于论文、专利、基金等相互独立的来源;另一方面,人才的通讯方式、履历信息、奖惩荣誉分散于各科研院所、高校或公司的网站,甚至没有信息。因此,如何将这些科研成果的信息打通,与人才相关网站、个人主页或其它互联网信息关联,刻画完整的人才画像,建立规范的人才数据库,提升科技人才数据质量与加工效率,成为一项亟需解决的技术问题。

技术实现思路

[0003]鉴于以上所述现有技术的缺点,本专利技术的目的在于提供科技人才数据加工方法、系统、存储介质及终端,用于解决现有技术中的科技人才数据信息分散、数据更新不及时、数据不全面的问题。
[0004]为实现上述目的及其它相关目的,本专利技术的第一方面提供一种科技人才数据加工方法,包括:获取并标准化处理多个数据源的科技人才数据,以获得标准化科技人才数据;所述科技人才数据包括:身份识别数据和科研成果数据;基于所述科研成果数据的业务逻辑和所述身份识别数据,合并所述标准化科技人才数据以获得合并人才数据;编辑并审核所述合并人才数据,以建立科技人才数据库。
[0005]于本专利技术的第一方面的一些实施例中,所述科研成果数据包括专利成果数据;所述标准化科技人才数据的合并方式包括:基于专利的业务逻辑,从专利数据库中提取与所述专利成果数据对应的PCT数据和同族专利数据,以获取同一人才名称的多种表达形式,并合并各表达形式名称对应的人才数据。
[0006]于本专利技术的第一方面的一些实施例中,所述编辑并审核所述合并人才数据,其包括:评价所述合并人才数据质量,以获取待编辑人才数据;对所述待编辑人才数据按照标准模板进行编辑,其包括:信息补充、人才新增、人才删除、人才合并、人才拆分。
[0007]于本专利技术的第一方面的一些实施例中,所述方法包括:在编辑所述待编辑人才数据之前,从网络和所述科技人才数据库中关联获取与所述待编辑人才数据匹配的数据,并按照匹配程度进行排序,以获取编辑提示内容。
[0008]于本专利技术的第一方面的一些实施例中,所述人才数据质量的评价维度包括:信息来源、身份可识别性、信息完整度和编辑历史。
[0009]于本专利技术的第一方面的一些实施例中,所述方法还包括:基于机构映射和人才名
称映射获取所述科技人才数据的待合并数据。
[0010]于本专利技术的第一方面的一些实施例中,所述方法包括:使用知识图谱算法对所述合并人才数据进行消歧。
[0011]为实现上述目的及其它相关目的,本专利技术的第二方面提供一种科技人才数据加工系统,包括:数据标准化模块,获取并标准化处理多个数据源的科技人才数据,以获得标准化科技人才数据;所述科技人才数据包括:身份识别数据和科研成果数据;数据合并模块,基于所述身份识别数据和所述科研成果数据的业务逻辑,合并所述标准化科技人才数据以获得合并人才数据;编辑与审核模块,编辑并审核所述合并人才数据,以建立科技人才数据库。
[0012]为实现上述目的及其它相关目的,本专利技术的第三方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述科技人才数据加工方法。
[0013]为实现上述目的及其它相关目的,本专利技术的第四方面提供一种电子终端,包括:处理器及存储器;所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行所述科技人才数据加工方法。
[0014]如上所述,本专利技术涉及的科技人才数据加工方法、系统、存储介质及终端,具有以下有益效果:从多个数据源获取科技人才数据并对其进行标准化、合并、编辑等操作,获取准确且完整的科技人才信息,为各企事业单位挖掘所需的科技人才提供了一个良好的平台;利用了自然语言处理技术和机器学习算法对获取的科技人才数据进行处理,实现人才数据的合并和消歧,降低了数据的冗余度,提高了数据的准确性和有效性;基于信息熵对数据进行类别划分,基于科研成果数据的业务逻辑对数据进行精准合并,基于爬虫技术对数据进行补充完善,从而实现科技人才数据的高效加工,不仅大幅度节约了人力成本,而且提高了数据的完整性;通过对合并后数据质量的评价确定需要进行编辑的数据及编辑的优先级,并且提供编辑提示内容,提高了数据加工的质量和效率;对所获得的的科技人才数据的建议合并项以及编辑后的数据进行审核,保障了加工后的科技人才数据的准确性;并且,加工后的数据定时或定量地同步到科技人才数据库,实现科技人才数据的及时更新完善,因此,本专利技术解决了现有技术的问题,实现了科技人才数据的集中性、完整性和准确性。
附图说明
[0015]图1显示为本专利技术一实施例中一种科技人才数据加工方法流程示意图。
[0016]图2显示为本专利技术一实施例中一种科技人才增量数据的加工流程示意图。
[0017]图3显示为本专利技术一实施例中一种科技人才数据加工方法的另一流程示意图。
[0018]图4显示为本专利技术一实施例中一种科技人才数据加工系统的结构示意图。
[0019]图5显示为本专利技术一实施例中一种科技人才加工系统的产品架构示意图。
[0020]图6显示为本专利技术一实施例中一种科技人才加工系统中任务流的状态机示意图。
[0021]图7显示为本专利技术一实施例中电子终端的结构示意图。
具体实施方式
[0022]以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书
所揭露的内容轻易地了解本专利技术的其它优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
[0023]需要说明的是,在下述描述中,参考附图,附图描述了本专利技术的若干实施例。应当理解,还可使用其它实施例,并且可以在不背离本专利技术的精神和范围的情况下进行机械组成、结构、电气以及操作上的改变。下面的详细描述不应该被认为是限制性的,并且本专利技术的实施例的范围仅由公布的专利的权利要求书所限定。这里使用的术语仅是为了描述特定实施例,而并非旨在限制本专利技术。空间相关的术语,例如“上”、“下”、“左”、“右”、“下面”、“下方”、“下部”、“上方”、“上部”等,可在文中使用以便于说明图中所示的一个元件或特征与另一元件或特征的关系。
[0024]在本专利技术中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”、“固持”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种科技人才数据加工方法,其特征在于,包括:获取并标准化处理多个数据源的科技人才数据,以获得标准化科技人才数据;所述科技人才数据包括:科研成果数据和身份识别数据;基于所述科研成果数据的业务逻辑和所述身份识别数据,合并所述标准化科技人才数据以获得合并人才数据;编辑并审核所述合并人才数据,以建立科技人才数据库。2.根据权利要求1所述的科技人才数据加工方法,其特征在于,所述科研成果数据包括专利成果数据;所述标准化科技人才数据的合并方式包括:基于专利的业务逻辑,从专利数据库中提取与所述专利成果数据对应的PCT数据和同族专利数据,以获取同一人才名称的多种表达形式,并合并各表达形式名称对应的人才数据。3.根据权利要求1所述的科技人才数据加工方法,其特征在于,所述编辑并审核所述合并人才数据,其包括:评价所述合并人才数据质量,以获取待编辑人才数据;对所述待编辑人才数据按照标准模板进行编辑,其包括:信息补充、人才新增、人才删除、人才合并、人才拆分。4.根据权利要求3所述的科技人才数据加工方法,其特征在于,所述方法包括:在编辑所述待编辑人才数据之前,从网络和所述科技人才数据库中关联获取与所述待编辑人才数据匹配的数据,并按照匹配程度进行排序,以获取编辑提示内容。5.根据权利要求3所述...

【专利技术属性】
技术研发人员:朱悦王茜王莹胡寅骏徐永斌
申请(专利权)人:上海市研发公共服务平台管理中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1