一种分类模型训练方法、分类方法及系统技术方案

技术编号:24355205 阅读:94 留言:0更新日期:2020-06-03 02:24
本申请公开了一种分类模型训练方法、分类方法及系统,包括:获取项目的参与人员的项目执行信息,参与人员根据项目执行信息被划分为多种类型;根据项目执行信息,获取影响参与人员所属类型的影响因素信息,其中,影响一个参与人员所属类型的影响因素信息包括一个参与人员对项目的贡献信息、一个参与人员产生的与项目相关的社交信息以及一个参与人员参与项目的时间信息;使用影响因素信息,对分类模型进行训练;其中,分类模型用于根据项目参与人员的项目执行信息输出指示信息,指示信息用于指示项目参与人员所属的类型。根据本申请实施例训练得到的分类模型可对目标项目中的参与人员进行分类。

A training method, classification method and system of classification model

【技术实现步骤摘要】
一种分类模型训练方法、分类方法及系统
本申请涉及通信
,尤其涉及一种分类模型训练方法、分类方法及系统。
技术介绍
开放源代码社区又称为开源社区,由拥有共同兴趣爱好的研发人员组成,根据相应的开源软件许可证协议公布软件源代码的网络平台,同时也为研发人员提供一个自由学习交流的空间。当前,在关于研发人员地位的应用研究中,大多数采用开源社区的公开数据,这是由于开源社区的公开数据便于获取,且其数据结构经过了科学化的处理,可使研究人员能够最大程度上模拟企业内的真实场景。研发人员的地位主要分为核心研发人员和普通研发人员,通过对研发人员地位的分类预测,可使企业管理者在评估众多研发人员时,能够更加全面的评估一名研发人员的发展潜力和培养价值。现有技术中,主要通过研发人员分类指标(代码量、代码提交次数和邮件收发数)来衡量研发人员的地位;或者使用问卷、访谈、经验汇总等定量分析方法来进行研发人员的地位分类。上述研发人员地位分类方法中,存在计算过于简单容错率较高;或者具有较强的主观性,难以作为统一的逻辑体系从客观的角度评判研发人员的地位。
技术实现思路
本申请实施例提供一种分类模型训练方法、分类方法及系统,用以根据训练得到的分类模型对目标项目中的参与人员进行分类。第一方面,提供一种分类模型训练方法,包括:获取项目的参与人员的项目执行信息,所述参与人员根据所述项目执行信息被划分为多种类型;根据所述项目执行信息,获取影响所述参与人员所属类型的影响因素信息,其中,影响一个参与人员所属类型的影响因素信息包括所述一个参与人员对所述项目的贡献信息、所述一个参与人员产生的与所述项目相关的社交信息以及所述一个参与人员参与所述项目的时间信息;使用所述影响因素信息,对分类模型进行训练;其中,所述分类模型用于根据项目参与人员的项目执行信息输出指示信息,所述指示信息用于指示所述项目参与人员所属的类型。可选地,所述项目为开源软件开发项目;所述多种类型包括:技术型核心参与人员、社交型核心参与人员以及普通参与人员;其中,所述技术型核心参与人员的数量或所述社交型核心参与人员的数量占所述开源软件开发项目参与人员总数的设定比例。可选地,所述一个参与人员对所述开源软件开发项目的贡献信息,包括以下部分或全部信息:所述一个参与人员提交的软件编程代码行数;所述一个参与人员提交软件编程代码的次数;所述一个参与人员提交的软件编程文件数。可选地,所述一个参与人员产生的与所述开源软件开发项目相关的社交信息,包括以下部分或全部信息:所述一个参与人员接收的与所述开源软件开发项目相关的邮件数;所述一个参与人员发送的与所述开源软件开发项目相关的邮件数;所述一个参与人员所接收的邮件中,来源于不同发件人的人员数;所述一个参与人员所发送的邮件中,发向不同收件人的人员数。可选地,所述一个参与人员参与所述开源软件开发项目的时间信息,包括以下部分或全部信息:所述一个参与人员加入所述开源软件开发项目的起始时间;所述一个参与人员离开所述开源软件开发项目的截止时间;所述一个参与人员参与所述开源软件开发项目的时间长度。第二方面,提供一种分类方法,应用于使用如第一方面中任一项所述的分类模型进行项目参与人员类型分类的过程,包括:获取项目的参与人员的项目执行信息;根据所述项目执行信息,获取影响所述参与人员所属类型的影响因素信息,其中,影响所述参与人员所属类型的影响因素信息包括所述参与人员对所述项目的贡献信息、所述参与人员产生的与所述项目相关的社交信息以及所述参与人员参与所述项目的时间信息;使用所述分类模型,对所述项目的参与人员进行分类。可选地,所述项目为开源软件开发项目;对所述项目的参与人员进行分类后得到的类型包括以下中的一种:技术型核心参与人员、社交型核心参与人员以及普通参与人员。可选地,所述参与人员对所述开源软件开发项目的贡献信息,包括以下部分或全部信息:所述参与人员提交的软件编程代码行数;所述参与人员提交软件编程代码的次数;所述参与人员提交的软件编程文件数。可选地,所述参与人员产生的与所述开源软件开发项目相关的社交信息,包括以下部分或全部信息:所述参与人员接收的与所述开源软件开发项目相关的邮件数;所述参与人员发送的与所述开源软件开发项目相关的邮件数;所述参与人员接收的与所述开源软件开发项目相关的邮件的发件人信息;所述参与人员发送的与所述开源软件开发项目相关的邮件的收件人信息。可选地,所述参与人员参与所述开源软件开发项目的时间信息,包括以下部分或全部信息:所述参与人员加入所述开源软件开发项目的起始时间;所述参与人员所接收的邮件中,来源于不同发件人的人员数;所述参与人员所发送的邮件中,发向不同收件人的人员数。可选地,所述使用所述分类模型,对所述项目的参与人员进行分类,包括:根据所述分类模型的输出信息,确定所述项目的参与人员的类型。第三方面,提供一种分类模型训练系统,包括:第一获取单元:用于获取项目的参与人员的项目执行信息,所述参与人员根据所述项目执行信息被划分为多种类型;第二获取单元:用于根据所述项目执行信息,获取影响所述参与人员所属类型的影响因素信息,其中,影响一个参与人员所属类型的影响因素信息包括所述一个参与人员对所述项目的贡献信息、所述一个参与人员产生的与所述项目相关的社交信息以及所述一个参与人员参与所述项目的时间信息;训练单元:用于使用所述影响因素信息,对分类模型进行训练;其中,所述分类模型用于根据项目参与人员的项目执行信息输出指示信息,所述指示信息用于指示所述项目参与人员所属的类型。可选地,所述项目为开源软件开发项目;所述多种类型包括:技术型核心参与人员、社交型核心参与人员以及普通参与人员;其中,所述技术型核心参与人员的数量或所述社交型核心参与人员的数量占所述开源软件开发项目参与人员总数的设定比例。第四方面,提供一种分类系统,包括:第一获取单元:用于获取项目的参与人员的项目执行信息;第二获取单元:用于根据所述项目执行信息,获取影响所述参与人员所属类型的影响因素信息,其中,影响所述参与人员所属类型的影响因素信息包括所述参与人员对所述项目的贡献信息、所述参与人员产生的与所述项目相关的社交信息以及所述参与人员参与所述项目的时间信息;分类单元:用于使用所述分类模型,对所述项目的参与人员进行分类。可选地,所述项目为开源软件开发项目;对所述项目的参与人员进行分类后得到的类型包括以下中的一种:技术型核心参与人员、社交型核心参与人员以及普通参与人员。可选地,所述分类单元,具体用于:根据所述分类模型的输出信息,确定所述项目的参与人员的类型。第五方面,提供一种通信装置,包括:处理器、存储器;所述存储器,用于存储计算机指令;所述处理器,用于运行所述计算机指令以实现如第一方面中任一项所述的方法。第六方面,提供一种通信装置,包括:处理器、存储器;所述存储器,用于存储计算机指令;所述处理器,用于运行所述计算机指令以实现如第二方面中任一项所述的方法。第七方面,提供一种计算机可读存储介质,所述计算机本文档来自技高网...

【技术保护点】
1.一种分类模型训练方法,其特征在于,包括:/n获取项目的参与人员的项目执行信息,所述参与人员根据所述项目执行信息被划分为多种类型;/n根据所述项目执行信息,获取影响所述参与人员所属类型的影响因素信息,其中,影响一个参与人员所属类型的影响因素信息包括所述一个参与人员对所述项目的贡献信息、所述一个参与人员产生的与所述项目相关的社交信息以及所述一个参与人员参与所述项目的时间信息;/n使用所述影响因素信息,对分类模型进行训练;其中,所述分类模型用于根据项目参与人员的项目执行信息输出指示信息,所述指示信息用于指示所述项目参与人员所属的类型。/n

【技术特征摘要】
1.一种分类模型训练方法,其特征在于,包括:
获取项目的参与人员的项目执行信息,所述参与人员根据所述项目执行信息被划分为多种类型;
根据所述项目执行信息,获取影响所述参与人员所属类型的影响因素信息,其中,影响一个参与人员所属类型的影响因素信息包括所述一个参与人员对所述项目的贡献信息、所述一个参与人员产生的与所述项目相关的社交信息以及所述一个参与人员参与所述项目的时间信息;
使用所述影响因素信息,对分类模型进行训练;其中,所述分类模型用于根据项目参与人员的项目执行信息输出指示信息,所述指示信息用于指示所述项目参与人员所属的类型。


2.如权利要求1所述的方法,其特征在于,所述项目为开源软件开发项目;
所述多种类型包括:技术型核心参与人员、社交型核心参与人员以及普通参与人员;其中,所述技术型核心参与人员的数量或所述社交型核心参与人员的数量占所述开源软件开发项目参与人员总数的设定比例。


3.如权利要求2所述的方法,其特征在于,所述一个参与人员对所述开源软件开发项目的贡献信息,包括以下部分或全部信息:
所述一个参与人员提交的软件编程代码行数;
所述一个参与人员提交软件编程代码的次数;
所述一个参与人员提交的软件编程文件数。


4.如权利要求2所述的方法,其特征在于,所述一个参与人员产生的与所述开源软件开发项目相关的社交信息,包括以下部分或全部信息:
所述一个参与人员接收的与所述开源软件开发项目相关的邮件数;
所述一个参与人员发送的与所述开源软件开发项目相关的邮件数;
所述一个参与人员所接收的邮件中,来源于不同发件人的人员数;
所述一个参与人员所发送的邮件中,发向不同收件人的人员数。


5.如权利要求2所述的方法,其特征在于,所述一个参与人员参与所述开源软件开发项目的时间信息,包括以下部分或全部信息:
所述一个参与人员加入所述开源软件开发项目的起始时间;
所述一个参与人员离开所述开源软件开发项目的截止时间;
所述一个参与人员参与所述开源软件开发项目的时间长度。


6.一种分类方法,应用于使用如权利要求1至5中任一项所述的分类模型进行项目参与人员类型分类的过程,其特征在于,包括:
获取项目的参与人员的项目执行信息;
根据所述项目执行信息,获取影响所述参与人员所属类型的影响因素信息,其中,影响所述参与人员所属类型的影响因素信息包括所述参与人员对所述项目的贡献信息、所述参与人员产生的与所述项目相关的社交信息以及所述参与人员参与所述项目的时间信息;
使用所述分类模型,对所述项目的参与人员进行分类。


7.如权利要求6所述的方法,其特征在于,所述项目为开源软件开发项目;
对所述项目的参与人员进行分类后得到的类型包括以下中的一种:技术型核心参与人员、社交型核心参与人员以及普通参与人员。


8.如权利要求7所述的方法,其特征在于,所述参与人员对所述开源软件开发项目的贡献信息,包括以下部分或全部信息:
所述参与人员提交的软件编程代码行数;
所述参与人员提交软件编程代码的次数;
所述参与人员提交的软件编程文件数。


9.如权利要求7所述的方法,其特征在于,所述参与人员产生的与所述开源软件开发项目相关的社交信息,包括以下部分或全部信息:
所述参与人员接收的与所述开源软件开发项目相关的邮件数;
所述参与人员发送的与所述开源软件开发项目相关的邮件数;
所述参与人员接收的...

【专利技术属性】
技术研发人员:朱天潼李峰操新星朱群姜梦琪
申请(专利权)人:中移杭州信息技术有限公司中国移动通信集团有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1