【技术实现步骤摘要】
模型训练方法、基于模型的评估方法及装置
本专利技术涉及机器学习
,尤其涉及模型训练方法、基于模型的评估方法及装置。
技术介绍
现如今,随着科学技术的发展和知识经济的突飞猛进,人才在经济社会发展中的地位和作用日益突出。在知识经济形态中,人才资源已成为重要的战略资源,其数量和质量是经济增长和社会发展的关键因素。为促进科技与经济的发展,各级地方政府每年引进大量专业技术人才、高技能人才、海外高层次人才、海外留学人才等。政府投入了大量资源,使人才享受住房、医疗、户口、经费等福利政策。为了确保引进人才的质量和竞争力,政府通常对人才设置了一定的引进条件,例如千人计划的引进要就包括“在国外著名高校、科研院所担任相当于教授职务的专家学者;在国际知名企业和金融机构担任高级职务的专业技术人才和经营管理人才;拥有自主知识产权或掌握核心技术,具有海外自主创业经验,熟悉相关产业领域和国际规则的创业人才”等条件。但是,以往人才引进只注重人才数量、人才政策、引进条件的制定,而难以准确对人才引进效果进行有效预判,即仅依赖人才数量、人才政 ...
【技术保护点】
1.一种模型训练方法,其特征在于,所述方法包括:/n通过数据接入平台获取训练集,所述训练集包括多个样本数据,每个样本数据包括人才引进前的多个特征数据和人才引进后的标签数据;其中,所述标签数据表示人才引进后的贡献数据的量化值;所述多个特征数据包括以下至少一类:人才引进前的至少一种人才属性数据、至少一种教育背景数据、至少一种历史贡献数据和至少一种人才政策数据;/n通过大数据平台,根据所述训练集训练用于人才评估的模型;所述模型用于指示人才引进后的标签数据与人才引进前的多个特征数据中的两种或两种以上数据之间的定量关系。/n
【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:
通过数据接入平台获取训练集,所述训练集包括多个样本数据,每个样本数据包括人才引进前的多个特征数据和人才引进后的标签数据;其中,所述标签数据表示人才引进后的贡献数据的量化值;所述多个特征数据包括以下至少一类:人才引进前的至少一种人才属性数据、至少一种教育背景数据、至少一种历史贡献数据和至少一种人才政策数据;
通过大数据平台,根据所述训练集训练用于人才评估的模型;所述模型用于指示人才引进后的标签数据与人才引进前的多个特征数据中的两种或两种以上数据之间的定量关系。
2.根据权利要求1所述的方法,其特征在于,
所述至少一种人才属性数据表示人才的基本信息,所述基本信息包括人才的年龄、性别、籍贯、房产、婚姻状况、子女数量、子女受教育情况、来本地的时间、离开本地的时间中的至少一种;
所述至少一种教育背景数据表示与人才受教育相关的数据,所述与人才受教育相关的数据包括人才的毕业院校、学历、学位、专业、生源地中的至少一种;
所述至少一种历史贡献数据表示人才曾经取得的工作成就,所述工作成就包括人才的论文发表情况、担任公司法人情况、专利申请情况、人才历史标签中的至少一种;
所述至少一种人才政策数据表示人才引进地对人才的扶持政策,所述扶持政策包括人才资助政策、人才住房政策、人才落户政策、人才福利政策、人才子女教育政策、人才医疗政策中的至少一种。
3.根据权利要求1或2所述的方法,其特征在于,所述模型为回归模型;所述根据所述训练集训练用于人才评估的模型具体包括:
根据所述训练集,利用逐步回归算法训练用于人才评估的回归模型;所述回归模型用于指示人才引进后的标签数据与人才引进前的多个特征数据中的两种或两种以上数据之间的线性关系。
4.根据权利要求3所述的方法,其特征在于,所述多个特征数据具体为N个特征数据{X1,X2,…,XN},其中Xi表示任一人才属性数据、或任一教育背景数据、或任一历史贡献数据、或任一人才政策数据,N为大于2的整数;所述标签数据具体为y;
所述利用逐步回归算法训练用于人才评估的回归模型,包括:
根据各特征数据X1,X2,…,XN对y作用的显著程度值的大小,以降序顺序将各特征数据逐步引入回归方程y=b0+bixi,从而获得回归模型y=b0+b1x1+b2x2+…+bpxp;其中,2≤p≤N,x1,x2,…,xp表示被引入到回归方程中的p个特征数据,b0,b1,b2,…,bp表示线性回归系数。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述标签数据具体为根据人才引进后的商业贡献数据进行量化后得到的商业指标值;所述商业贡献数据包括人才引进后人才担任公司法人的数量排名分和所对应公司的经营状况排名分。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述标签数据具体为根据人才引进后的科技贡献数据进行量化后得到的科技指标值;所述科技贡献数据包括人才引进后的年均发明专利数量排名分和所对应发明专利质量排名分。
7.根据权利要求1-4任一项所述的方法,其特征在于,所述标签数据具体为根据人才引进后在人才引进地的停留时间排名分确定的迁移指标值。
8.一种基于模型的评估方法,其特征在于,所述方法包括:
通过数据接入平台获取待引进人才的多个特征数据;所述多个特征数据包括以下至少一类:所述待引进人才的至少一种人才属性数据、至少一种教育背景数据、至少一种历史贡献数据和至少一种人才政策数据;
通过大数据平台,将所述多个特征数据输入到用于人才评估的模型,获得预测标签数据;其中,所述预测标签数据表示预测所述待引进人才被引进后的贡献数据的量化值;所述模型是根据训练集进行训练得到的,所述训练集包括多个样本数据,每个样本数据包括人才引进前的多个特征数据和人才引进后的标签数据;所述模型用于指示人才引进后的标签数据与人才引进前的多个特征数据中的两种或两种以上数据之间的定量关系;
以及通过所述大数据平台,将所述预测标签数据与人才评估标准作比较,以得到所述待引进人才的评估结果;
通过展示平台,对所述评估结果进行可视化呈现。
9.根据权利要求8所述的方法,其特征在于,
所述至少一种人才属性数据表示所述待引进人才的年龄、性别、籍贯、房产、婚姻状况、子女数量、子女受教育情况、来本地的时间、离开本地的时间中的至少一种;
所述至少一种教育背景数据表示所述待引进人才的毕业院校、学历、学位、专业、生源地中的至少一种;
所述至少一种历史贡献数据表示所述待引进人才的工作成就、论文发表情况、专利申请情况、人才历史标签中的至少一种;
所述至少一种人才政策数据表示人才引进地的人才资助政策、人才住房政策、人才落户政策、人才福利政策、人才子女教育政策、人才医疗政策中的至少一种。
10.根据权利要...
【专利技术属性】
技术研发人员:王鹏,郑志彬,聂贤政,黄敬,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。