系统框架下基于标签大数据人才推荐算法及其使用方法技术方案

技术编号:29837917 阅读:9 留言:0更新日期:2021-08-27 14:28
本发明专利技术公开了系统框架下基于标签大数据人才推荐算法,包括,如下步骤:步骤1、基于对数据的统计分析建立多元回归数学模型,步骤2、建立包含前述多重因子的预期多维数据表B,推导候选人内容和成果指数I

【技术实现步骤摘要】
系统框架下基于标签大数据人才推荐算法及其使用方法
本专利技术涉及互联网
,具体为系统框架下基于标签大数据人才推荐算法及其使用方法。
技术介绍
互联网行业在2016-2018年迎来高速发展,人才需求以指数型增长上升。2020年互联网人才需求指数高达2.12。其中技术类岗位需求最高,人才需求占比为24.34%、运营类岗位需求占比为8.38%。人才缺口矛盾和人岗匹配矛盾日益突出。现有技术主要基于技术人员简历内容和属性完成人才推荐,存在推荐结果被推荐人主观性过强、质量不高和效率过低的问题。当需要大批量、高效、准确、主动的技术人才推荐时,现有技术难以满足此类需求,因此需要引入新的智慧人才推荐算法。智慧人才推荐算法的关键在于内容、属性、增量成果、多样性增量行为字典的构建并对内容、属性、增量成果、多样性增量行为进行加权。存在基础数据多样性、基础数据增量和加权系数设定标准的问题。
技术实现思路
本专利技术的目的在于提供系统框架下基于标签大数据人才推荐算法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:系统框架下基于标签大数据人才推荐算法,通过现阶段深度
范畴,采用模拟技术手段实现模拟登陆,包括但不限于使用HTTP接口或爬虫技术获取候选人的属性、内容、增量成果以及行为等核心标签数据,并且引入误差δ,采用多维度加权平均计算方法,优化误差δ,打通智慧人才一站式推荐的关键渠道,力求在提升人岗匹配准确度的目标下人尽其用、物尽其才,行之有效地解决人才缺口和人岗匹配的市场矛盾。最终营造良好的行业精英技术人才氛围,提升行业价值和效益。为实现上述目的,本专利技术采用的技术方案是:步骤1、建立包含职位、技能、教育经历、专业、自我评价、个人价值观因素变量的候选人属性基础数据表A,作为优化计算评估候选人的属性指数IA、属性权重WA以及误差σA的基准;利用样本数据对模型参数作出预判估计,并对模型参数进行假设检验以及置信区间估计的有效性,现基于对数据的统计分析建立多元回归数学模型,其一般表达式表示为:yA=B0+B1x1+B2x2+…Bkxk+∈式中,B0,B1,B2,…,Bk为模型的因素变量参数;∈为误差项;χ1,χ2,…χK为变量因子;yA为变量因子的综合作用效果;误差δ的计算规则为:E(X)=X1·P(X1)+X2·P(X2)+......Xn·P(Xn)=X1·f(X1)+X2·f(X2)+...Xn·f(Xn)E(X)=其中公式(1)中:n表示变量因子总数,Xn表示第n个变量因子,P(Xn)表示第n个变量因子发挥作用的概率,而f(Xn)表示第n个变量因子产生的预期效果,E(X)表示误差均值,χK表示第k个变量因子,Pk为因子k发挥作用的概率;方差为各个数据与平均数之差的平方的和的平均数,即=;其中,x表示样本的平均数,n表示样本的数量,xn表示搜索引擎,而s2就表示方差;则在模型推导式中,有如下结论:其中∈i(i=1,2,…,n)相互独立,均服从正态分布N(0,σ2),见图3E(e)=0,Cov(e)=σ2In,e=(e1,e2,…,en)T,其中e为误差向量,en为第n个误差因子向量,Cov(e)为误差方差,σ为标准差,In为第n个单位向量,∈i为第i个误差项;从而可得随机误差向量;步骤2、基于内容和成果进行深度的数据挖掘和旋转,在提取维度数据切片的基准上,通过公司、项目、经验、可检验成果、历史发展、未来预期关键词数据的组合重整以及空间数据的转换,从实际意义出发,建立包含前述多重因子的预期多维数据表B,推导候选人内容和成果指数IB、对应权重WB、随机误差空间向量的分布情况,并以此作为评估判断候选人内容和成果的可量化指标基准;在此经过分析推导采用三维回归模型中的最小二乘法模拟此回归分布模型,其推导过程如下:理论模型式中P0为常量因子,C为候选人内容因子参数,R为候选人成果因子参数,为随机误差向量,为核心因子1,X2为核心因子2,yB为候选人的因子产出;通过建立如下回归参数的标准方程组或采用如下矩阵法=其中b0、b1、b2为因子变量系数,χ1为核心因子1,χ2为核心因子2,y为候选人的因子产出;求解相关回归系数和权重系数,并进行判定系数检验(R检验),回归系数显著性检验(T检验),回归模型方程显著性检验(F检验),保证预测模型和实际模型的可靠性、一致性、置信度;步骤3、基于候选人行为关键词列表,侧重于从求职者和招聘者两个维度层面分析评估影响候选人行为因素的评价指标,针对行为关键词数据深度挖掘,对无行为因素的关键词数据执行去噪操作;步骤4、以基于属性、内容、成果、行为四个维度的候选人基础推荐表为基准,更新构建多维度综合评价表S,以基础表中的数据为元数据,以基础表量化维度属性、内容、成果以及行为为因子分析变量,预期综合评价呈现正态分布规律,其模型表达式可推导为:x表示多重因素包含属性、内容、成果、行为以及各权重系数等综合作用下的自变量因子,δ表示标准误差;e表示自然对数;μ表示均值;π表示圆周率。与现有技术相比,本专利技术的有益效果如下:关键在于智慧人才库属性、内容、成果和行为字典的构建。通过现阶段深度
范畴,采用模拟技术手段实现模拟登陆,连接智慧人才库,通过候选人属性、内容、成果、行为等关键离散数据,建立预期效果热点分布系列数学模型,抽象成算法,打通智慧人才一站式推荐的关键渠道,力求在提升人岗匹配准确度的目标下人尽其用、物尽其才,行之有效地解决人才缺口和人岗匹配的市场矛盾。最终营造良好的行业精英技术人才氛围,提升行业价值和效益。附图说明图1为本专利技术的技术解决方案实施流程;图2为本专利技术的回归模型构建流程;图3为本专利技术的正态分布曲线态势图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1-3,本专利技术的实施例为:系统框架下基于标签大数据人才推荐算法,包括,如下步骤:步骤1、建立包含职位、技能、教育经历、专业、自我评价、个人价值观因素变量的候选人属性基础数据表A,作为优化计算评估候选人的属性指数IA、属性权重WA以及误差σA的基准;利用样本数据对模型参数作出预判估计,并对模型参数进行假设检验以及置信区间估计的有效性,现基于对数据的统计分析建立多元回归数学模型,其一般表达式表示为:yA=B0+B1x1+B2x2+…Bkxk+∈式中,B0,B1,B2,…,Bk为模型的因素变量参数;∈为误差项;χ1,χ2,…χK为变量因子;yA为变量因子的综合作用效果;本文档来自技高网
...

【技术保护点】
1.系统框架下基于标签大数据人才推荐算法,其特征在于,包括,如下步骤:/n步骤1、建立包含职位、技能、教育经历、专业、自我评价、个人价值观因素变量的候选人属性基础数据表A,作为优化计算评估候选人的属性指数

【技术特征摘要】
1.系统框架下基于标签大数据人才推荐算法,其特征在于,包括,如下步骤:
步骤1、建立包含职位、技能、教育经历、专业、自我评价、个人价值观因素变量的候选人属性基础数据表A,作为优化计算评估候选人的属性指数、属性权重以及误差的基准;
误差δ的计算规则为:
E(X)=X1·P(X1)+X2·P(X2)+......Xn·P(Xn)=X1·f(X1)+X2·f(X2)+...Xn·f(Xn)
E(X)=;
其中公式(1)中:n表示变量因子总数,Xn表示第n个变量因子,P(Xn)表示第n个变量因子发挥作用的概率,而f(Xn)表示第n个变量因子产生的预期效果,E(X)表示误差均值,χK第k个变量因子,Pk为因子k发挥作用的概率;
方差为各个数据与平均数之差的平方的和的平均数,即

=;
其中,x表示样本的平均数,n表示样本的数量,xn表示搜索引擎,而s²就表示方差;
则δ=
在模型推导式中,有如下结论:
其中相互独立,均服从正态分布,

,其中e为误差向量,en为第n个误差因子向量,Cov(e)为误差方差,σ为标准差,In为第n个单位向量,为第i个误差项;
从而可得随机误差向量;
步骤2、基于内容和成果进行深度的数据挖掘和旋转,在提取维度数据切片的基准上,通过公司、项目、经验、可检验成果、历史发展、未来预期关键词数据的组合重整以及空间数据的转换,从实际意义出发,建立包含前述多重因子的预期多维数据表B,推导候选人内容和成果指数、对应权重、随机误差空间向量的分布情况,并以此作为评估判断候选人内容和成果的可量化指标基准;
在此经过分析推导采用三维回归模型中的最小二乘法模拟此回归分布模型,其推导过程如下:
理论模型;
式中P0为常量因子,C为候选人内容因子参数,R为候选人成果因子参数,为随机误差向量,X1为核心因子1,X2为...

【专利技术属性】
技术研发人员:刘正超章支富
申请(专利权)人:苏州空谷网络科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1