The invention discloses a home delivery intention model construction method, suitable for execution in a computing device, the operation data of the computing device to acquire multiple users in the target site, the method comprises: acquiring a plurality of user data structures within the predetermined operating days as a sample set prior to the current date, each sample of the sample set including user identification, user daily operation data and the user in the current day before the date of delivery or operation; according to the user in the current day before the date of delivery is operation each sample labeled positive samples or negative samples of negative samples were sampled according to the proportion of the first, and the positive samples and after sampling the negative samples in accordance with the proportion of second generation of the training set; the characteristic values of a plurality of samples is calculated according to the operation data in the training set, and the identification of positive and negative samples and multiple. The eigenvalue is constructed as the feature vector of the sample, and the predefined algorithm is applied to train the feature vectors of each sample in the training set to get the user's willingness to delivery model.
【技术实现步骤摘要】
一种用户投递意愿模型的构建方法和计算设备
本专利技术涉及互联网
,尤其涉及一种用户投递意愿模型的构建方法和计算设备。
技术介绍
随着互联网技术的发展,网络应聘/招聘已经成了求职者应聘工作、用人单位招聘员工的主要途径。用人单位和求职者在第三方的人才招聘网站上注册账号,相互之间进行搜索和交流,以寻求最满意的对象。一般用户找工作都具有很强的时效性,用户通常只在某个时间窗口具有找工作的意愿,过了该时间窗口,用户就不寻求就业机会了。如果能够准确预测用户最近是否活跃,并根据用户活跃程度对人才搜索结果调权,将非常有助于提升转化率。目前业界的预测方案是基于用户上次登录或投递的时间,计算该时间距离当前日期的间隔,间隔越长则今日投递意愿越低。但实际上,用户求职是周期性需求,且受节假日影响明显,而该方案对周期性投递行为的冷启动和节假日规律乏力。另外,用户在投递期间的动作存在规律,例如用户往往在求职初期前投递频繁,后期投递量逐渐减少,且不同用户的投递行为存在显著差异,例如A用户每日投递量超过100但B用户仅仅每天1-2次投递,用基于上次投递时间的方案无法对投递动作的变化做出相应的改变,也不能针对不同的用户实现个性化。因此,需要提供一种更有效的用户投递意愿概率的预测方法。
技术实现思路
为此,本专利技术提供一种用户投递意愿模型的构建方法和计算设备,以力图解决或至少缓解上面存在的问题。根据本专利技术的一个方面,提供了一种用户投递意愿模型的构建方法,适于在计算设备中执行,计算设备与数据存储装置连接,数据存储装置中存储有多个用户在目标网站的操作数据,操作数据包括动作数据和投递数据,该方 ...
【技术保护点】
一种用户投递意愿模型的构建方法,适于在计算设备中执行,所述计算设备与数据存储装置连接,所述数据存储装置中存储有多个用户在目标网站的操作数据,所述操作数据包括动作数据和投递数据,该方法包括:获取多个用户在当前日期之前预定天数内的操作数据,并根据获取到的操作数据构造样本集,所述样本集中的每条样本包括用户标识、用户每天的操作数据和用户在当前日期的前一天是否有投递操作;根据用户在当前日期的前一天是否有投递操作将各条样本标记为正样本或负样本,对负样本按照第一比例进行抽样,并将正样本与抽样后的负样本按照第二比例生成训练集;根据训练集中的操作数据计算各条样本的多个特征值,并将正负样本标识和多个特征值构造为样本的特征向量;以及采用预定算法对训练集中各样本的特征向量进行训练,得到用户投递意愿模型,所述用户投递意愿模型的输入为目标用户的多个特征值,输出为该用户的投递意愿概率值。
【技术特征摘要】
1.一种用户投递意愿模型的构建方法,适于在计算设备中执行,所述计算设备与数据存储装置连接,所述数据存储装置中存储有多个用户在目标网站的操作数据,所述操作数据包括动作数据和投递数据,该方法包括:获取多个用户在当前日期之前预定天数内的操作数据,并根据获取到的操作数据构造样本集,所述样本集中的每条样本包括用户标识、用户每天的操作数据和用户在当前日期的前一天是否有投递操作;根据用户在当前日期的前一天是否有投递操作将各条样本标记为正样本或负样本,对负样本按照第一比例进行抽样,并将正样本与抽样后的负样本按照第二比例生成训练集;根据训练集中的操作数据计算各条样本的多个特征值,并将正负样本标识和多个特征值构造为样本的特征向量;以及采用预定算法对训练集中各样本的特征向量进行训练,得到用户投递意愿模型,所述用户投递意愿模型的输入为目标用户的多个特征值,输出为该用户的投递意愿概率值。2.如权利要求1所述的方法,其中,所述动作数据包括动作类型和动作时间,所述动作类型包括点击、收藏、浏览,所述操作数据还包括登录数据,所述登录数据包括登录时间,所述投递数据包括投递时间。3.如权利要求1所述的方法,其中,所述多个特征值包括以下特征值中的至少两个:当前日期是星期几;当前日期距离注册日的天数;投递总次数;平均每天投递次数;当前日期距离上次投递的天数;当前日期距离上次动作的天数;最大连续动作天数;有过动作的天数;有过投递的天数;平均投递天数;平均动作天数。4.如权利要求1所述的方法,还包括步骤:将所述多个特征值中的每个特征值分别...
【专利技术属性】
技术研发人员:方轲,
申请(专利权)人:北京拉勾科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。