当前位置: 首页 > 专利查询>淮阴工学院专利>正文

基于集成学习的虚假招聘概率预测方法技术

技术编号:40520523 阅读:36 留言:0更新日期:2024-03-01 13:38
本发明专利技术公开了一种基于集成学习的虚假招聘概率预测方法,属于机器学习和数据科学技术领域。包括:首先对招聘网站进行数据采集,并使用jionnlp和Pandas对数据集进行清洗和标签化预处理,随后对结构化和非结构化的数据进行标签编码和使用TD‑IDF对数据进行特征提取,并运用Truncated SVD对TD‑IDF特征提取后产生的稀疏矩阵进行降维处理,然后利用随机森林、轻量梯度提升机和随机森林作为基模型进行模型训练,最后使用随机森林作为元模型对各基模型的预测结果进行整合,即完成虚假招聘概率预测。本发明专利技术利用多个不同模型作为输入,提高了整体模型的鲁棒性,并具有结构简单、参数量少的优点,为解决严重不平衡数据集的虚假招聘问题提供了一种更为高效和准确的算法方案。

【技术实现步骤摘要】

本专利技术涉及线上虚假招聘数据分析,特别是涉及一种基于集成学习的虚假招聘概率预测方法


技术介绍

1、由于网络招聘是近几年开始流行的一种招聘形式,且网络虚假招聘检测的相关领域尚未得到适当的关注,导致该领域的研究文献不足,到目前为止,很大程度上仍有许多研究未得到探索。在21世纪初,机器学习算法尚未成熟,当时的研究者利用计算机技术从侧面预防和解决虚假招聘问题。wenyin,huang等人在2005年提出了一种基于视觉相似度的钓鱼网页检测方法,可作为预防线上虚假招聘检测解决方案的一部分,其成果已发表在论文“detection of phishing webpages based on visual similarity”中。agrawal,kumar等人提出了一种基于贝叶斯分类器的垃圾邮件识别方法,该方法可以有效检测垃圾邮件,为求职者起到一定警示作用,其成果已发表在论文“controlling spam emails at therouters”中。近年来,现有的研究者们为解决线上虚假招聘检测问题采用了机器学习算法,例如轻型梯度提升机(lightgbm)、支持向本文档来自技高网...

【技术保护点】

1.一种基于集成学习的虚假招聘概率预测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于集成学习的虚假招聘概率预测方法,其特征在于,所述步骤1的具体方法为::

3.根据权利要求1所述的基于集成学习的虚假招聘概率预测方法,其特征在于,所述步骤2的具体方法为:

4.根据权利要求1所述的基于集成学习的虚假招聘概率预测方法,其特征在于,所述步骤3的具体方法为:

5.根据权利要求1所述的基于集成学习的虚假招聘概率预测方法,其特征在于,所述步骤4的具体方法为:

6.根据权利要求1所述的基于集成学习的虚假招聘概率预测方法,其特征在...

【技术特征摘要】

1.一种基于集成学习的虚假招聘概率预测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于集成学习的虚假招聘概率预测方法,其特征在于,所述步骤1的具体方法为::

3.根据权利要求1所述的基于集成学习的虚假招聘概率预测方法,其特征在于,所述步骤2的具体方法为:

4.根据权利要求1所述的基于集成学习的虚假招聘概率预测方法,其特征在于,所述步骤3的具体方法为:

5.根...

【专利技术属性】
技术研发人员:王梅峰张海艳王媛媛李亚州田海阳黄佳泷宋照渝严少峰朱俊勋张兴潮尹彤彤张澳何艳婷谢乾汪涛
申请(专利权)人:淮阴工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1