The invention discloses a method, a system and a storage medium for job recruitment data screening based on machine learning, which comprises the following steps: (1) job recruitment data collection; obtaining suspected job recruitment information; and (2) training the classifier by using job recruitment information and non-job recruitment information of suspected job recruitment information, and obtaining the job classification information. To the classifier; Step (3): Use the classifier to classify all the suspected job recruitment information, get the job recruitment information database and non-job Recruitment Information database. The invention can quickly and accurately screen professional and technical post recruitment data that meet users' needs.
【技术实现步骤摘要】
基于机器学习的岗位招聘数据筛选方法、系统及存储介质
本专利技术涉及基于机器学习的岗位招聘数据筛选方法、系统及存储介质。
技术介绍
随着全球范围内网络安全事件的日益增加,一系列配套政策法规的逐步落地实施,国内机构对网络安全人才的需求出现爆发式增长。据统计数据显示,人才市场上有经验的相关人才非常稀缺,企业只能放低要求来填补岗位空缺。比如某个培训机构想培训一些准备从事网络安全方向的学员,为了更好的促进学员就业,就要深入了解企业发布的招聘信息中的技能要求,而且现在的网络安全技术不断更新,培训机构需要对一些招聘动态进行实时筛选,才能够保证培训机构第一时间了解当前招聘信息的更新动态。同样的,企业如果想招聘网络安全方向的人才,也需要了解掌握哪些技能可以胜任该工作以及市场的薪资情况。目前对于如何从重多的招聘信息中筛选出岗位,例如:网络安全岗位的数据,只能通过人工的方式或一些简单的筛选方式过滤数据,通过这种方式不是耗费过多的人力成本就是准确度不高,无法快速高效准确的采集大量相关数据。
技术实现思路
为了解决现有技术的不足,本专利技术提供了基于机器学习的岗位招聘数据筛选方法、系统及存储介质,其并通过图形化的形式预测调整分类,保证数据的准确性;作为本专利技术的第一方面,提供了:基于机器学习的岗位招聘数据筛选方法,包括:步骤(1):岗位招聘数据采集;步骤(101):设定招聘岗位,将招聘岗位存储到招聘岗位数据库中;设定企业名称,将企业名称存储到企业名称数据库中;步骤(102):根据招聘岗位数据库中的招聘岗位,抓取互联网公开的企业名称和招聘岗位的任职要求;将新的企业名称存储到企业名称数据 ...
【技术保护点】
1.基于机器学习的岗位招聘数据筛选方法,其特征是,包括:步骤(1):岗位招聘数据采集;步骤(101):设定招聘岗位,将招聘岗位存储到招聘岗位数据库中;设定企业名称,将企业名称存储到企业名称数据库中;步骤(102):根据招聘岗位数据库中的招聘岗位,抓取互联网公开的企业名称和招聘岗位的任职要求;将新的企业名称存储到企业名称数据库中;将招聘岗位的任职要求存储到任职要求数据库中;步骤(103):根据企业名称数据库,抓取每个企业名称在互联网公开的所有招聘岗位;将与设定招聘岗位相似的新的招聘岗位存储到招聘岗位数据库中;返回步骤(102);步骤(104):重复步骤(102)和步骤(103)直至不再产生新的企业名称和新的招聘岗位为止;将任职要求数据库中的数据进行去重处理,去重后的任职要求数据库中的数据被称之为疑似岗位招聘信息;步骤(2):利用疑似岗位招聘信息的岗位招聘信息和非岗位招聘信息,对分类器进行训练,得到分类器;步骤(3):利用分类器对所有的疑似岗位招聘信息进行分类,得到岗位招聘信息库和非岗位招聘信息库。
【技术特征摘要】
1.基于机器学习的岗位招聘数据筛选方法,其特征是,包括:步骤(1):岗位招聘数据采集;步骤(101):设定招聘岗位,将招聘岗位存储到招聘岗位数据库中;设定企业名称,将企业名称存储到企业名称数据库中;步骤(102):根据招聘岗位数据库中的招聘岗位,抓取互联网公开的企业名称和招聘岗位的任职要求;将新的企业名称存储到企业名称数据库中;将招聘岗位的任职要求存储到任职要求数据库中;步骤(103):根据企业名称数据库,抓取每个企业名称在互联网公开的所有招聘岗位;将与设定招聘岗位相似的新的招聘岗位存储到招聘岗位数据库中;返回步骤(102);步骤(104):重复步骤(102)和步骤(103)直至不再产生新的企业名称和新的招聘岗位为止;将任职要求数据库中的数据进行去重处理,去重后的任职要求数据库中的数据被称之为疑似岗位招聘信息;步骤(2):利用疑似岗位招聘信息的岗位招聘信息和非岗位招聘信息,对分类器进行训练,得到分类器;步骤(3):利用分类器对所有的疑似岗位招聘信息进行分类,得到岗位招聘信息库和非岗位招聘信息库。2.如权利要求1所述的基于机器学习的岗位招聘数据筛选方法,其特征是,所述步骤(102)中:若抓取的企业名称与企业名称数据库的企业名称不一致,那么将抓取的企业名称作为新企业名称存储到企业名称数据库中;同时,将新企业名称对应的设定招聘岗位的任职要求存储到任职要求数据库中;若抓取的企业名称与企业名称数据库的企业名称均一致,那么将抓取的设定招聘岗位的任职要求存储到任职要求数据库中。3.如权利要求1所述的基于机器学习的岗位招聘数据筛选方法,其特征是,所述岗位招聘数据为专业技术岗位招聘数据。4.如权利要求2所述的基于机器学习的岗位招聘数据筛选方法,其特征是,所述步骤(103)中:如果抓取的招聘岗位与设定的招聘岗位名称相似,那么将抓取的招聘岗位作为新的招聘岗位存储到招聘岗位数据库中;返回步骤(102);如果抓取的招聘岗位与设定的招聘岗位名称不相似,那么将抓取的招聘岗位和招聘岗位的任职要求均剔除。5.如权利要求1所述的基于机器学习的岗位招聘数据筛选方法,其特征是,所述步骤(103)相似与不相似的判断,均采用文本相似度算法进行判断。6.如权利要求1所述的基于机器学习的岗位招聘数据筛选方法,其特征是,所述步骤(2)包括:步骤(201):将疑似岗位招聘信息...
【专利技术属性】
技术研发人员:董超,段文良,王可鑫,
申请(专利权)人:山东合天智汇信息技术有限公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。