一种基于数据画像的双向就业推荐方法和装置制造方法及图纸

技术编号:29133454 阅读:24 留言:0更新日期:2021-07-02 22:28
本发明专利技术属于数据推荐领域,提供了一种基于数据画像的双向就业推荐方法和装置。其中,该方法包括获取用户数据、岗位数据及日志数据,并对应提取用户的基本信息、岗位的基本信息以及用户和人资行为信息;基于自定义的画像标签的数据模型及在不同数据源情况下相应标签的计算任务,生成用户和岗位两者的基本标签和行为标签,进而获取用户画像及获取岗位画像;根据基本信息及行为信息所包含的信息量对相应画像的影响,设定基本信息及行为信息的权值,进而利用加权的基本信息及行为信息来计算用户和岗位画像的匹配度,根据行为标签进行排序,生成推荐列表。

【技术实现步骤摘要】
一种基于数据画像的双向就业推荐方法和装置
本专利技术属于数据推荐领域,尤其涉及一种基于数据画像的双向就业推荐方法和装置。
技术介绍
本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。就业推荐系统的出现是为了帮助求职者和企业从海量繁杂的数据中快速而准确地获取所需的内容,主要算法有基于内容的算法和协同过滤算法。基于内容的算法是基于求职者的注册信息进行的推荐;而协同过滤算法是根据求职者的相似群体或者原有的岗位投递获取匹配的岗位信息,而后进行推荐。本专利技术人发现,以上的所提的相关算法并没有考虑到以下两个问题:第一个问题,求职者对岗位的要求并不是一成不变的,它会随着时间的变化而变化;当变化发生时,基于原注册信息或原相似群体产生的推荐对于求职者而言就是一些冗余信息。第二个问题,人资的偏好会对求职者能否得到面试邀请产生一定的影响。人是有主观性的生命,这不可避免地将自己的偏好带入到工作中,导致以下的现象产生:即使岗位与求职者双方十分契合,但简历依旧可能过不了人资的筛选。
技术实现思路
为了解决上述
技术介绍
中存在的技术问题,本专利技术提供一种基于数据画像的双向就业推荐方法及系统,其通过建立用户和岗位的数据画像,实现用户到岗位、以及岗位到用户双向的精准的个性化推荐,满足用户和企业的双向需求。为了实现上述目的,本专利技术采用如下技术方案:本专利技术的第一个方面提供一种基于数据画像的双向就业推荐方法。一种基于数据画像的双向就业推荐方法,包括:获取用户数据、岗位数据及日志数据,并对应提取用户的基本信息、岗位的基本信息以及用户和人资行为信息;基于自定义的画像标签的数据模型及在不同数据源情况下相应标签的计算任务,生成用户和岗位两者的基本标签和行为标签,进而获取用户画像及获取岗位画像;根据基本信息及行为信息所包含的信息量对相应画像的影响,设定基本信息及行为信息的权值,进而利用加权的基本信息及行为信息来计算用户和岗位画像的匹配度,根据行为标签进行排序,生成推荐列表。本专利技术的第二个方面提供一种基于数据画像的双向就业推荐装置。一种基于数据画像的双向就业推荐装置,其包括:数据获取模块,其用于获取用户数据、岗位数据及日志数据,并对应提取用户的基本信息、岗位的基本信息以及用户和人资行为信息;画像刻画模块,其用于基于自定义的画像标签的数据模型及在不同数据源情况下相应标签的计算任务,生成用户和岗位两者的基本标签和行为标签,进而获取用户画像及获取岗位画像;关联模块,其用于根据基本信息及行为信息所包含的信息量对相应画像的影响,设定基本信息及行为信息的权值,进而利用加权的基本信息及行为信息来计算用户和岗位画像的匹配度,根据行为标签进行排序,生成推荐列表。本专利技术的第三个方面提供一种计算机可读存储介质。一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于数据画像的双向就业推荐方法中的步骤。本专利技术的第四个方面提供一种计算机设备。一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于数据画像的双向就业推荐方法中的步骤。与现有技术相比,本专利技术的有益效果是:(1)本专利技术所属内容通过数据画像显示地展现用户和岗位的基本信息和偏好信息,强化了推荐结果的可解释性,降低了用户和岗位匹配度的计算量。(2)本专利技术通过分析人资的行为数据,挖掘岗位的偏好,实现对岗位的个性化推荐,降低求职者的投递风险,减少人资筛选简历的时间。(3)本专利技术考虑了基本信息和行为信息的占比对推荐结果的影响,通过计算基本信息和行为信息的权值,挖掘数据画像的兴趣偏向。本专利技术附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。图1是本专利技术实施例的一种基于数据画像的双向就业推荐方法流程图;图2是本专利技术实施例的一种基于数据画像的双向就业推荐装置的构成;图3是本专利技术实施例的一种基于数据画像的双向就业推荐装置的业务流程构建过程。具体实施方式下面结合附图与实施例对本专利技术作进一步说明。应该指出,以下详细说明都是例示性的,旨在对本专利技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本专利技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。实施例一如图1所示,本实施例提供了一种基于数据画像的双向就业推荐方法,其包括:步骤1:获取用户数据、岗位数据及日志数据,并对应提取用户的基本信息、岗位的基本信息以及用户和人资行为信息。在具体实施中,用户数据包括用户的基本信息及用户行为信息。这些信息分为结构信息和非结构信息,其中结构信息包括姓名、年龄、性别、工作年限、薪资、学历,需要对这些进行清洗、去重,并利用注册用户的同属性均值对缺失值进行补充;同时对用户的非结构信息(其中,非结构信息包括自我评价、兴趣爱好、备注等短文本信息)进行分词和去停用词处理,获取关键词。岗位信息也包括岗位的基本信息及岗位行为信息。这些信息分为结构信息和非结构信息,其中结构信息包括年龄、性别、工作年限、学历的要求以及薪资,需要对这些进行清洗、去重,并同类型岗位的同属性均值对缺失值进行补充;同时对岗位的非结构信息(其中,非结构信息包括岗位描述文本和所属企业的描述文本等)进行分词和去停用词处理,获取关键词。其中,日志数据包括XML消息日志和行为数据;暂时保存个人(包括用户和人资)通过浏览、点击、收藏、分享、简历投递(面试邀请)等操作产生的XML消息日志;统计个人对各个标签的不同操作以及相应的次数、时长,保存为行为数据。步骤2:基于自定义的画像标签的数据模型及在不同数据源情况下相应标签的计算任务,生成用户和岗位两者的基本标签和行为标签,进而获取用户画像及获取岗位画像。其中,标签包括年龄、性别、工作年限、薪资、学历、行业类型、企业类型、爱好、品质;根据不同的标签以及数据源,定义相应的计算任务,每一个计算任务中包含对数据的预处理,计算和整合操作。对于基本标签中的年龄、性别、工作年限、薪资、学历的属性,主要是直接获取用户或岗位的基本信息数据;对于基本标签中的行业类型、企业类型、爱好、品质的属性,主要是利用word2vec和支持向量机对用户或岗位的关键词进行相应的类别预测。对本文档来自技高网
...

【技术保护点】
1.一种基于数据画像的双向就业推荐方法,其特征在于,包括:/n获取用户数据、岗位数据及日志数据,并对应提取用户的基本信息、岗位的基本信息以及用户和人资行为信息;/n基于自定义的画像标签的数据模型及在不同数据源情况下相应标签的计算任务,生成用户和岗位两者的基本标签和行为标签,进而获取用户画像及获取岗位画像;/n根据基本信息及行为信息所包含的信息量对相应画像的影响,设定基本信息及行为信息的权值,进而利用加权的基本信息及行为信息来计算用户和岗位画像的匹配度,根据行为标签进行排序,生成推荐列表。/n

【技术特征摘要】
1.一种基于数据画像的双向就业推荐方法,其特征在于,包括:
获取用户数据、岗位数据及日志数据,并对应提取用户的基本信息、岗位的基本信息以及用户和人资行为信息;
基于自定义的画像标签的数据模型及在不同数据源情况下相应标签的计算任务,生成用户和岗位两者的基本标签和行为标签,进而获取用户画像及获取岗位画像;
根据基本信息及行为信息所包含的信息量对相应画像的影响,设定基本信息及行为信息的权值,进而利用加权的基本信息及行为信息来计算用户和岗位画像的匹配度,根据行为标签进行排序,生成推荐列表。


2.如权利要求1所述的基于数据画像的双向就业推荐方法,其特征在于,用户和岗位画像的匹配度为用户画像和岗位画像的相似度的e指数的倒数;其中,用户画像和岗位画像的相似度利用欧式距离计算得到。


3.如权利要求1所述的基于数据画像的双向就业推荐方法,其特征在于,基本信息及行为信息的权值由基本信息和行为信息的相似度决定。


4.如权利要求3所述的基于数据画像的双向就业推荐方法,其特征在于,当基本信息和行为信息的相似度为1时,基本信息及行为信息的权值均为0.5。


5.如权利要求3所述的基于数据画像的双向就业推荐方法,其特征在于,当基本信息和行为信息的相似度不为1时,如果基本信息包含的信息量多于行为信息包含的信息量,则行为信息的权重为基本信息与行为信息的差值的2范数的平方的e指数的倒数。


6.如权利要求3所述的基于数...

【专利技术属性】
技术研发人员:钱进赵静于秋波巫双果刘坤杨栋张龙
申请(专利权)人:山大地纬软件股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1