人员关系分析方法、装置、设备及存储介质制造方法及图纸

技术编号:36707960 阅读:35 留言:0更新日期:2023-03-01 09:32
本发明专利技术涉及人工智能技术,揭露了一种人员关系分析方法,包括:获取待分析人员预设类别的信息,对所述信息进行清洗后得到目标信息;提取目标信息中工作经历信息及教育经历信息;根据工作经历信息及教育经历信息,从预设数据库中查询与待分析人员关联的第一人群数据及第二人群数据,对第一人群数据及第二人群数据进行语义分析,得到待分析人员的同事关系数据及同学关系数据;根据所述同事关系数据及同学关系数据,构建待分析人员的人员关系图谱。本发明专利技术还提出一种人员关系分析装置、电子设备以及存储介质。本发明专利技术可以提高人员关系分析的准确率及效率。确率及效率。确率及效率。

【技术实现步骤摘要】
人员关系分析方法、装置、设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种人员关系分析方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着数据处理技术的不断进步,人们对于数据应用的意识不断提高,人们生活和各行业运行产生的数据呈现爆发式增长,形成了城市数据。城市数据中包含了不同人员的社交媒体数据(例如facebook、LinkedIn、微信、钉钉等)、国家官方公布数据、公司网站公布数据等。通过对城市数据进行分析,可以得到人员之间的关系,可以用于商用推荐,有助于提高业务成功率。
[0003]当前,一般通过查询企业公布的组织架构图、网上搜索的人员相关信息、及/或电话调查等方式获取相关城市数据,分析人员之间的关系,如群体人员的层级关系。但是企业公布的组织架构图一般不会及时更新,且人员变动涉及个人隐私,外部人员难以获取,电话调查又费时费力。因此,通过上述方法分析人员之间的关系准确率及效率都不高。

技术实现思路

[0004]本专利技术提供一种人员关系分析方法、装置及计算机可读存储介质,其主要目的在于解决人员关系分析准确率及效率不高的问题。
[0005]为实现上述目的,本专利技术提供的一种人员关系分析方法,包括:
[0006]获取待分析人员预设类别的信息,对所述信息进行清洗,得到目标信息;
[0007]提取所述目标信息中工作经历信息及教育经历信息;
[0008]根据所述工作经历信息,从预设数据库中查询与所述待分析人员关联的第一人群数据,对所述第一人群数据进行语义分析,得到所述待分析人员的同事关系数据;
[0009]根据所述教育经历信息,从所述预设数据库中查询与所述待分析人员关联的第二人群数据,对所述第二人群数据进行语义分析,得到所述待分析人员的同学关系数据;
[0010]根据所述同事关系数据及所述同学关系数据,构建所述待分析人员的人员关系图谱。
[0011]可选地,所述根据所述工作经历信息,从预设数据库中查询与所述待分析人员关联的第一人群数据,包括:
[0012]对所述工作经历信息进行分词及量化操作,得到工作经历信息特征向量;
[0013]从所述工作经历信息特征向量中提取公司实体向量、职务实体向量及工作关系向量;
[0014]对所述公司实体向量、所述职务实体向量及所述工作关系向量进行分类,并基于分类结果,构建工作经历知识图谱;
[0015]从预设数据库中提取公司名称关键字及公司主要人员信息,根据所述公司实体向量及所述公司名称关键字,从所述预设数据库中匹配相似公司名称集;
[0016]根据所述公司主要人员信息,从所述相似公司名称集中筛选出与所述公司实体向量对应的相同公司名称;
[0017]从所述预设数据库中提取所述相同公司名称中所有人员的数据作为所述待分析人员关联的第一人群数据。
[0018]可选地,所述从所述工作经历信息特征向量中提取公司实体向量、职务实体向量及工作关系向量,包括:
[0019]根据所述工作经历信息特征向量,从预设工作经历词典中匹配潜在词集合;
[0020]利用预训练完成的实体及关系提取模型,对所述潜在词集合及所述工作经历信息特征向量进行编码,得到工作经历字符表征向量及潜在词表征向量;
[0021]基于所述实体及关系提取模型中的注意力机制,将所述工作经历字符表征向量及所述潜在词表征向量进行加权融合,得到融合向量;
[0022]利用所述实体及关系提取模型,对所述融合向量分别进行单向编码及反向编码,得到单向特征向量及反向特征向量;
[0023]利用所述实体及关系提取模型,拼接所述单向特征向量及所述反向特征向量,得到所述工作经历信息的输出状态序列;
[0024]利用所述实体及关系提取模型中的一阶Viterbi算法对所述输出状态序列进行分类并标注概率排序,选择概率最大的向量作为公司实体向量、职务实体向量及工作关系向量。
[0025]可选地,所述对所述第一人群数据进行语义分析,得到所述待分析人员的同事关系数据,包括:
[0026]提取所述第一人群数据中相关公司信息及对应的相关人员在职时间信息;
[0027]提取所述工作经历信息中所述待分析人员的公司实体向量对应的目标人员在职时间;
[0028]匹配所述公司实体向量与所述相关公司信息,得到匹配结果;
[0029]当所述匹配结果为匹配时,判断所述相关人员在职时间信息与所述目标人员在职时间是否有重叠;
[0030]选取所述相关人员在职时间信息与所述目标人员在职时间之间的重叠数据,根据所述重叠数据对应的相关人员确定所述待分析人员的同事关系数据。
[0031]可选地,所述利用预训练完成的实体及关系提取模型,对所述潜在词集合及所述工作经历信息特征向量进行编码,得到工作经历字符表征向量及潜在词表征向量之前,所述方法还包括:
[0032]获取历史工作经历数据集,对所述历史工作经历数据集进行标注得到标注数据;
[0033]利用K折交叉验证算法将所述历史工作经历数据集划分为训练集及测试集;
[0034]利用预设实体及关系提取模型,提取所述训练集中目标公司实体向量、目标职务实体向量及目标工作关系向量;
[0035]利用预设的损失函数分别计算所述目标公司实体向量、所述目标职务实体向量、所述目标工作关系向量与所述标注数据之间的损失值,根据所述损失值对所述预设实体及关系提取模型进行参数调整,并返回所述利用K折交叉验证算法将所述历史工作经历数据集划分为训练集及测试集的步骤,直至所述损失值小于预设的损失阈值,得到初步训练完
成的实体及关系提取模型;
[0036]利用所述测试集对所述初步训练完成的实体及关系提取模型进行测试,得到测试结果,当所述测试结果为未通过时,返回所述利用K折交叉验证算法将所述历史工作经历数据集划分为训练集及测试集的步骤,再次对所述实体及关系提取模型进行迭代更新,直至所述测试结果为通过,得到预训练完成的实体及关系提取模型。
[0037]可选地,所述根据所述根据所述工作经历信息特征向量,从预设工作经历词典中匹配潜在词集合之前,所述方法还包括:
[0038]分别获取专业中文语料及专业人力资源词典;
[0039]对所述专业中文语料进行分词及量化操作,得到专业中文词向量;
[0040]对所述专业人力资源词典进行改善性分词并量化操作,得到人力资源分词向量;
[0041]将所述专业中文词向量与所述人力资源分词向量进行组合,得到预设工作经历词典。
[0042]可选地,所述根据所述同事关系数据及所述同学关系数据,构建所述待分析人员的人员关系图谱,包括:
[0043]根据所述待分析人员的同事关系及同学关系,从所述预设数据库中提取同事工作经历数据及同学教育经历数据;
[0044]根据所述待分析人员的同事关系及同学关系,在所述预设数据库中根据预设准则建立所述待分析人员的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人员关系分析方法,其特征在于,所述方法包括:获取待分析人员预设类别的信息,对所述信息进行清洗,得到目标信息;提取所述目标信息中工作经历信息及教育经历信息;根据所述工作经历信息,从预设数据库中查询与所述待分析人员关联的第一人群数据,对所述第一人群数据进行语义分析,得到所述待分析人员的同事关系数据;根据所述教育经历信息,从所述预设数据库中查询与所述待分析人员关联的第二人群数据,对所述第二人群数据进行语义分析,得到所述待分析人员的同学关系数据;根据所述同事关系数据及所述同学关系数据,构建所述待分析人员的人员关系图谱。2.如权利要求1所述的人员关系分析方法,其特征在于,所述根据所述工作经历信息,从预设数据库中查询与所述待分析人员关联的第一人群数据,包括:对所述工作经历信息进行分词及量化操作,得到工作经历信息特征向量;从所述工作经历信息特征向量中提取公司实体向量、职务实体向量及工作关系向量;对所述公司实体向量、所述职务实体向量及所述工作关系向量进行分类,并基于分类结果,构建工作经历知识图谱;从预设数据库中提取公司名称关键字及公司主要人员信息,根据所述公司实体向量及所述公司名称关键字,从所述预设数据库中匹配相似公司名称集;根据所述公司主要人员信息,从所述相似公司名称集中筛选出与所述公司实体向量对应的相同公司名称;从所述预设数据库中提取所述相同公司名称中所有人员的数据作为所述待分析人员关联的第一人群数据。3.如权利要求2所述的人员关系分析方法,其特征在于,所述从所述工作经历信息特征向量中提取公司实体向量、职务实体向量及工作关系向量,包括:根据所述工作经历信息特征向量,从预设工作经历词典中匹配潜在词集合;利用预训练完成的实体及关系提取模型,对所述潜在词集合及所述工作经历信息特征向量进行编码,得到工作经历字符表征向量及潜在词表征向量;基于所述实体及关系提取模型中的注意力机制,将所述工作经历字符表征向量及所述潜在词表征向量进行加权融合,得到融合向量;利用所述实体及关系提取模型,对所述融合向量分别进行单向编码及反向编码,得到单向特征向量及反向特征向量;利用所述实体及关系提取模型,拼接所述单向特征向量及所述反向特征向量,得到所述工作经历信息的输出状态序列;利用所述实体及关系提取模型中的一阶Viterbi算法对所述输出状态序列进行分类并标注概率排序,选择概率最大的向量作为公司实体向量、职务实体向量及工作关系向量。4.如权利要求1所述的人员关系分析方法,其特征在于,所述对所述第一人群数据进行语义分析,得到所述待分析人员的同事关系数据,包括:提取所述第一人群数据中相关公司信息及对应的相关人员在职时间信息;提取所述工作经历信息中所述待分析人员的公司实体向量对应的目标人员在职时间;匹配所述公司实体向量与所述相关公司信息,得到匹配结果;当所述匹配结果为匹配时,判断所述相关人员在职时间信息与所述目标人员在职时间
是否有重叠;选取所述相关人员在职时间信息与所述目标人员在职时间之间的重叠数据,根据所述重叠数据对应的相关人员确定所述待分析人员的同事关系数据。5.如权利要求3所述的人员关系分析方法,其特征在于,所述利用预训练完成的实体及关系提取模型,对所述潜在词集合及所述工作经历信息特征向量进行编码,得到工作经历字符表征向量及潜在词表征向量之前,所...

【专利技术属性】
技术研发人员:黄敏周伟杰熊善良蔡文笔韦有朋洪丰
申请(专利权)人:北京海卓飞网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1