基于实体知识推理的简历异常检测方法及系统技术方案

技术编号:25042085 阅读:22 留言:0更新日期:2020-07-29 05:32
本发明专利技术提供了一种基于实体知识推理的简历异常检测方法及系统,所述方法包括:对多个简历信息分别进行结构化信息提取得到结构化简历,所述结构化简历包括预设结构化字段和对应的简历实体;基于预设的特征类别和结构化字段的对应关系提取所述多个结构化简历得到不同特征类别的知识图谱,根据选定简历实体确定所有知识图谱中的关联知识图谱;基于预设检测规则对所述关联知识图谱进行异常检测得到异常检测结果并向用户反馈,本发明专利技术可通过形成知识图谱并基于知识图谱进行简历实体知识推理确定简历信息的内容是否存在异常,提高简历信息中异常检测的准确度和效率,节省人力成本。

【技术实现步骤摘要】
基于实体知识推理的简历异常检测方法及系统
本专利技术涉及简历信息处理
,尤其涉及一种基于实体知识推理的简历异常检测方法及系统。
技术介绍
在简历招聘领域,确定应聘者提供的简历信息上描述的经历是否属实是一个比较耗时耗力的工作,现在的简历招聘对此的解决方式通常是采用背景调查,但是背景调查过程强烈依赖于工作人员的专业和尽职程度。同时,工作人员在针对简历进行调查时,也没有办法针对细节的内容,特别是专业领域的内容进行详细调查,因为工作人员往往不是这个该专业领域的专业人士。因此,现有的招聘过程中,背景调查的效果往往不能尽如人意,甚至完全不起作用,仍然无法有效确定应聘者的简历信息中描述的经历是否属实。
技术实现思路
本专利技术的一个目的在于提供一种基于实体知识推理的简历异常检测方法,通过形成知识图谱并基于知识图谱进行简历实体知识推理确定简历信息的内容是否存在异常,提高简历信息中异常检测的准确度和效率,节省人力成本。本专利技术的另一个目的在于提供一种基于实体知识推理的简历异常检测系统。本专利技术的再一个目的在于提供一种计算机设备。本专利技术的还一个目的在于提供一种可读介质。为了达到以上目的,本专利技术一方面公开了一种基于实体知识推理的简历异常检测方法,包括:对多个简历信息分别进行结构化信息提取得到结构化简历,所述结构化简历包括预设结构化字段和对应的简历实体;基于预设的特征类别和结构化字段的对应关系提取所述多个结构化简历得到不同特征类别的知识图谱,根据选定简历实体确定所有知识图谱中的关联知识图谱;基于预设检测规则对所述关联知识图谱进行异常检测得到异常检测结果并向用户反馈。优选的,所述对多个简历信息分别进行结构化信息提取得到多个结构化简历具体包括:通过预设的结构化提取模型识别所述简历信息中与预设的结构化字段对应的简历实体;根据所述结构化字段和对应的简历实体形成结构化简历。优选的,所述基于预设的特征类别和结构化字段的对应关系提取所述多个结构化简历得到不同特征类别的知识图谱,根据选定简历实体确定所有知识图谱中的关联知识图谱具体包括:根据预设的特征类别和结构化字段的对应关系对结构化简历中的结构化字段和对应的简历实体进行信息提取得到对应于预设特征类别的知识图谱;根据选定简历实体确定具有相同简历实体的知识图谱为关联知识图谱。优选的,所述结构化字段的类型包括简历版本、人员身份和职业发展,所述根据选定简历实体确定具有相同简历实体的知识图谱为关联知识图谱具体包括:确定简历版本和人员身份对应的简历实体相同的知识图谱为个人同版本关联知识图谱,确定人员身份对应的简历实体相同的知识图谱为个人不同版本关联知识图谱,确定职业发展对应的简历实体相同的知识图谱为不同个人关联知识图谱。优选的,所述检测规则包括以下规则的至少之一:个人同版本关联知识图谱中预设时间范围内各职业发展的简历实体是否在预计正常范围内、个人不同版本关联知识图谱间相同结构化字段的简历实体是否保持一致以及不同个人关联知识图谱的简历实体是否符合聚类特性。本专利技术还公开了一种基于实体知识推理的简历异常检测系统,包括:结构化提取单元,用于对多个简历信息分别进行结构化信息提取得到结构化简历,所述结构化简历包括预设结构化字段和对应的简历实体;知识图谱关联单元,用于基于预设的特征类别和结构化字段的对应关系提取所述多个结构化简历得到不同特征类别的知识图谱,根据选定简历实体确定所有知识图谱中的关联知识图谱;异常检测单元,用于基于预设检测规则对所述关联知识图谱进行异常检测得到异常检测结果并向用户反馈。优选的,所述结构化提取单元具体用于通过预设的结构化提取模型识别所述简历信息中与预设的结构化字段对应的简历实体,根据所述结构化字段和对应的简历实体形成结构化简历。优选的,所述知识图谱关联单元具体用于根据预设的特征类别和结构化字段的对应关系对结构化简历中的结构化字段和对应的简历实体进行信息提取得到对应于预设特征类别的知识图谱,根据选定简历实体确定具有相同简历实体的知识图谱为关联知识图谱。优选的,所述结构化字段的类型包括简历版本、人员身份和职业发展,所述知识图谱关联单元具体用于确定简历版本和人员身份对应的简历实体相同的知识图谱为个人同版本关联知识图谱,确定人员身份对应的简历实体相同的知识图谱为个人不同版本关联知识图谱,确定职业发展对应的简历实体相同的知识图谱为不同个人关联知识图谱。优选的,所述检测规则包括以下规则的至少之一:个人同版本关联知识图谱中预设时间范围内各职业发展的简历实体是否在预计正常范围内、个人不同版本关联知识图谱间相同结构化字段的简历实体是否保持一致以及不同个人关联知识图谱的简历实体是否符合聚类特性。本专利技术还公开了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述方法。本专利技术还公开了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述方法。本专利技术通过对简历信息进行结构化信息抽取得到结构化简历。将结构化简历根据预设的特征类别提取相应的结构化字段和简历实体形成不同特征类别的知识图谱,并进一步将形成的多个知识图谱相关联,从而对不同特征类别中关联的知识图谱进行知识推理,实现对于不同特征类别有针对性的异常检测。进一步基于预设检测规则对关联知识图谱进行异常检测可得到异常检测结果,即本专利技术可根据工作人员自定义的检测规则进行异常检测,实现检测规则的可配置。对于专业领域性强的简历信息,可设置符合专利特性的检测规则,进行有针对性的异常分析检测,有助于提高简历异常及虚假信息检测的准确度和效率。本专利技术可对简历信息进行自动异常检测及预警,无需人为判断,节省人力成本,为工作人员的招聘工作提供便利。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出本专利技术基于实体知识推理的简历异常检测方法一个具体实施例的流程图;图2示出本专利技术基于实体知识推理的简历异常检测方法一个具体实施例中S100的流程图;图3示出本专利技术基于实体知识推理的简历异常检测方法一个具体实施例中非结构化简历的示意图;图4示出本专利技术基于实体知识推理的简历异常检测方法一个具体实施例中结构化简历的示意图;图5示出本专利技术基于实体知识推理的简历异常检测方法一个具体实施例中S200的流程图;图6示出本专利技术基于实体知识推理的简历异常检测系统一个具体实施例的结构图;图7示出适于用来实现本专利技术实施例的计算机设备的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整本文档来自技高网...

【技术保护点】
1.一种基于实体知识推理的简历异常检测方法,其特征在于,包括:/n对多个简历信息分别进行结构化信息提取得到结构化简历,所述结构化简历包括预设结构化字段和对应的简历实体;/n基于预设的特征类别和结构化字段的对应关系提取所述多个结构化简历得到不同特征类别的知识图谱,根据选定简历实体确定所有知识图谱中的关联知识图谱;/n基于预设检测规则对所述关联知识图谱进行异常检测得到异常检测结果并向用户反馈。/n

【技术特征摘要】
1.一种基于实体知识推理的简历异常检测方法,其特征在于,包括:
对多个简历信息分别进行结构化信息提取得到结构化简历,所述结构化简历包括预设结构化字段和对应的简历实体;
基于预设的特征类别和结构化字段的对应关系提取所述多个结构化简历得到不同特征类别的知识图谱,根据选定简历实体确定所有知识图谱中的关联知识图谱;
基于预设检测规则对所述关联知识图谱进行异常检测得到异常检测结果并向用户反馈。


2.根据权利要求1所述的简历异常检测方法,其特征在于,所述对多个简历信息分别进行结构化信息提取得到多个结构化简历具体包括:
通过预设的结构化提取模型识别所述简历信息中与预设的结构化字段对应的简历实体;
根据所述结构化字段和对应的简历实体形成结构化简历。


3.根据权利要求1所述的简历异常检测方法,其特征在于,所述基于预设的特征类别和结构化字段的对应关系提取所述多个结构化简历得到不同特征类别的知识图谱,根据选定简历实体确定所有知识图谱中的关联知识图谱具体包括:
根据预设的特征类别和结构化字段的对应关系对结构化简历中的结构化字段和对应的简历实体进行信息提取得到对应于预设特征类别的知识图谱;
根据选定简历实体确定具有相同简历实体的知识图谱为关联知识图谱。


4.根据权利要求1所述的简历异常检测方法,其特征在于,所述结构化字段的类型包括简历版本、人员身份和职业发展,所述根据选定简历实体确定具有相同简历实体的知识图谱为关联知识图谱具体包括:
确定简历版本和人员身份对应的简历实体相同的知识图谱为个人同版本关联知识图谱,确定人员身份对应的简历实体相同的知识图谱为个人不同版本关联知识图谱,确定职业发展对应的简历实体相同的知识图谱为不同个人关联知识图谱。


5.根据权利要求1所述的简历异常检测方法,其特征在于,所述检测规则包括以下规则的至少之一:
个人同版本关联知识图谱中预设时间范围内各职业发展的简历实体是否在预计正常范围内、个人不同版本关联知识图谱间相同结构化字段的简历实体是否保持一致以及不同个人关联知识图谱的简历实体是否符合聚类特性。


6.一种基于实体知识推理的简历异常检测系统,其特征在于,包括:<...

【专利技术属性】
技术研发人员:李靖
申请(专利权)人:中国建设银行股份有限公司建信金融科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1