一种基于云服务的简历邮件解析系统及方法技术方案

技术编号:13969662 阅读:51 留言:0更新日期:2016-11-10 04:26
本发明专利技术设计了一种基于云服务的简历邮件解析系统及方法,在保证匹配正确率的同时可以匹配自由格式的简历,以及匹配分段的工作经历和教育经历。本发明专利技术可以为各种不同文件格式、不同语言、自由排版的简历提取所有字段,格式化为标准的统一格式的简历。支持的文件格式有doc、docx,pdf、txt和html等,支持的语言有中文和英文。对中文简历的解析提取正确率在95%以上,每分钟可以解析200—300份简历,每天可以处理15—30万份简历,节省人工简历处理时间达99.9%,节约人力成本超过85%。本发明专利技术部署在互联网上,可以为各招聘网站、软件公司、猎头公司/人才中介机构和企业的HR部门提供简历的解析服务。

【技术实现步骤摘要】

本专利技术涉及计算机
,特别是指一种基于云服务的简历邮件解析系统及方法
技术介绍
随着互联网技术的不断发展,通过电子邮件接收应聘简历的人才招聘方式不断得到各招聘者的青睐。目前,招聘者一般会在发布的招聘启事中公布用于接收应聘简历的招聘邮箱。这样,应聘者可以根据招聘单位公布的招聘邮箱,将简历邮件直接发送至招聘邮箱中。同时,招聘者通过简历解析系统对招聘邮箱中接收的简历邮件进行解析,提取出关键字和关键内容。从而减轻工作压力,提高效率。现有的很多技术方案采用简单的关键字匹配方法,比如要提取简历中的姓名,一定要在姓名的内容前找到“姓名”的关键字,性别前要找到“性别”关键字,采用这种简单的关键字匹配的方法,只能匹配特定格式的简历,对自由格式的简历匹配准确率低。而且现有的很多方案不能匹配工作经历和教育经历中的分段经历,导致无法知道该人才在特定的时间内处于什么阶段。
技术实现思路
针对上述现有技术的缺陷及存在的技术问题,本专利技术设计了一种基于云服务的简历邮件解析系统及方法,在保证匹配正确率的同时可以匹配自由格式的简历,以及匹配分段的工作经历和教育经历。本专利技术解决其技术问题所采用的技术方案是:一种基于云服务的简历邮件解析系统及方法,系统是指基于云服务开发的一种应用系统,其实施流程如下:1、企业HR登陆系统,将收到的各类简历邮件上传到系统中;2、系统判断简历格式是否支持,将格式符合系统要求的简历文件进行解析;3、系统将解析后的简历统一格式化后导出;进一步地,所述简历邮件解析系统支持的文件格式有doc、docx、pdf、txt和html,支持的语言包括中文和英文;进一步地,所述简历邮件解析系统根据如下方法对简历进行解析:首先提取简历语言,按照不同语言初始化解析器,再采用分部提取的方法,先按照关键字等特征提取简历中的类,然后对工作经历类、教育经历类和项目经验类进行提取分段,再对类和分段提取字段,如果未提取到关键信息类再对简历文本进行一次回溯匹配。进一步地,所述类为:具有某一共同特征的文本,比如在简历中的基本信息类、工作经历类、教育经历类、项目经验类等。进一步地,所述分段为:指类中某时间阶段关联的文本,比如工作经历、教育经历、项目经验中某一时间段的文本。进一步地,所述字段:是指简历文本中表达实际含义的最小单位,比如“男”、“女”这种是只有内容,没有标题的字段,还有一种是“工作地:上海”这种既有标题又有内容的字段。进一步地,对于没有关键字的简历内容,采用云端的特征匹配的算法,对简历的姓名、公司、行业、职位、职能、学校、专业、证书等内容和部署在云上的特征库进行匹配,极大的提高了匹配的准确度和完整度。进一步地,对于简历内容中包含时间段的内容采用回溯算法,时间段是一个比较特殊的文本信息,一般出现在工作经历、教育经历和项目经验中,如果在按照关键字匹配的时候未匹配到工作经历、教育经历和项目经验的类信息,但是文本中又出现了时间段,这时就需要在时间段附近寻找类的特征信息,比如找到了类似某某公司,那么可以基本确定这是工作经历,这时就可以启动回溯算法,重新去提取工作经历,然后再执行一遍提取分段,提取字段的过程。基于上述专利技术的简历邮件解析系统及方法,与现有技术相比,本专利技术可以为各种不同文件格式、不同语言、自由排版的简历提取所有字段,格式化为标准的统一格式的简历。支持的文件格式有doc、docx,pdf、txt和html等,支持的语言有中文和英文。对中文简历的解析提取正确率在95%以上,每分钟可以解析200—300份简历,每天可以处理15—30万份简历,节省人工简历处理时间达99.9%,节约人力成本超过85%。本专利技术部署在互联网上,可以为各招聘网站、软件公司、猎头公司/人才中介机构和企业的HR部门提供简历的解析服务。附图说明图1是本专利技术的总体思路流程示意图。图2是本专利技术的简历解析流程图。具体实施方式下面结合附图对本专利技术的具体实施方式作详细说明,进一步阐明本专利技术的优点及相对于现有技术的突出贡献,可以理解的,下述的实施例仅是对本专利技术较佳实施方案的详细说明,不应该解释为对本专利技术技术方案的任何限制。如图1-2所示,本专利技术提供一种基于云服务的简历邮件解析系统及方法,系统是指基于云服务开发的一种应用系统,其实施流程如下:1、企业HR登陆系统,将收到的各类简历邮件上传到系统中;2、系统判断简历格式是否支持,将格式符合系统要求的简历文件进行解析;3、系统将解析后的简历统一格式化后导出;进一步地,所述简历邮件解析系统支持的文件格式有doc、docx、pdf、txt和html,支持的语言包括中文和英文;进一步地,所述简历邮件解析系统根据如下方法对简历进行解析:首先提取简历语言,按照不同语言初始化解析器,再采用分部提取的方法,先按照关键字等特征提取简历中的类,然后对工作经历类、教育经历类和项目经验类进行提取分段,再对类和分段提取字段,如果未提取到关键信息类再对简历文本进行一次回溯匹配。进一步地,所述类为:具有某一共同特征的文本,比如在简历中的基本信息类、工作经历类、教育经历类、项目经验类等。进一步地,所述分段为:指类中某时间阶段关联的文本,比如工作经历、教育经历、项目经验中某一时间段的文本。进一步地,所述字段:是指简历文本中表达实际含义的最小单位,比如“男”、“女”这种是只有内容,没有标题的字段,还有一种是“工作地:上海”这种既有标题又有内容的字段。进一步地,对于没有关键字的简历内容,采用云端的特征匹配的算法,对简历的姓名、公司、行业、职位、职能、学校、专业、证书等内容和部署在云上的特征库进行匹配,极大的提高了匹配的准确度和完整度。进一步地,对于简历内容中包含时间段的内容采用回溯算法,时间段是一个比较特殊的文本信息,一般出现在工作经历、教育经历和项目经验中,如果在按照关键字匹配的时候未匹配到工作经历、教育经历和项目经验的类信息,但是文本中又出现了时间段,这时就需要在时间段附近寻找类的特征信息,比如找到了类似某某公司,那么可以基本确定这是工作经历,这时就可以启动回溯算法,重新去提取工作经历,然后再执行一遍提取分段,提取字段的过程。基于上述专利技术的简历邮件解析系统及方法,与现有技术相比,本专利技术可以为各种不同文件格式、不同语言、自由排版的简历提取所有字段,格式化为标准的统一格式的简历。支持的文件格式有doc、docx,pdf、txt和html等,支持的语言有中文和英文。对中文简历的解析提取正确率在95%以上,每分钟可以解析200—300份简历,每天可以处理15—30万份简历,节省人工简历处理时间达99.9%,节约人力成本超过85%。本专利技术部署在互联网上,可以为各招聘网站、软件公司、猎头公司/人才中介机构和企业的HR部门提供简历的解析服务。本文档来自技高网...

【技术保护点】
一种基于云服务的简历邮件解析系统及方法,其特征在于:所述系统是指基于云服务开发的一种应用系统,使整个系统实现简历解析后以统一格式导出。

【技术特征摘要】
1.一种基于云服务的简历邮件解析系统及方法,其特征在于:所述系统是指基于云服务开发的一种应用系统,使整个系统实现简历解析后以统一格式导出。2.根据权利要求1所述的一种基于云服务的简历邮件解析系统及方法,其特征在于:所述简历邮件解析系统支持的文件格式有doc、docx、pdf、txt和html,支持的语言包括中文和英文。3.根据权利要求1所述的一种基于云服务的简历邮件解析系统及方法,其特征在于:所述简历邮件解析系统根据如下方法对简历进行解析:首先提取简历语言,按照不同语言初始化解析器,再采用分部提取的方法,先按照关键字等特征提取简历中的类,然后对工作经历类、教育经历类和项目经验类进行提取分段,再对类和分段提取字段,如果未提取到关键信息类再对简历文本进行一次回溯匹配。4.根据...

【专利技术属性】
技术研发人员:包谞斌胡健钱宏立
申请(专利权)人:嘉兴飞刀软件科技有限公司
类型:发明
国别省市:浙江;33

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1