一种简历文件解析方法技术

技术编号:29219938 阅读:30 留言:0更新日期:2021-07-10 00:59
本发明专利技术涉及一种简历文件解析方法,包括:获取用户上传和/或投递的简历文件;基于预设文件类别对简历文件进行分类;对分类后的简历文件进行解析获取简历文件中的文本内容;基于预设分析框架对文本内容进行中文分词得到结构化文件。本发明专利技术的有益效果为:通过对获取到的简历文件进行分类,然后对分类后的简历文件进行解析,得到解析后的文本内容,对文本内容进行中文分词进而得到机构化的简历文件,从而使得对简历文件的解析更加的准确不易出错。使得对简历文件的解析更加的准确不易出错。使得对简历文件的解析更加的准确不易出错。

【技术实现步骤摘要】
一种简历文件解析方法


[0001]本专利技术属于数据处理
,具体涉及一种建立文件解析方法。

技术介绍

[0002]简历信息是招聘公司判定求职者是否符合职位要求的重要依据。招聘人员会通过接收邮件、登录招聘网站等方式浏览大量的简历信息,而这些简历信息往往是采用不同的表格模板制作的。而目前市场上存在的简历分析的方法,通常采用将简历文本生成图片,然后对图片进行模块化切割,再采用图像识别技术获取到特定模块的文本。
[0003]上述通过图像模块化处理的方式来获得简历信息的方式,对简历信息的格式要求非常的严格,对与不同模块格式的简历,很容易出现模块划分出错的情况,进而导致解析率不高。

技术实现思路

[0004]为了解决现有技术存在的易出错、解析率不高等问题,本专利技术提供了一种简历文件解析方法,其具有准确率高、解析更加准确等特点。
[0005]根据本专利技术的具体实施方式的一种简历文件解析方法,包括:
[0006]获取用户上传和/或投递的简历文件;
[0007]基于预设文件类别对所述简历文件进行分类;...

【技术保护点】

【技术特征摘要】
1.一种简历文件解析方法,其特征在于,包括:获取用户上传和/或投递的简历文件;基于预设文件类别对所述简历文件进行分类;对分类后的所述简历文件进行解析获取所述简历文件中的文本内容;基于预设分析框架对所述文本内容进行中文分词得到结构化文件。2.根据权利要求1所述的简历文件解析方法,其特征在于,所述基于预设文件类别对所述简历文件进行分类包括:使用文本转换器将所述简历文件转换为所述预设文件类别。3.根据权利要求1所述的简历文...

【专利技术属性】
技术研发人员:宋杰
申请(专利权)人:上海中通吉网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1