简历解析方法和装置、设备及存储介质制造方法及图纸

技术编号:39174228 阅读:9 留言:0更新日期:2023-10-27 08:22
本申请涉及一种简历解析方法和装置、设备及存储介质,其中方法包括:读取当前要解析的简历内容;对简历内容进行段落划分,得到多个不同的段落,并对于不同的段落调用不同的信息提取模块,通过信息提取模块由对应的段落中提取出相应的信息;其中,不同的信息提取模块用于提取简历中的不同信息。其实现了对简历中的信息进行自动识别提取的过程,并且由于在对简历中的信息进行自动识别提取时,先对简历内容进行了段落划分,不同的段落调用不同的信息提取模块,这也就更进一步地保证了所提取到的信息的准确性。息的准确性。息的准确性。

【技术实现步骤摘要】
简历解析方法和装置、设备及存储介质


[0001]本申请涉及文本解析
,尤其涉及一种简历解析方法和装置、设备及存储介质。

技术介绍

[0002]简历解析是指提取简历中的信息,构建人才库并进行有效的简历评估。目前,应聘者提交到企业的简历样式各不相同,企业接收到应聘者的简历后通常需要进行简历解析,并根据解析结果进行简历的筛选,以便于从中选取出与当前所招职位相匹配的简历。但是由于应聘者所提交的简历样式各不相同,这就使得在进行简历解析筛选时,需要人工进行简历内容的提取和解析,这就使得简历解析的效率偏低,不够智能化。

技术实现思路

[0003]有鉴于此,本申请提出了一种简历解析方法,可以有效提高简历解析的智能化。
[0004]根据本申请的一方面,提供了一种简历解析方法,其特征在于,包括:
[0005]读取当前要解析的简历内容;
[0006]对所述简历内容进行段落划分,得到多个不同的段落,并对于不同的段落调用不同的信息提取模块,通过所述信息提取模块由对应的段落中提取出相应的信息;
[0007]其中,不同的信息提取模块用于提取简历中的不同信息。
[0008]在一种可能的实现方式中,在读取当前要解析的简历内容之前,还包括:
[0009]对当前要解析的简历进行格式判断;
[0010]在判断出当前要解析的简历的格式不符合所述预设格式时,则对所述简历进行格式转换,将所述简历的格式转换为所述预设格式。
[0011]在一种可能的实现方式中,对所述简历内容进行段落划分时,采用同义词匹配搜索算法进行。
[0012]在一种可能的实现方式中,对于不同的段落调用不同的信息提取模块时,根据不同的段落中的关键词进行所述信息提取模块的匹配提取。
[0013]在一种可能的实现方式中,所述信息提取模块包括基本信息提取模块、教育信息提取模块、项目信息提取模块、工作信息提取模块和其他信息提取模块中的至少一种。
[0014]在一种可能的实现方式中,对于不同的段落调用不同的信息提取模块,通过所述信息提取模块由对应的段落中提取出相应的信息时,包括:将划分后得到的各段落进行切块,得到多个数据块,并根据不同的所述数据块调用所述信息提取模块中的识别提取识别子模块进行信息的识别提取。
[0015]根据本申请的另一方面,还提供了一种简历解析装置,包括简历内容读取单元、段落划分单元和信息提取单元;
[0016]所述简历内容读取单元,被配置为读取当前要解析的简历内容;
[0017]所述段落划分单元,被配置为对所述简历内容进行段落划分,得到多个不同的段
落;
[0018]所述信息提取单元,被配置为对于不同的段落调用不同的信息提取模块,通过所述信息提取模块由对应的段落中提取出相应的信息;
[0019]其中,不同的信息提取模块用于提取简历中的不同信息。
[0020]在一种可能的实现方式中,还包括格式判断单元和格式转换单元;
[0021]所述格式判断单元,被配置为对当前要解析的简历进行格式判断;
[0022]所述格式转换单元,被配置为在所述格式判断出当前要解析的简历的格式不符合所述预设格式时,则对所述简历进行格式转换,将所述简历的格式转换为所述预设格式。
[0023]根据本申请的另一方面,还提供了一种简历解析设备,包括:
[0024]处理器;
[0025]用于存储处理器可执行指令的存储器;
[0026]其中,所述处理器被配置为执行所述可执行指令时实现前面任一所述的方法。
[0027]根据本申请的另一方面,还提供了一种非易失性计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前面任一所述的方法。
[0028]通过对简历内容进行段落划分,然后对于划分后的每一段落,调用对应的信息提取模块,由信息提取模块对段落中的信息进行提取,这就实现了对简历中的信息进行自动识别提取的过程,并且由于在对简历中的信息进行自动识别提取时,先对简历内容进行了段落划分,不同的段落调用不同的信息提取模块,这也就更进一步地保证了所提取到的信息的准确性。
[0029]根据下面参考附图对示例性实施例的详细说明,本申请的其它特征及方面将变得清楚。
附图说明
[0030]包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本申请的示例性实施例、特征和方面,并且用于解释本申请的原理。
[0031]图1示出本申请实施例的简历解析方法的流程图;
[0032]图2示出本申请实施例的简历解析方法中进行文件格式转换的示意图;
[0033]图3示出本申请实施例的简历解析方法的使用场景示意图;
[0034]图4示出本申请实施例的简历解析方法中在对简历文件进行分段时所建立的Trie树结构示意图;
[0035]图5示出本申请实施例的简历解析方法中对基本信息段进行分块时所采用的基本信息段中的同义词的示例图;
[0036]图6示出本申请实施例的简历解析方法的另一示例图;
[0037]图7示出本申请实施例的简历解析装置的结构框图;
[0038]图8示出本申请实施例的简历解析设备的结构框图。
具体实施方式
[0039]以下将参考附图详细说明本申请的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除
非特别指出,不必按比例绘制附图。
[0040]在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
[0041]另外,为了更好的说明本申请,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本申请同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本申请的主旨。
[0042]图1示出根据本申请一实施例的简历解析方法的流程图。如图1所示,该方法包括:步骤S100,读取当前要解析的简历内容。步骤S200,对简历内容进行段落划分,得到多个不同的段落,并对于不同的段落调用不同的信息提取模块,通过信息提取模块由对应的段落中提取出相应的信息。其中,不同的信息提取模块用于提取简历中的不同信息。
[0043]由此,本申请实施例的简历解析方法,通过对简历内容进行段落划分,然后对于划分后的每一段落,调用对应的信息提取模块,由信息提取模块对段落中的信息进行提取,这就实现了对简历中的信息进行自动识别提取的过程,并且由于在对简历中的信息进行自动识别提取时,先对简历内容进行了段落划分,不同的段落调用不同的信息提取模块,这也就更进一步地保证了所提取到的信息的准确性。
[0044]其中,需要指出的是,由于应聘者上传到系统中的简历格式可能会存在多种,如:PDF格式、word格式或者是图片jpg格式等。因本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种简历解析方法,其特征在于,包括:读取当前要解析的简历内容;对所述简历内容进行段落划分,得到多个不同的段落,并对于不同的段落调用不同的信息提取模块,通过所述信息提取模块由对应的段落中提取出相应的信息;其中,不同的信息提取模块用于提取简历中的不同信息。2.根据权利要求1所述的方法,其特征在于,在读取当前要解析的简历内容之前,还包括:对当前要解析的简历进行格式判断;在判断出当前要解析的简历的格式不符合所述预设格式时,则对所述简历进行格式转换,将所述简历的格式转换为所述预设格式。3.根据权利要求1所述的方法,其特征在于,对所述简历内容进行段落划分时,采用同义词匹配搜索算法进行。4.根据权利要求1所述的方法,其特征在于,对于不同的段落调用不同的信息提取模块时,根据不同的段落中的关键词进行所述信息提取模块的匹配提取。5.根据权利要求1至4任一项所述的方法,其特征在于,所述信息提取模块包括基本信息提取模块、教育信息提取模块、项目信息提取模块、工作信息提取模块和其他信息提取模块中的至少一种。6.根据权利要求5所述的方法,其特征在于,对于不同的段落调用不同的信息提取模块,通过所述信息提取模块由对应的段落中提取出相应的信息时,包括:将划分后得到的各段落进行切块,得到多个数据...

【专利技术属性】
技术研发人员:王玲赖心华
申请(专利权)人:北京大微天成科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1