【技术实现步骤摘要】
一种简历结构化处理方法
本专利技术涉及计算机领域,尤其涉及一种简历结构化处理方法。
技术介绍
随着网络的快速发展,传统的招聘方式已经发生改变,网络招聘成为主流。在国外,运用互联网进行人才招聘的企业和求职者不在少数,许多优秀的第三方人才招聘网站也脱颖而出。在国内,有越来越多的网络招聘平台,著名的有前程无忧、智联招聘、58同城等,这些传统的平台主要是进行社会招聘为主的比较多,同时,传统招聘网站的市场份额正在逐渐缩小,现阶段中国互联网招聘公司手机应用软件的使用规模达720万人之多,手机移动端的发展趋势较好。另外,在技术研究和新技术引入方面比较少,导致了招聘平台缺少了用户功能上的优化,如简历书写方面,现在的招聘平台简历书写都是比较繁琐的,还有求职互动方面,很多求职者简历投出去了,但大部分简历石沉大海,得不到企业的实际反馈。在当今互联网技术高速发展的时代,招聘平台更重要的是站在用户的角度去想问题,如何才能让用户快速生成简历,如何才能让求职者找到合适的工作,这些问题是现在招聘平台都需要去考虑的问题。在实践的过程中发现,由于求职者简历数量的巨大,简历填写过程繁杂,耗时久,每更换 ...
【技术保护点】
1.一种简历结构化处理方法,该方法以计算机、移动智能设备以及与计算机或移动智能设备连接的服务器为应用载体,其特征在于,所述服务器设有存储器和内存单元,所述存储器存储有版块标签匹配规则列表和信息匹配规则列表,其中,所述版块标签匹配规则列表中的每个版块标签均设有版块标题,所述信息匹配规则列表包括若干个板块和若干信息项,每个版块与所述版块标签匹配规则列表中的版块标签一一对应,每个信息项均与所述的某一版块关联且每个信息项均关联有信息匹配规则,该方法包括以下步骤:S1:源文件识别:所述计算机或移动智能设备把源文件录入到所述服务器中进行识别,识别出源文件的文字内容数据;S2:文字预处理 ...
【技术特征摘要】
1.一种简历结构化处理方法,该方法以计算机、移动智能设备以及与计算机或移动智能设备连接的服务器为应用载体,其特征在于,所述服务器设有存储器和内存单元,所述存储器存储有版块标签匹配规则列表和信息匹配规则列表,其中,所述版块标签匹配规则列表中的每个版块标签均设有版块标题,所述信息匹配规则列表包括若干个板块和若干信息项,每个版块与所述版块标签匹配规则列表中的版块标签一一对应,每个信息项均与所述的某一版块关联且每个信息项均关联有信息匹配规则,该方法包括以下步骤:S1:源文件识别:所述计算机或移动智能设备把源文件录入到所述服务器中进行识别,识别出源文件的文字内容数据;S2:文字预处理:所述服务器对识别到的文字内容数据进行逐项提取,生成文本集合并存储在存储器中,其中,所述文本集合包括若干个文本单元,所述文本单元均设有排列序号,所述排列序号根据所述文本单元在文本中的出现顺序生成,且提取时对识别到的文字进行去重处理,去掉文字内容中的乱码、空白行、空白段落以及重复段落;S3:在存储器中调取版块标签匹配规则列表并放入内存单元;S4:标记版块标签:按顺序在存储器中调取一个文本单元并与所述的版块标签匹配规则列表进行逐条比对;若文本单元与正在比对的某一版块标签匹配规则相匹配,则对该文本单元进行信息关联,将其关联匹配到的版块标签并进行标记;若文本单元不存在匹配的版块标签匹配规则,则不对该文本单元进行操作;重复步骤S4直至完成对所有文本单元的匹配;S5:版块标签去重:调取所述文本集合中所有标记了标签的文本单元,并判断是否存在重复标记的版块标签,若存在重复的版块标签,根据文本单元对应的排列序号筛选出最先出现的文本单元,对其余与版块标签重复关联的文本单元去除其关联关系及标记的版块标签,并进入步骤S6,若不存在重复关联的版块标签,进入步骤S6;S6:创建版块单元:按照所述信息匹配规则列表中版块的顺序调取一个版块标签,并判断所述文本集合中是否存在标记了所述版块标签的文本单元,若存在,调取标记了所述版块标签的文本单元,以所述版块标签对应的版块标题在结果集中创建一个版块单元,并把所述新创建的版块单元作为当前选定的版块单元,进入步骤S6;若不存在,进入步骤S10;S7:根据所述排列序号,把通过步骤S6调取的文本单元后面的一项或若干相文本单元放入内存单元中,直至遇到下一个关联有版块标签的文本单元或至文本集合的末项;再判断所述版块标签是否存在关联的信息项,若存在则进入步骤S8;若不存在,把内存单元中的文本单元的内容按顺序放入所述选定的版块单元中,并进入步骤S10;S8:按顺序调取所述信息匹配规则列表中对应版块下的一个信息项以及该信息项关联的信息项匹配规则,把所述信息项匹配规则与通过步骤S6放入内存单元中的文本单元进行逐条匹配,若所述文本单元中存在与所述信息项匹配规则匹配的内容,则根据所述信息项匹配规则生成信息项匹配结果,关联所述信息项与对应的信息项匹配结果,并把所述信息项与所述信息项匹配结果放进所述选定的版块单元,并进入步骤S9;若所述文本单元中不存在与所述信息项匹配规则匹配的内容,进入步骤S9;S9:判断所述信息匹配规则列表中对应版块下是否存在未进行匹配的信息项,若存在,进入步骤S8,若不存在,进入步骤S10;S10:判断所述信息匹配规则列表中是否存在未调取的版块标签,若存在,进入步骤S6;若不存在,进入步骤S11;S11:根据所述结果集生成结构化电子简历并存储在服务器中。2.根据权利要求1所述的一种简历结构化处理方法,其特征在于,所述源文件包括简历图片...
【专利技术属性】
技术研发人员:林巧彬,伍林斌,孔令贤,何正,苏祖军,郭洋,范金庆,杨土华,林煜斌,
申请(专利权)人:广东润弘科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。