【技术实现步骤摘要】
一种信息处理方法、装置、电子设备、计算机可读介质
[0001]本公开涉及数据处理
,尤其涉及一种信息处理方法、装置、电子设备、计算机可读介质。
技术介绍
[0002]随着计算机技术的普及,电子文档的应用领域越来越多。例如,电子文档可以用于智能招聘等应用领域。
[0003]实际上,智能招聘这一应用领域中常见的电子文档包括简历。其中,简历用于介绍某个人的相关内容。
[0004]然而,如何从简历中解析出简历投递者的姓名是一项亟待解决的技术问题。
技术实现思路
[0005]为了解决上述技术问题,本公开提供了一种信息处理方法、装置、电子设备、计算机可读介质。
[0006]为了实现上述目的,本公开提供的技术方案如下:
[0007]本公开提供一种信息处理方法,所述方法包括:
[0008]在获取到待处理文档之后,从所述待处理文档中提取至少一个候选姓名;
[0009]根据各所述候选姓名的至少一个参考信息,确定各所述候选姓名的重要程度表征数据;所述至少一个参考信息包括展示状态描述信息和/或文档关联内容描述信息;
[0010]依据各所述候选姓名的重要程度表征数据,从所述至少一个候选姓名中选择目标姓名;所述目标姓名的重要程度表征数据满足预设选择条件。
[0011]在一种可能的实施方式下,所述展示状态描述信息包括字符尺寸描述信息、字符样式描述信息、文档位置描述信息、以及字符突显状态描述信息中的至少一个;所述字符尺寸描述信息用于描述所述候选姓名在所述待处理文档 ...
【技术保护点】
【技术特征摘要】
1.一种信息处理方法,其特征在于,所述方法包括:在获取到待处理文档之后,从所述待处理文档中提取至少一个候选姓名;根据各所述候选姓名的至少一个参考信息,确定各所述候选姓名的重要程度表征数据;所述至少一个参考信息包括展示状态描述信息和/或文档关联内容描述信息;依据各所述候选姓名的重要程度表征数据,从所述至少一个候选姓名中选择目标姓名;所述目标姓名的重要程度表征数据满足预设选择条件。2.根据权利要求1所述的方法,其特征在于,所述展示状态描述信息包括字符尺寸描述信息、字符样式描述信息、文档位置描述信息、以及字符突显状态描述信息中的至少一个;所述字符尺寸描述信息用于描述所述候选姓名在所述待处理文档中所呈现的尺寸;所述字符样式描述信息用于描述所述候选姓名在所述待处理文档中所呈现的字体样式;所述文档位置描述信息用于描述所述候选姓名在所述待处理文档中所处位置;所述字符突显状态描述信息用于描述所述候选姓名在所述待处理文档中是否按照预设突显状态进行展示。3.根据权利要求1所述的方法,其特征在于,所述文档关联内容描述信息包括第一关联内容、文档出现次数、第二关联内容、第三关联内容、以及第四关联内容中的至少一个;所述第一关联内容在所述待处理文档中对应的行位置与所述候选姓名在所述待处理文档中对应的行位置相同;所述文档出现次数用于描述所述候选姓名在所述待处理文档中出现的次数;所述第二关联内容属于第一信息类型,而且所述第二关联内容在所述待处理文档中对应的行位置与所述候选姓名在所述待处理文档中对应的行位置相同;所述第三关联内容属于第二信息类型,而且所述第三关联内容在所述待处理文档中对应的行位置与所述候选姓名在所述待处理文档中对应的行位置之间满足第一位置条件;所述第四关联内容在所述待处理文档中对应的行位置与所述候选姓名在所述待处理文档中对应的行位置之间满足第二位置条件,而且所述第四关联内容命中所述第二位置条件对应的至少一个第一候选字符串中的第一目标字符串。4.根据权利要求1所述的方法,其特征在于,所述候选姓名的个数为N;第n个候选姓名的重要程度表征数据的确定过程,包括:初始化所述第n个候选姓名的重要程度表征数据;所述n为正整数,n≤N,N为正整数;依据所述第n个候选姓名的至少一个参考信息,更新所述第n个候选姓名的重要程度表征数据。5.根据权利要求4所述的方法,其特征在于,所述至少一个参考信息包括所述展示状态描述信息;所述依据所述第n个候选姓名的至少一个参考信息,更新所述第n个候选姓名的重要程度表征数据,包括以下步骤中的至少一个:利用所述第n个候选姓名的展示状态描述信息中字符尺寸描述信息对应的第一更新操作,更新所述第n个候选姓名的重要程度表征数据;利用所述第n个候选姓名的展示状态描述信息中字符样式描述信息的文档使用频率对应的第二更新操作,更新所述第n个候选姓名的重要程度表征数据;所述文档使用频率用于描述所述字符样式描述信息在所述待处理文档中所呈现的字符使用状态;利用所述第n个候选姓名的展示状态描述信息中文档位置描述信息对应的第三更新操作,更新所述第n个候选姓名的重要程度表征数据;
若所述第n个候选姓名的展示状态描述信息中字符突显状态描述信息满足预设突显条件,则利用所述预设突显条件对应的第四更新操作,更新所述第n个候选姓名的重要程度表征数据。6.根据权利要求4所述的方法,其特征在于,所述至少一个参考信息包括所述文档关联内容描述信息;所述依据所述第n个候选姓名的至少一个参考信息,更新所述第n个候选姓名的重要程度表征数据,包括以下步骤中的至少一个:若所述第n个候选姓名的文档关联内容描述信息中第一关联内容的字符个数高于预设字符个数阈值,则利用所述预设字符个数阈值对应的第五...
【专利技术属性】
技术研发人员:张开伟,
申请(专利权)人:北京字跳网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。