一种信息处理方法、装置、电子设备、计算机可读介质制造方法及图纸

技术编号:37333720 阅读:11 留言:0更新日期:2023-04-21 23:12
本公开公开了一种信息处理方法、装置、电子设备、计算机可读介质,该方法包括:在获取到待处理文档之后,先从该待处理文档中提取至少一个候选姓名;再根据各该候选姓名的至少一个参考信息,确定各该候选姓名的重要程度表征数据,以使该重要程度表征数据能够表示出该待处理文档围绕着该候选姓名进行介绍的可能性大小;最后,依据各该候选姓名的重要程度表征数据,从这些候选姓名中选择出重要程度表征数据满足预设选择条件的目标姓名,以使该目标姓名的重要程度表征数据能够表示出该待处理文档围绕着该目标姓名进行介绍的可能性最大,如此能够实现从该待处理文档中解析目标姓名的目的。的。的。

【技术实现步骤摘要】
一种信息处理方法、装置、电子设备、计算机可读介质


[0001]本公开涉及数据处理
,尤其涉及一种信息处理方法、装置、电子设备、计算机可读介质。

技术介绍

[0002]随着计算机技术的普及,电子文档的应用领域越来越多。例如,电子文档可以用于智能招聘等应用领域。
[0003]实际上,智能招聘这一应用领域中常见的电子文档包括简历。其中,简历用于介绍某个人的相关内容。
[0004]然而,如何从简历中解析出简历投递者的姓名是一项亟待解决的技术问题。

技术实现思路

[0005]为了解决上述技术问题,本公开提供了一种信息处理方法、装置、电子设备、计算机可读介质。
[0006]为了实现上述目的,本公开提供的技术方案如下:
[0007]本公开提供一种信息处理方法,所述方法包括:
[0008]在获取到待处理文档之后,从所述待处理文档中提取至少一个候选姓名;
[0009]根据各所述候选姓名的至少一个参考信息,确定各所述候选姓名的重要程度表征数据;所述至少一个参考信息包括展示状态描述信息和/或文档关联内容描述信息;
[0010]依据各所述候选姓名的重要程度表征数据,从所述至少一个候选姓名中选择目标姓名;所述目标姓名的重要程度表征数据满足预设选择条件。
[0011]在一种可能的实施方式下,所述展示状态描述信息包括字符尺寸描述信息、字符样式描述信息、文档位置描述信息、以及字符突显状态描述信息中的至少一个;所述字符尺寸描述信息用于描述所述候选姓名在所述待处理文档中所呈现的尺寸;所述字符样式描述信息用于描述所述候选姓名在所述待处理文档中所呈现的字体样式;所述文档位置描述信息用于描述所述候选姓名在所述待处理文档中所处位置;所述字符突显状态描述信息用于描述所述候选姓名在所述待处理文档中是否按照预设突显状态进行展示。
[0012]在一种可能的实施方式下,所述文档关联内容描述信息包括第一关联内容、文档出现次数、第二关联内容、第三关联内容、以及第四关联内容中的至少一个;所述第一关联内容在所述待处理文档中对应的行位置与所述候选姓名在所述待处理文档中对应的行位置相同;所述文档出现次数用于描述所述候选姓名在所述待处理文档中出现的次数;所述第二关联内容属于第一信息类型,而且所述第二关联内容在所述待处理文档中对应的行位置与所述候选姓名在所述待处理文档中对应的行位置相同;所述第三关联内容属于第二信息类型,而且所述第三关联内容在所述待处理文档中对应的行位置与所述候选姓名在所述待处理文档中对应的行位置之间满足第一位置条件;所述第四关联内容在所述待处理文档中对应的行位置与所述候选姓名在所述待处理文档中对应的行位置之间满足第二位置条
件,而且所述第四关联内容命中所述第二位置条件对应的至少一个第一候选字符串中的第一目标字符串。
[0013]在一种可能的实施方式下,所述候选姓名的个数为N;
[0014]第n个候选姓名的重要程度表征数据的确定过程,包括:
[0015]初始化所述第n个候选姓名的重要程度表征数据;所述n为正整数,n≤N,N为正整数;
[0016]依据所述第n个候选姓名的至少一个参考信息,更新所述第n个候选姓名的重要程度表征数据。
[0017]在一种可能的实施方式下,所述至少一个参考信息包括所述展示状态描述信息;
[0018]所述依据所述第n个候选姓名的至少一个参考信息,更新所述第n个候选姓名的重要程度表征数据,包括以下步骤中的至少一个:
[0019]利用所述第n个候选姓名的展示状态描述信息中字符尺寸描述信息对应的第一更新操作,更新所述第n个候选姓名的重要程度表征数据;
[0020]利用所述第n个候选姓名的展示状态描述信息中字符样式描述信息的文档使用频率对应的第二更新操作,更新所述第n个候选姓名的重要程度表征数据;所述文档使用频率用于描述所述字符样式描述信息在所述待处理文档中所呈现的字符使用状态;
[0021]利用所述第n个候选姓名的展示状态描述信息中文档位置描述信息对应的第三更新操作,更新所述第n个候选姓名的重要程度表征数据;
[0022]若所述第n个候选姓名的展示状态描述信息中字符突显状态描述信息满足预设突显条件,则利用所述预设突显条件对应的第四更新操作,更新所述第n个候选姓名的重要程度表征数据。
[0023]在一种可能的实施方式下,所述至少一个参考信息包括所述文档关联内容描述信息;
[0024]所述依据所述第n个候选姓名的至少一个参考信息,更新所述第n个候选姓名的重要程度表征数据,包括以下步骤中的至少一个:
[0025]若所述第n个候选姓名的文档关联内容描述信息中第一关联内容的字符个数高于预设字符个数阈值,则利用所述预设字符个数阈值对应的第五更新操作,更新所述第n个候选姓名的重要程度表征数据;
[0026]利用所述第n个候选姓名的文档关联内容描述信息中文档出现次数对应的第六更新操作,更新所述第n个候选姓名的重要程度表征数据;
[0027]若所述第n个候选姓名的文档关联内容描述信息中存在第二关联内容,则利用所述第二关联内容的个数对应的第七更新操作,更新所述第n个候选姓名的重要程度表征数据;
[0028]若所述第n个候选姓名的文档关联内容描述信息中存在第三关联内容,则利用所述第三关联内容与所述第n个候选姓名之间的相对位置关系对应的第八更新操作,更新所述第n个候选姓名的重要程度表征数据;
[0029]若所述第n个候选姓名的文档关联内容描述信息中存在第四关联内容,则根据所述第四关联内容、以及所述第四关联内容与所述第n个候选姓名之间的相对位置关系,确定第九更新操作,并利用所述第九更新操作更新所述第n个候选姓名的重要程度表征数据。
[0030]在一种可能的实施方式下,所述从所述待处理文档中提取至少一个候选姓名,包括:
[0031]对所述待处理文档进行命名实体识别处理,得到至少一个待处理姓名;
[0032]若所述待处理文档中存在待使用字符串,则根据所述至少一个待处理姓名以及所述待使用字符串,确定所述至少一个候选姓名;所述待使用字符串的字符尺寸描述信息满足预设尺寸条件,而且所述待使用字符串在所述待处理文档中所处位置满足预设位置条件。
[0033]在一种可能的实施方式下,所述根据各所述候选姓名的至少一个参考信息,确定各所述候选姓名的重要程度表征数据之前,所述方法还包括以下步骤中的至少一个:
[0034]若所述至少一个候选姓名中存在待删除姓名,则从所述至少一个候选姓名中删除所述待删除姓名;所述待删除姓名的第五关联内容命中预先设定的至少一个第二候选字符串中的第二目标字符串,或者所述待删除姓名的第六关联内容属于第三信息类型,或者所述待删除姓名的第七关联内容达到预设长度阈值;所述第五关联内容在所述待处理文档中对应的行位置与所述待删除姓名在所述待处理文档中对应的行位置相同;所述第六关联内容包括所述待删除姓名;所述第七关联内容包括所述待删除姓名,而且所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息处理方法,其特征在于,所述方法包括:在获取到待处理文档之后,从所述待处理文档中提取至少一个候选姓名;根据各所述候选姓名的至少一个参考信息,确定各所述候选姓名的重要程度表征数据;所述至少一个参考信息包括展示状态描述信息和/或文档关联内容描述信息;依据各所述候选姓名的重要程度表征数据,从所述至少一个候选姓名中选择目标姓名;所述目标姓名的重要程度表征数据满足预设选择条件。2.根据权利要求1所述的方法,其特征在于,所述展示状态描述信息包括字符尺寸描述信息、字符样式描述信息、文档位置描述信息、以及字符突显状态描述信息中的至少一个;所述字符尺寸描述信息用于描述所述候选姓名在所述待处理文档中所呈现的尺寸;所述字符样式描述信息用于描述所述候选姓名在所述待处理文档中所呈现的字体样式;所述文档位置描述信息用于描述所述候选姓名在所述待处理文档中所处位置;所述字符突显状态描述信息用于描述所述候选姓名在所述待处理文档中是否按照预设突显状态进行展示。3.根据权利要求1所述的方法,其特征在于,所述文档关联内容描述信息包括第一关联内容、文档出现次数、第二关联内容、第三关联内容、以及第四关联内容中的至少一个;所述第一关联内容在所述待处理文档中对应的行位置与所述候选姓名在所述待处理文档中对应的行位置相同;所述文档出现次数用于描述所述候选姓名在所述待处理文档中出现的次数;所述第二关联内容属于第一信息类型,而且所述第二关联内容在所述待处理文档中对应的行位置与所述候选姓名在所述待处理文档中对应的行位置相同;所述第三关联内容属于第二信息类型,而且所述第三关联内容在所述待处理文档中对应的行位置与所述候选姓名在所述待处理文档中对应的行位置之间满足第一位置条件;所述第四关联内容在所述待处理文档中对应的行位置与所述候选姓名在所述待处理文档中对应的行位置之间满足第二位置条件,而且所述第四关联内容命中所述第二位置条件对应的至少一个第一候选字符串中的第一目标字符串。4.根据权利要求1所述的方法,其特征在于,所述候选姓名的个数为N;第n个候选姓名的重要程度表征数据的确定过程,包括:初始化所述第n个候选姓名的重要程度表征数据;所述n为正整数,n≤N,N为正整数;依据所述第n个候选姓名的至少一个参考信息,更新所述第n个候选姓名的重要程度表征数据。5.根据权利要求4所述的方法,其特征在于,所述至少一个参考信息包括所述展示状态描述信息;所述依据所述第n个候选姓名的至少一个参考信息,更新所述第n个候选姓名的重要程度表征数据,包括以下步骤中的至少一个:利用所述第n个候选姓名的展示状态描述信息中字符尺寸描述信息对应的第一更新操作,更新所述第n个候选姓名的重要程度表征数据;利用所述第n个候选姓名的展示状态描述信息中字符样式描述信息的文档使用频率对应的第二更新操作,更新所述第n个候选姓名的重要程度表征数据;所述文档使用频率用于描述所述字符样式描述信息在所述待处理文档中所呈现的字符使用状态;利用所述第n个候选姓名的展示状态描述信息中文档位置描述信息对应的第三更新操作,更新所述第n个候选姓名的重要程度表征数据;
若所述第n个候选姓名的展示状态描述信息中字符突显状态描述信息满足预设突显条件,则利用所述预设突显条件对应的第四更新操作,更新所述第n个候选姓名的重要程度表征数据。6.根据权利要求4所述的方法,其特征在于,所述至少一个参考信息包括所述文档关联内容描述信息;所述依据所述第n个候选姓名的至少一个参考信息,更新所述第n个候选姓名的重要程度表征数据,包括以下步骤中的至少一个:若所述第n个候选姓名的文档关联内容描述信息中第一关联内容的字符个数高于预设字符个数阈值,则利用所述预设字符个数阈值对应的第五...

【专利技术属性】
技术研发人员:张开伟
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1