一种通用的人物画像生成方法与装置制造方法及图纸

技术编号:36753697 阅读:20 留言:0更新日期:2023-03-04 10:42
本申请提出的通用的人物画像生成方法、装置及存储介质中,通过获取要查询的人物信息,人物信息包括人物的名称和机构,基于人物的名称和机构,得到对应的人物相关文档,将人物相关文档输入至目标人物画像模型中,输出包含人物画像的目标序列,基于目标序列生成人物信息对应的目标人物画像。由此可知,本申请仅需获取人物的名称和机构,就可以准确生成对应的目标人物画像,不需要不同的画像标签制定不同的解决方案,从而提高了生成人物画像的效率,也避免了重复计算和资源浪费,适用范围较广。适用范围较广。适用范围较广。

【技术实现步骤摘要】
一种通用的人物画像生成方法与装置


[0001]本申请涉及用户画像生成
,尤其涉及一种通用的人物画像生成方法、装置及存储介质。

技术介绍

[0002]人才是引领发展的重要驱动力,基于需要有效地挖掘人才画像,以构建人才服务体系,从而解决如何培育人才、留住人才的问题,其中,人才画像可以采用自动画像引擎为每位人才抽取或分析最具代表性的标签。
[0003]相关技术中,对于人物画像的挖掘方法主要采用分治法,即根据不同画像标签制定不同的解决方案,但是该方法不是通用的方法,适用范围比较局限。

技术实现思路

[0004]本申请提供一种通用的人物画像生成方法、装置及存储介质,以解决上述相关技术中出现的技术问题。
[0005]本申请第一方面实施例提出一种通用的人物画像生成方法,包括:
[0006]获取要查询的人物信息,所述人物信息包括人物的名称和机构;
[0007]基于所述人物的名称和机构,得到对应的人物相关文档;
[0008]将所述人物相关文档输入至目标人物画像模型中,输出包含人物画像的目标序列;
[0009]基于所述目标序列生成所述人物信息对应的目标人物画像。
[0010]可选的,所述将所述人物相关文档输入至目标人物画像模型中,输出包含人物画像的目标序列之前,还包括:
[0011]构建预设人物画像模型;
[0012]获取训练数据集,所述训练数据集中每个训练数据包括人物相关文档和所述人物相关文档对应人物画像的真实序列;
[0013]利用所述训练数据集对所述预设人物画像模型进行训练,得到目标人物画像模型。
[0014]可选的,所述利用所述训练数据集对所述预设人物画像模型进行训练,得到目标人物画像模型,包括:
[0015]将所述每个训练数据中的人物相关文档输入至所述预设人物画像模型中,输出包含人物画像的预测序列;
[0016]基于所述预测序列与对应的真实序列得到损失函数对应的损失值;
[0017]基于所述损失值调整所述预设人物画像模型直至收敛,得到目标人物画像模型。
[0018]可选的,所述基于所述人物的名称和机构,得到对应的人物相关文档,包括:
[0019]基于所述人物的名称和机构,得到对应的第一候选文档集,所述第一候选文档集中包括多个第一候选文档,每个第一候选文档中包括标题和摘要;
[0020]提取所述每个第一候选文档中的标题和摘要作为对应每个第二候选文档中的内容,并利用多个第二候选文档生成第二候选文档集,以及所述第一文档集和所述第二文档集的索引关系;
[0021]基于所述人物的名称和机构、所述第一候选文档集和所述第二候选文档集,得到对应的人物相关文档。
[0022]可选的,所述基于所述人物的名称和机构、所述第一候选文档集和所述第二候选文档集,得到对应的人物相关文档,包括:
[0023]将所述人物的名称和机构进行词例化,得到第一分词集;
[0024]将所述每个第二候选文档进行词例化,得到所述每个第二候选文档对应的第二分词集;
[0025]计算第一分词集与每个第二分词集相似度得分,并根据所述相似度得分进行排序,获取预设数量个第二候选文档;
[0026]根据所述预设数量个第二候选文档与所述索引关系,得到对应的预设数量个第一候选文档;
[0027]将所述预设数量个第一候选文档的内容进行拼接,得到对应的人物相关文档。
[0028]可选的,所述每个第一候选文档中还包括url地址和正文;所述基于所述人物的名称和机构,得到对应的第一候选文档集,包括:
[0029]获取所述人物的名称和机构对应的搜索引擎页面;
[0030]基于所述人物的名称和机构解析所述搜索引擎记录页面,得到多个搜索引擎记录,并提取每个搜索引擎记录的url地址、标题和摘要;
[0031]访问每个url地址对应的网页,提取所述网页中的内容,作为所述url地址对应的正文;
[0032]基于所述多个搜索引擎记录分别对应的url地址、标题、摘要和正文,得到对应的第一候选文档集,所述每个第一候选文档对应一个搜索引擎记录,所述每个第一候选文档中包括每个搜索引擎记录对应的url地址、标题、摘要和正文。
[0033]本申请第二方面实施例提出一种通用的人物画像生成装置,包括:
[0034]获取模块,用于获取要查询的人物信息,所述人物信息包括人物的名称和机构;
[0035]处理模块,用于基于所述人物的名称和机构,得到对应的人物相关文档;
[0036]输出模块,用于将所述人物相关文档输入至目标人物画像模型中,输出包含人物画像的目标序列;
[0037]生成模块,用于基于所述目标序列生成所述人物信息对应的目标人物画像。
[0038]本申请第三方面实施例提出的计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如上第一方面所述的方法。
[0039]本申请第四方面实施例提出的计算机存储介质,其中,所述计算机存储介质存储有计算机可执行指令;所述计算机可执行指令被处理器执行后,能够实现如上第一方面所述的方法。
[0040]本申请的实施例提供的技术方案至少带来以下有益效果:
[0041]本申请中提供的通用的人物画像生成方法、装置及存储介质中,通过获取要查询
的人物信息,人物信息包括人物的名称和机构,基于人物的名称和机构,得到对应的人物相关文档,将人物相关文档输入至目标人物画像模型中,输出包含人物画像的目标序列,基于目标序列生成人物信息对应的目标人物画像。由此可知,
[0042]本申请仅需获取人物的名称和机构,就可以准确生成对应的目标人物画像,不需要不同的画像标签制定不同的解决方案,从而提高了生成人物画像的效率,也避免了重复计算和资源浪费,适用范围较广。
[0043]本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
[0044]本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0045]图1为根据本申请一个实施例提供的通用的人物画像生成方法的流程示意图;
[0046]图2为根据本申请一个实施例提供的人物画像与人物画像对应的序列的示意图;
[0047]图3为根据本申请一个实施例提供的通用的人物画像生成装置的结构示意图。
具体实施方式
[0048]下面详细描述本申请的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
[0049]下面参考附图描述本申请实施例的通用的人物画像生成方法与装置。
[0050]实施例一
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种通用的人物画像生成方法,其特征在于,所述方法包括:获取要查询的人物信息,所述人物信息包括人物的名称和机构;基于所述人物的名称和机构,得到对应的人物相关文档;将所述人物相关文档输入至目标人物画像模型中,输出包含人物画像的目标序列;基于所述目标序列生成所述人物信息对应的目标人物画像。2.根据权利要求1所述的方法,其特征在于,所述将所述人物相关文档输入至目标人物画像模型中,输出包含人物画像的目标序列之前,还包括:构建预设人物画像模型;获取训练数据集,所述训练数据集中每个训练数据包括人物相关文档和所述人物相关文档对应人物画像的真实序列;利用所述训练数据集对所述预设人物画像模型进行训练,得到目标人物画像模型。3.根据权利要求2所述的方法,其特征在于,所述利用所述训练数据集对所述预设人物画像模型进行训练,得到目标人物画像模型,包括:将所述每个训练数据中的人物相关文档输入至所述预设人物画像模型中,输出包含人物画像的预测序列;基于所述预测序列与对应的真实序列得到损失函数对应的损失值;基于所述损失值调整所述预设人物画像模型直至收敛,得到目标人物画像模型。4.根据权利要求1所述的方法,其特征在于,所述基于所述人物的名称和机构,得到对应的人物相关文档,包括:基于所述人物的名称和机构,得到对应的第一候选文档集,所述第一候选文档集中包括多个第一候选文档,每个第一候选文档中包括标题和摘要;提取所述每个第一候选文档中的标题和摘要作为对应每个第二候选文档中的内容,并利用多个第二候选文档生成第二候选文档集,以及所述第一文档集和所述第二文档集的索引关系;基于所述人物的名称和机构、所述第一候选文档集和所述第二候选文档集,得到对应的人物相关文档。5.根据权利要求4所述的方法,其特征在于,所述基于所述人物的名称和机构、所述第一候选文档集和所述第二候选文档集,得到对应的人物相关文档,包括:将所述人物的名称和机构进行词例化,得到第一分词集;将所述每个第二候选文档进行词例化,得到所述每个第二候选文档对应的第二分词集;计算第一分词集与每个第二分词集相似度得分,并根据所述相似度得分进行排序,获取...

【专利技术属性】
技术研发人员:王路路刘佳
申请(专利权)人:北京智谱华章科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1