一种实体画像构建方法、装置、设备及存储介质制造方法及图纸

技术编号:37667386 阅读:10 留言:0更新日期:2023-05-26 04:26
本申请公开了一种实体画像构建方法、装置、设备及存储介质,该方法包括:根据目标实体的文本描述信息,在数据源中确定目标实体对应的关键词;基于对所述关键词组成的初步标签进行筛选,得到建模标签;基于画像构建规则,通过所述建模标签、标签库以及知识库构建与所述目标实体对应的画像。本申请通过对标签进行筛选提取出高度精炼的标签并将其作为建模标签以完成实体画像,提高了构建实体画像的效率。提高了构建实体画像的效率。提高了构建实体画像的效率。

【技术实现步骤摘要】
一种实体画像构建方法、装置、设备及存储介质


[0001]本申请涉及计算机
,特别是涉及一种实体画像构建方法、装置、设备及存储介质。

技术介绍

[0002]随着大数据技术的深入研究与应用,企业/组织的专注点日益聚焦于怎样利用大数据来为精准营销服务,进而深入挖掘潜在的商业价值。于是,“实体”的概念也就应运而生,即根据实体的社会属性、行为、发展趋势等信息抽象出的一个标签化的模型。
[0003]目前,首先根据实体的文本描述信息确定对应的关键词;其次,根据实体的浏览行为信息获得实体的特征向量;基于关键词以及特征向量,得到标签;根据标签构建实体对应的标签画像。现有技术中是基于关键词以及特征向量生成标签,然后再将所有的标签用于实体画像的构建,其中,基于关键词以及特征向量生成标签并非全部有效,若将所有的标签用于构建实体画像对构建实体画像的效率有所影响。

技术实现思路

[0004]基于上述问题,本申请提供了一种实体画像构建方法、装置、设备及存储介质,提高构建实体画像的效率。
[0005]本申请实施例公开了如下技术方案:
[0006]第一方面,本申请提供一种实体画像构建方法,该方法包括:
[0007]根据目标实体的文本描述信息,在数据源中确定目标实体对应的关键词;
[0008]基于对所述关键词所进行的分析,得到建模标签;
[0009]基于画像构建规则,通过所述建模标签、标签库以及知识库构建与所述目标实体对应的标签画像。
[0010]可选地,所述基于对所述关键词组成的初步标签进行筛选,得到建模标签,包括:
[0011]对所述关键词进行聚类,得到以三元组形式表示的初步标签;
[0012]基于TF

IDF技术对所述以三元组形式表示的初步标签进行评分,得到各所述初步标签的TD

IDF评分;
[0013]若所述TF

IDF得分大于预设阈值的所述初步标签作为建模标签。
[0014]可选地,所述根据目标实体的文本描述信息,在数据源中确定目标实体对应的关键词之后,所述方法还包括:
[0015]对所述关键词进行标准化处理,得到标准表示的关键词。
[0016]可选地,所述关键词关于人口属性信息或目标实体行为信息,所述基于对所述关键词所进行的分析,得到建模标签之后,所述方法还包括:
[0017]基于所述人口属性信息或目标实体行为信息对所述建模标签进行分类,分别得到关于所述目标实体的基础信息标签或行为推测标签。
[0018]可选地,所述方法还包括:
[0019]对置信度因子进行修改获得新的知识,以便扩充所述知识库。
[0020]第二方面,本申请提供一种实体画像构建装置,所述装置包括:确定模块、获得模块以及建模模块;
[0021]所述确定模块,根据目标实体的文本描述信息,在数据源中确定目标实体对应的关键词;
[0022]所述获取模块,基于对所述关键词所进行的分析,得到建模标签;
[0023]所述建模模块,基于画像构建规则,通过所述建模标签、标签库以及知识库构建与所述目标实体对应的标签画像。
[0024]可选地,所述获得模块,具体用于:
[0025]对所述关键词进行聚类,得到以三元组形式表示的初步标签;
[0026]基于TF

IDF技术对所述以三元组形式表示的初步标签进行评分,得到各所述初步标签的TD

IDF评分;
[0027]若所述TF

IDF得分大于预设阈值的所述初步标签作为建模标签。
[0028]可选地,所述关键词关于人口属性信息或目标实体行为信息,所述装置还包括:分类模块;
[0029]所述分类模块,基于所述人口属性信息或目标实体行为信息对所述建模标签进行分类,分别得到关于所述目标实体的基础信息标签或行为推测标签。
[0030]可选地,所述装置还包括:标准化模块;
[0031]所述标准化模块,用于对所述关键词进行标准化处理,得到标准表示的关键词。
[0032]可选地,所述装置还包括:修改模块;
[0033]所述修改模块,用于对置信度因子进行修改获得新的知识,以便扩充所述知识库。
[0034]第三方面,本申请提供一种计算机设备,该设备包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如第一方面任一项所述的实体画像构建方法。
[0035]第四方面,本申请提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行如第一方面任一项所述的实体画像构建方法。
[0036]本申请提供一种实体画像构建方法,首先,根据目标实体的文本描述信息,在数据源中确定目标实体对应的关键词;然后,基于对所述关键词组成的初步标签进行筛选,得到建模标签;最后,基于画像构建规则,通过建模标签、标签库以及知识库构建与目标实体对应的标签画像。本申请通过对生成的初步标签进行筛选,提取出高度精炼的标签并将其作为建模标签以完成实体画像,提高了构建实体画像的效率。
附图说明
[0037]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0038]图1为本申请实施例提供的一种实体画像构建方法的流程图;
[0039]图2为本申请实施例提供的另一种实体画像构建方法的流程图;
[0040]图3为本申请实施例提供的一种实体画像构建装置的结构示意图;
[0041]图4为本申请实施例提供的一种计算机设备结构图。
具体实施方式
[0042]正如前文描述,目前的方法如下:首先,根据实体的文本描述信息确定对应的关键词;其次,根据实体的浏览行为信息获得实体的特征向量;基于关键词以及特征向量,得到标签;根据标签构建实体对应的标签画像。现有技术中是基于关键词以及特征向量生成标签,然后再将所有的标签用于实体画像的构建,降低实体画像生成的效率。
[0043]有鉴于此,本申请提供一种实体画像构建方法,首先,根据目标实体的文本描述信息,在数据源中确定目标实体对应的关键词;然后,基于对关键词组成的初步标签进行筛选,得到建模标签;最后,基于画像构建规则,通过建模标签、标签库以及知识库构建与目标实体对应的标签画像。本申请通过对生成的初步标签进行筛选,提取出高度精炼的标签并将其作为建模标签以完成实体画像,提高了构建实体画像的效率。
[0044]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种实体画像构建方法,其特征在于,所述方法包括:根据目标实体的文本描述信息,在数据源中确定目标实体对应的关键词;基于对所述关键词组成的初步标签进行筛选,得到建模标签;基于画像构建规则,通过所述建模标签、标签库以及知识库构建与所述目标实体对应的画像。2.如权利要求1所述的方法,其特征在于,所述基于对所述关键词组成的初步标签进行筛选,得到建模标签,包括:对所述关键词进行聚类,得到以三元组形式表示的初步标签;基于TF

IDF技术对所述以三元组形式表示的初步标签进行评分,得到各所述初步标签的TD

IDF评分;若所述TF

IDF得分大于预设阈值的所述初步标签作为建模标签。3.如权利要求1所述的方法,其特征在于,所述根据目标实体的文本描述信息,在数据源中确定目标实体对应的关键词之后,所述方法还包括:对所述关键词进行标准化处理,得到标准表示的关键词。4.如权利要求1所述的方法,其特征在于,所述关键词关于人口属性信息或目标实体行为信息,所述基于对所述关键词组成的初步标签进行筛选,得到建模标签之后,所述方法还包括:基于所述人口属性信息或目标实体行为信息对所述建模标签进行分类,分别得到关于所述目标实体的基础信息标签或行为推测标签。5.如权利要求1所述的方法,其特征在于,所述方法还包括:对置信度因子进行修改获得新的知识,以便扩充所述知识库。6.一种实体画像构建装置,其特征在于,所述装置包括...

【专利技术属性】
技术研发人员:毛航银陈晓刚张帆赖晓翰张烨华江樱张益群曹莹舒鹏李为陈铁义李乃一夏红鑫黄佳斌
申请(专利权)人:国网浙江省电力有限公司信息通信分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1