基于实体热度的处理方法、装置、终端及存储介质制造方法及图纸

技术编号:37505975 阅读:20 留言:0更新日期:2023-05-07 09:42
本公开实施例公开了一种基于实体热度的处理方法、处理、终端及存储介质;所述基于实体热度的处理方法,包括:获取实体指称项链接的候选实体集,其中,所述候选实体集包括:至少一个候选实体;获取所述候选实体的至少两个热度特征的热度分数;基于所述候选实体的至少两个所述热度分数,获取所述候选实体的综合分数;基于所述综合分数,从所述候选实体集中选择满足预定条件的所述候选实体作为所述实体指称项链接的目标实体。项链接的目标实体。项链接的目标实体。

【技术实现步骤摘要】
基于实体热度的处理方法、装置、终端及存储介质


[0001]本公开涉及但不限于人工智能领域或者计算机
,尤其涉及一种基于实体热度的处理方法、装置、终端及存储介质。

技术介绍

[0002]自然语言处理(Natural Language Process,NLP)技术是人工智能技术的一大分支领域;利用自然语言处理技术可以赋予计算机处理和分析人类自然语言的能力,可以高效的识别、整理和/或分析文本信息。例如,利用NLP技术可以对文本信息的信息检索,实体链接,智能问答和/或关系抽取等进行多个维度的分析。
[0003]实体链接任务是与NPL技术相关的典型上游任务,该实体链接任务在很多任务中,如信息检索、内容分析、智能回答或者知识库扩充等任务中都非常重要。该实体链接主要包括:实体识别和实体消岐两个过程。传统的实体链接主要针对长文档,该针对长文档的实体链接拥有充分的上下文信息,能够辅助实体的识别和消岐;而针对短文档的实体链接通常不遵循语法规则且具有上下文有限的特点,使得短文本的实体链接存在很大的挑战。
[0004]实体消岐作为实体链接中一个重本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于实体热度的处理方法,其特征在于,包括:获取实体指称项链接的候选实体集,其中,所述候选实体集包括:至少一个候选实体;获取所述候选实体的至少两个热度特征的热度分数;基于所述候选实体的至少两个所述热度分数,获取所述候选实体的综合分数;基于所述综合分数,从所述候选实体集中选择满足预定条件的所述候选实体作为所述实体指称项链接的目标实体。2.根据权利要求1所述的方法,其特征在于,所述热度特征,包括以下至少之一:被链接次数;至少一个实体属性;动态行为数据,其中,所述动态行为数据包括以下至少之一:收藏次数、分享次数、及点赞次数。3.根据权利要求1或2所述的方法,其特征在于,所述基于所述候选实体的至少两个所述热度分数,获取所述候选实体的综合分数,包括:将所述候选实体的至少两个所述热度分数输入到训练后的多层感知机MLP模型进行融合训练,以获得所述候选实体的所述综合分数。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:对所述候选实体的各所述热度特征的所述热度分数进行归一化处理,以获得各所述热度特征的归一化分数;和/或,对所述候选实体的各所述热度特征的所述热度分数进行概率化处理,以获得各所述热度特征的概率化分数;所述将所述候选实体的至少两个所述热度分数输入到训练后的多层感知机MLP模型进行融合训练,以获得所述候选实体的所述综合分数,包括:将所述候选实体的至少部分所述热度特征的所述归一化分数和/或所述概率化分数输入到训练后的MLP模型进行融合训练,以获得所述候选实体的所述综合分数。5.根据权利要求3所述的方法,其特征在于,所述方法还包括:获取样本指称项的正样本及预定数量的负样本;将所述正样本的所述热度特征的热度分数及所述负样本的所述热度特征的热度分数输入到初始MLP模型,直至设置的损失函数满足收敛条件,获得训练后的所述MLP模型。6.根据权利要求1或2所述的方法,其特征在于,所述方法包括:基于各所述候选实体的实体属性,获取实体属性为高频实体属性的所述候选实体作为备选目标实体;其中,指示所述高频实体属性的属性值大于预定属性值;所述获取所述候选实体的至少两个热度特征的热度分数,包括:获取所述备选目标实体的至少两个所述热度特征的所述热度分数;所述基于所述候选实体的至少两个所述热度分数,获取所述候选实体的综合分数,包括:基于所述备选目标实体的至少两个所述热度分数,获取所述目标候选实体的综合分数;所述基于所述综合分数,从所述候选实体集中选择满足预定条件的所述候选实体作为所述实体指称项链接的目标实体,包括:
基于所述目标候选实体的所述综合分数,选择满足预定条件的所述目标候选实体作为所述实体指称项链接的所述目标实体。7.一种基于实体热度的处理装置,其特征在于,包括:第一获取模块,用于获取实体指称项链接的候选实体集,其中,所述候选实体...

【专利技术属性】
技术研发人员:倪亚楠
申请(专利权)人:北京小米松果电子有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1