This application discloses the method and device for mining the article's concerns. A specific implementation of the method includes: a set of initial candidate concerns for the generation of the article; for each initial candidate concern in the set of the initial candidate attention point set, the upper candidate concerns of the initial candidate concerns are found out from the attention point map of the domain belonging to the article, and the candidate concerns are based on the candidate concerns. Confidence, from the set of candidate concerns of the article, find out a candidate concern as the focus of the article, which includes the set of initial candidate concerns, the upper candidate concerns of each of the initial candidate concerns in the set of initial candidate concerns. To achieve a more comprehensive excavation of the various levels of attention of the article, and then can be based on the various levels of attention to the excavation of the article, to carry out a more accurate article push.
【技术实现步骤摘要】
文章关注点挖掘方法和装置
本申请涉及计算机领域,具体涉及互联网领域,尤其涉及文章关注点挖掘方法和装置。
技术介绍
文章的关注点挖掘是文章推送的基础。文章的内容可归属到的内容类别可以称之为关注点,查找文章的内容可归属到的内容类别的过程可以称之为关注点挖掘。目前,在进行关注点挖掘时,通常是将文章的内容所属的最大类别和文章中的具体对象作为文章的关注点。
技术实现思路
本申请实施例提供了文章关注点挖掘方法和装置。第一方面,本申请实施例提供了文章关注点挖掘方法,该方法包括:生成文章的初始候选关注点集合,其中,文章的关注点为文章的内容的内容类别;对于所述初始候选关注点集合中的每一个初始候选关注点,从所述文章所属的领域的关注点图谱中查找出初始候选关注点的上位候选关注点,其中,位于所述关注点图谱中的相邻层的初始候选关注点的上位候选关注点之间具有从属关系,初始候选关注点的上位候选关注点基于所述文章中的关键词与关注点图谱中的关注点预先绑定的关键词之间的相似度而确定;基于候选关注点的置信度,从所述文章的候选关注点集合中查找出作为所述文章的关注点的候选关注点,所述候选关注点集合包括:所述初始候选关注点集合、所述初始候选关注点集合中的每一个初始候选关注点各自的上位候选关注点。第二方面,本申请实施例提供了文章关注点挖掘装置,该装置包括:生成单元,配置用于生成文章的初始候选关注点集合,其中,文章的关注点为文章的内容的内容类别;候选关注点查找单元,配置用于对于所述初始候选关注点集合中的每一个初始候选关注点,从所述文章所属的领域的关注点图谱中查找出初始候选关注点的上位候选关注点,其中,位于所述 ...
【技术保护点】
1.一种文章关注点挖掘方法,包括:生成文章的初始候选关注点集合,其中,文章的关注点为文章的内容的内容类别,初始候选关注点集合中的每一个初始候选关注点均位于所述文章所属的领域的关注点图谱中的同一层;对于所述初始候选关注点集合中的每一个初始候选关注点,从所述文章所属的领域的关注点图谱中查找出初始候选关注点的上位候选关注点,其中,位于所述关注点图谱中的相邻层的初始候选关注点的上位候选关注点之间具有从属关系,初始候选关注点的上位候选关注点基于所述文章中的关键词与关注点图谱中的关注点预先绑定的关键词之间的相似度而确定;基于候选关注点的置信度,从所述文章的候选关注点集合中查找出作为所述文章的关注点的候选关注点,所述候选关注点集合包括:所述初始候选关注点集合、所述初始候选关注点集合中的每一个初始候选关注点各自的上位候选关注点。
【技术特征摘要】
1.一种文章关注点挖掘方法,包括:生成文章的初始候选关注点集合,其中,文章的关注点为文章的内容的内容类别,初始候选关注点集合中的每一个初始候选关注点均位于所述文章所属的领域的关注点图谱中的同一层;对于所述初始候选关注点集合中的每一个初始候选关注点,从所述文章所属的领域的关注点图谱中查找出初始候选关注点的上位候选关注点,其中,位于所述关注点图谱中的相邻层的初始候选关注点的上位候选关注点之间具有从属关系,初始候选关注点的上位候选关注点基于所述文章中的关键词与关注点图谱中的关注点预先绑定的关键词之间的相似度而确定;基于候选关注点的置信度,从所述文章的候选关注点集合中查找出作为所述文章的关注点的候选关注点,所述候选关注点集合包括:所述初始候选关注点集合、所述初始候选关注点集合中的每一个初始候选关注点各自的上位候选关注点。2.根据权利要求1所述的方法,所述方法还包括:基于初始候选关注点的上位候选关注点的初始置信度和与所述上位候选关注点具有从属关系的位于所述上位候选关注点所在的层之下的层的其他候选关注点的数量,确定所述上位候选关注点的置信度。3.根据权利要求2所述的方法,所述方法还包括:当未被作为文章的关注点的初始候选关注点所在的层之上的一层中与所述未被作为文章的关注点的初始候选关注点具有从属关系的上位候选关注点被作为文章的关注点时,将所述未被作为文章的关注点的初始候选关注点确定为文章的关注点。4.根据权利要求3所述的方法,所述方法还包括:基于查找出的作为文章的关注点的候选关注点的置信度,对查找出的作为文章的关注点的候选关注点进行排序。5.一种文章关注点挖掘装置,其特征在于,包括:生成单元,配置用于生成文章的初始候选关注点集合,其中,文章的关注点为文章的内容的内容类别,初始候选关注点集合中的每一个初始候选关注点均位于所述文章所属的领域的关注点图谱中的同一层;...
【专利技术属性】
技术研发人员:刘呈祥,何伯磊,陈一乐,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。