【技术实现步骤摘要】
一种获取热点资讯的方法及装置
本专利技术涉及计算机应用
,具体涉及信息处理
,尤其涉及一种获 取热点资讯的方法及装置。
技术介绍
资讯网站的为了方便用户快速的进行最新的信息的浏览,往往都含有大量的最新 热点资讯的内容,例如浏览常见门户网站的主页面时,主页面会含热点导航栏,其包括了诸 如新闻、娱乐、汽车、军事、读书和博客等最新热点资讯的链接,用户可以通过点击感兴趣的 链接跳转到对应的资讯内容页面。随着互联网的蓬勃发展,互联网资讯更新更加频繁,每时 每刻都有热点人物和事件产生,如何在后台的海量资讯集合(如内容池)中,准确且快速地 获取到实时热点的相关资讯(又称热点资讯),并及时展现给用户,变得非常困难。 现有技术主要采用人工配置资讯的方式,对于实时热点关键词,通过大量的人工 手动挑选若干与之相关的资讯,展现给用户。 上述现有技术的方法存在如下问题:首先,由于实时热点更新频繁,所以人工配置 代价比较高;另外,配置过程相对缓慢,达不到及时将内容触达用户的速度性要求。
技术实现思路
有鉴于此,本专利技术实施例提供一种获取热点资讯的方法及装置,其可提高获取热 点资讯的速度。 本专利技术实施例提出了以下技术方案: 第一方面,本专利技术实施提供了一种获取热点资讯的方法,包括: 获取热点关键词集合; 从包含资讯的资讯集合中提取预设时间窗口内的资讯作为候选资讯集合; 分别计算所述热点关键词集合中的热点关键词与所述候选资讯集合中的资讯的 相关度; 根据所述相关度从所述候选资讯集合中筛选满足 ...
【技术保护点】
一种获取热点资讯的方法,其特征在于,包括:获取热点关键词集合;从包含资讯的资讯集合中提取预设时间窗口内的资讯作为候选资讯集合;分别计算所述热点关键词集合中的热点关键词与所述候选资讯集合中的资讯的相关度;根据所述相关度从所述候选资讯集合中筛选满足预设条件的候选资讯,将所筛选到的候选资讯作为热点资讯。
【技术特征摘要】
1. 一种获取热点资讯的方法,其特征在于,包括: 获取热点关键词集合; 从包含资讯的资讯集合中提取预设时间窗口内的资讯作为候选资讯集合; 分别计算所述热点关键词集合中的热点关键词与所述候选资讯集合中的资讯的相关 度; 根据所述相关度从所述候选资讯集合中筛选满足预设条件的候选资讯,将所筛选到的 候选资讯作为热点资讯。2. 如权利要求1所述的获取热点资讯的方法,其特征在于,所述获取热点关键词集合 的步骤包括;从预先指定的网站获取热点关键词集合。3. 如权利要求1所述的获取热点资讯的方法,其特征在于,所述从包含资讯的资讯集 合中提取预设时间窗口内的资讯作为候选资讯集合的步骤之前还包括:对预先指定的资讯 网站的易信息聚合进行抓取并解析,获得资讯,将所获得的资讯保存到资讯集合中。4. 如权利要求3所述的获取热点资讯的方法,其特征在于,所述从预先指定的资讯网 站抓取并解析获得资讯的步骤具体为:对预先指定的资讯网站的易信息聚合周期性地进行 抓取并解析。5. 如权利要求1所述的获取热点资讯的方法,其特征在于,所述预设时间窗口的起始 时间为比当前时间小于预设时长的时间,所述预设时间窗口的终止时间为当前时间。6. 如权利要求1所述的获取热点资讯的方法,其特征在于,所述分别计算所述热点关 键词集合中的热点关键词与所述候选资讯集合中的资讯的相关度的步骤中,计算第i热点 关键词与第j资讯的相关度的方法具体包括: 将第i热点关键词拆分成至少一个热点关键字组合; 按照预设算法分别计算第j资讯与第i热点关键词所拆分的各热点关键字组合的相关 度; 将第j资讯与第i热点关键词所拆分的各热点关键字组合的相关度相加作为第i热点 关键词与第j资讯的相关度; 所述i和j为不小于1的正整数。7. 如权利要求6所述的获取热点资讯的方法,其特征在于,所述将第i热点关键词拆分 成至少一个热点关键字组合的步骤具体包括;将第i热点关键词中每相邻的两个字作为热 点关键字组合。8. 如权利要求6所述的获取热点资讯的方法,其特征在于,所述分别计算所述热点关 键词集合中的热点关键词与所述候选资讯集合中的资讯的相关度的步骤中,计算热点关键 词与资讯的相关度的方法为: 成。巧化=艺:。化77%') * 公(。)/化純,)* 乂4劇)]; 其中,Q为热点关键词; D为资讯; Score怕,D)为热点关键词Q与资讯D的相关度; i为热点关键词中包含的热点关键字组合的序号; n为热点关键词中包含的热点关键字组合的数目; Qi为热点关键词Q的第i个热点关键字组合; TF hi)为热点关键字组合di的资讯D中的频率; H值)为资讯D的热度; DFhi)为热点关键字组合qi的文档频率; L0))为资讯D的内容长度; 入1、入2、入3和入4为预设系数。9. 如权利要求1所述的获取热点资讯的方法,其特征在于,根据所述相关度从所述候 选资讯集合中筛选满足预设条件的候选资讯,将所筛选到的候选资讯作为热点资讯的步骤 具体包括: 从所述候选资讯集合中筛选分别与所获取的各热点关键词的相关度最高的资讯,将所 筛选到的候选资讯作为热点资讯。10. 如权利要求1所述的获取热点资讯的方法,其特征在于,根据所述相关度从所述候 选资讯集合中筛选满足预设条件的候选资讯,将所筛选到的候选资讯作为热点资讯的步骤 具体包括: 从所述候选资讯集合中筛选分别与所获取的各热点关键词的相关度大于预设阔值的 资讯将所筛选到的候选资讯作为热点资讯。11. 如权利要求1所述的获取热点资讯的方法,其特征在于,根据所述相关度从所述候 选资讯集合中筛选满足预设条件的候选资讯,将所筛选到的候选资讯作为热点资讯的步骤 具体包括: 从所述候选资讯集合中提取分别与所获取的各热点关键词的相关度为排名前预设数 目个候选资讯作为热点资讯。12. 如权利要求1所述的获取热点资讯的...
【专利技术属性】
技术研发人员:蔡兵,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。