【技术实现步骤摘要】
本专利技术涉及互联网搜索
,特别涉及。
技术介绍
随着互联网技术的蓬勃发展,使得信息传播的速度大幅度提高,而各行各业也因此深受互联网的影响,其中以新闻产业的感受最为深刻。热点话题为新闻媒体所关注的热点新闻,通常有一个发生、发展和结束的过程,热点话题一般会被媒体广泛报道,话题存在期间会出现很多描述话题客观事实以及对话题进行评论的新闻。新闻搜索站点满足用户的需求主要有两种:一种是接受检索与指定关键词最相关的新闻,另一种是主动推荐当前最热点的新闻给用户。用户一般情况下会优先想知道一些大型的新闻事件(即热点话题)。如果能自动识别出当前最热点的新闻话题,就可以推荐热点话题相关的新闻给用户,使得推荐的新闻更容易满足用户的需求。但是,热点话题一般都是在不断发展变化中的,如何描述和识别出一个热点话题的变化也是一个非常困难的问题。如果不能识别出热点话题的变化,那么一个连续的话题就会被割裂成多个片段。如果只能将割裂开来的话题展现给用户,会使得用户对话题的了解不够完整,影响用户体验。所以,需要自动发现、追踪和监测新闻热点话题的发展变化。在用户检索指定关键词时,目前的 ...
【技术保护点】
一种热点话题搜索系统,其特征在于,所述热点话题搜索系统包括:新闻热词挖掘模块,用于定期获取新闻网站的热点新闻区域的热门新闻并提取所述热门新闻中的热点词组;新闻搜索下载模块,用于下载所述热门新闻的新闻文档;热点话题产生及匹配模块,用于根据所述热点词组确定与所述热点词组对应的每个热点话题,并根据每个热点话题对应的热点词组从下载的新闻文档中检索出与所述每个热点话题对应的新闻文档。
【技术特征摘要】
1.一种热点话题搜索系统,其特征在于,所述热点话题搜索系统包括: 新闻热词挖掘模块,用于定期获取新闻网站的热点新闻区域的热门新闻并提取所述热门新闻中的热点词组; 新闻搜索下载模块,用于下载所述热门新闻的新闻文档; 热点话题产生及匹配模块,用于根据所述热点词组确定与所述热点词组对应的每个热点话题,并根据每个热点话题对应的热点词组从下载的新闻文档中检索出与所述每个热点话题对应的新闻文档。2.如权利要求1所述的热点话题搜索系统,其特征在于,还包括: 近期新闻文档获取模块,对所述下载的新闻文档建立倒排索引以提供给客户端使用关键词检索所述新闻文档。3.如权利要求1所述的热点话题搜索系统,其特征在于,还包括: 新热点查询词获取模块,用于定期分析新闻搜索的用户日志以获取所述用户日志中出现的高频查询词。4.如权利要求1或3所述的热点话题搜索系统,其特征在于,还包括:热词库,保存所述高频查询词及所述热点词组。5.如权利要求1所述的热点话题搜索系统,其特征在于,所述热点话题产生及匹配模块,还用于采用话题跟踪算法确定与热点词组对应的每个热点话题、判断所有当前热点话题是否有新的热点词组加入及/或判断是否有新的热点话题产生。6.如权利要求1所述的热点话题搜索系统,其特征在于,还包括: 热点话题代表文档选取及热度计算模块,用于根据所述每个热点话题的热点词组,计算所述下载的新闻文档与所述每个热点话题之间的相关程度,并统计出每个热点话题各时段的相关新闻文档及/或每个热点话题各时段相关新闻文档的数量及/或每个热点话题的代表新闻文档及/或所有关联到每个热点话题的新闻文档id及/或关联信息。7.如权利要求6所述的热点话题搜索系统,其特征在于,所述热点话题代表文档选取及热度计算模块,还用于使用热点话题对应的每一个热点词组检索所有下载的新闻文档,得到所述热点话题对应的新闻文档集合,并统计所述新闻文档集合的文档总数得到所述热点话题的总体热度,并统计新闻文档集合中各新闻的发布时间,得到热点话题的总体时新度,综合热点话题的总体热度、总体时新度指标对所有热点话题进行排名,得到需要推荐的若干个热点话题,并按照新闻文档的发表时间将需要推荐的热点话题的新闻文档集合分成几段,每段选出排名最高的一篇新闻文档向用户进行推荐。8.如权利要求7所述的热点话题搜索系统,其特征在于,还包括话题展示数据库以及新闻文档相关话题对应关系数据库,所述话题展示数据库存储所述每个热点话题各时段相关新闻文档及/或每个热点话题各时段相关新闻文档数量及/或每个热点话题的代表新闻文...
【专利技术属性】
技术研发人员:李峰,林子敬,陈锡彬,王炫聪,樊扬,胡熠,熊展志,沈剑平,李翔,黄斌强,
申请(专利权)人:深圳市世纪光速信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。