获取热点内容的方法和装置制造方法及图纸

技术编号:10243583 阅读:106 留言:0更新日期:2014-07-23 17:13
本发明专利技术公开了一种获取热点内容的方法和装置,属于通信技术领域。所述方法包括:获取N个搜索请求信息,以及与所述N个搜索请求信息对应的N个搜索应答信息;对所述N个搜索请求信息和所述N个搜索应答信息进行解析,得到N个初始热点内容数据;计算并根据每个初始热点内容数据的权值,从所述N个初始热点内容数据中选取出M个中间热点内容数据;其中,M为自然数,M小于等于N;对所述M个中间热点内容数据进行排重;从排重后的M个中间热点内容数据中,选取出热点内容。所述装置包括:获取模块、解析模块、选取模块、排重模块和处理模块。本发明专利技术可以全自动地获取热点内容,不需要额外的编辑整理,可以提高获取热点内容的效率,节约人力成本。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种获取热点内容的方法和装置,属于通信
。所述方法包括:获取N个搜索请求信息,以及与所述N个搜索请求信息对应的N个搜索应答信息;对所述N个搜索请求信息和所述N个搜索应答信息进行解析,得到N个初始热点内容数据;计算并根据每个初始热点内容数据的权值,从所述N个初始热点内容数据中选取出M个中间热点内容数据;其中,M为自然数,M小于等于N;对所述M个中间热点内容数据进行排重;从排重后的M个中间热点内容数据中,选取出热点内容。所述装置包括:获取模块、解析模块、选取模块、排重模块和处理模块。本专利技术可以全自动地获取热点内容,不需要额外的编辑整理,可以提高获取热点内容的效率,节约人力成本。【专利说明】获取热点内容的方法和装置
本专利技术涉及通信
,特别涉及一种获取热点内容的方法和装置。
技术介绍
随着通信技术的发展,网络也逐渐成为获取各种信息的平台,可以通过网络查询信息、浏览新闻、聊天等。目前,与各种热词、热门事件等相关的热点内容已经成为用户比较感兴趣的内容。因此,如何获取热点内容,供用户查阅已经成为研究的重点。现有获取热点内容的方法如下:获取用户在社交网络中发表的文档数据;采用空间向量模型、热词聚类等方法对用户在社交网络中发表的文档数据进行挖掘,得到一些单独的词;人工将这些词编辑整理成相关的热点内容。然而,在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:现有获取热点内容的方法,需要人工进行编辑整理,获取热点内容的效率低,浪费人力。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种获取热点内容的方法和装置。所述技术方案如下:一方面,提供了一种获取热点内容的方法,所述方法包括:获取N个搜索请求信息,以及与所述N个搜索请求信息对应的N个搜索应答信息;其中,N为自然数;对所述N个搜索请求信息和所述N个搜索应答信息中的每个搜索请求信息和与每个搜索请求信息对应的每个搜索应答信息进行解析,得到N个初始热点内容数据;其中,所述初始热点内容数据中包含检索词、热门广播信息和/或数据趋势信息;计算并根据每个初始热点内容数据的权值,从所述N个初始热点内容数据中选取出M个中间热点内容数据;其中,M为自然数,M小于等于N;对所述M个中间热点内容数据进行排重;从排重后的M个中间热点内容数据中,选取出热点内容。另一方面,提供了一种获取热点内容的装置,所述装置包括:获取模块,用于获取N个搜索请求信息,以及与所述N个搜索请求信息对应的N个搜索应答信息;其中,N为自然数;解析模块,用于对所述N个搜索请求信息和所述N个搜索应答信息中的每个搜索请求信息和与每个搜索请求信息对应的每个搜索应答信息进行解析,得到N个初始热点内容数据;其中,所述初始热点内容数据中包含检索词、热门广播信息和/或数据趋势信息;选取模块,用于计算并根据每个初始热点内容数据的权值,从所述N个初始热点内容数据中选取出M个中间热点内容数据;其中,M为自然数,M小于等于N ;排重模块,用于对所述M个中间热点内容数据进行排重;处理模块,用于从排重后的M个中间热点内容数据中,选取出热点内容。本专利技术实施例提供的技术方案带来的有益效果是:通过将获取的N个搜索请求信息,以及与N个搜索请求信息对应的N个搜索应答信息作为获取热点内容的数据源,并通过对数据源进行解析、计算权值、排重等得到热点内容,可以全自动地获取热点内容,不需要额外的编辑整理,可以提高获取热点内容的效率,节约人力成本。【专利附图】【附图说明】为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例一提供的获取热点内容的方法流程图;图2是本专利技术实施例二提供的获取热点内容的方法流程图;图3是本专利技术实施例三提供的获取热点内容的第一装置结构示意图;图4是本专利技术实施例三提供的获取热点内容的第二装置结构示意图;图5是本专利技术实施例三提供的获取热点内容的第三装置结构示意图。【具体实施方式】为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。实施例一本专利技术实施例提供了一种获取热点内容的方法,参见图1,该方法包括:101:获取N个搜索请求信息,以及与N个搜索请求信息对应的N个搜索应答信息;其中,N为自然数。 102:对N个搜索请求信息和N个搜索应答信息中的每个搜索请求信息和与每个搜索请求信息对应的每个搜索应答信息进行解析,得到N个初始热点内容数据;其中,初始热点内容数据中包含检索词、热门广播信息和/或数据趋势信息。103:计算并根据每个初始热点内容数据的权值,从N个初始热点内容数据中选取出M个中间热点内容数据;其中,M为自然数,M小于等于N;104:对M个中间热点内容数据进行排重;105:从排重后的M个中间热点内容数据中,选取出热点内容。优选地,得到N个初始热点内容数据之后,该方法还包括:对N个初始热点内容数据进行噪音过滤,得到N个过滤噪音后的初始热点内容数据;相应地,计算并根据每个初始热点内容数据的权值,从N个初始热点内容数据中选取出M个中间热点内容数据,包括:计算并根据过滤噪音后的每个初始热点内容数据的权值,从N个过滤噪音后的初始热点内容数据中选取出M个中间热点内容数据。优选地,得到N个过滤噪音后的初始热点内容数据之后,还包括:根据每个初始热点内容数据中包含的热门广播信息,对N个过滤噪音后的初始热点内容数据进行聚类,得到K个聚类后的初始热点内容数据;其中,K为自然数,K小于等于N、大于等于M ;相应地,计算并根据每个初始热点内容数据的权值,从N个初始热点内容数据中选取出M个中间热点内容数据,包括:计算并根据每个聚类后的初始热点内容数据的权值,从K个聚类后的初始热点内容数据中选取出M个中间热点内容数据。优选地,计算并根据每个聚类后的初始热点内容数据的权值,从K个聚类后的初始热点内容数据中选取出M个中间热点内容数据,包括:计算K个聚类后的初始热点内容数据中每个聚类后的初始热点内容数据的权值;按照权值从大到小的顺序,从K个聚类后的初始热点内容数据中提取出M个聚类后的初始热点内容数据;将提取出的M个聚类后的初始热点内容数据,作为M个中间热点内容数据。优选地,对M个中间热点内容数据进行排重,包括:采用相似率排重方法和相似指纹排重方法,对M个中间热点内容数据中包含的检索词进行排重;采用相似率排重方法,对M个中间热点内容数据中包含的热门广播信息进行排重;采用相似率排重方法,对M个中间热点内容数据中包含的检索词和热门广播信息进行排重。本专利技术实施例所述的获取热点内容的方法,通过将获取的N个搜索请求信息,以及与N个搜索请求信息对应的N个搜索应答信息作为获取热点内容的数据源,并通过对数据源进行解析、计算权值、排重等得到热点内容,可以全自动地获取热点内容,不需要额外的编辑整理,可以提高获取热点内容的效率,节约人力成本。通过噪音过滤处理,可以去除劣质词语,提高获取的热点内容的质量。通过聚类,便于对具有相同特征的词语进行处理,提闻获取热点内容的效率和质量。实施例二本专利技术本文档来自技高网...

【技术保护点】
一种获取热点内容的方法,其特征在于,所述方法包括:获取N个搜索请求信息,以及与所述N个搜索请求信息对应的N个搜索应答信息;其中,N为自然数;对所述N个搜索请求信息和所述N个搜索应答信息中的每个搜索请求信息和与每个搜索请求信息对应的每个搜索应答信息进行解析,得到N个初始热点内容数据;其中,所述初始热点内容数据中包含检索词、热门广播信息和/或数据趋势信息;计算并根据每个初始热点内容数据的权值,从所述N个初始热点内容数据中选取出M个中间热点内容数据;其中,M为自然数,M小于等于N;对所述M个中间热点内容数据进行排重;从排重后的M个中间热点内容数据中,选取出热点内容。

【技术特征摘要】

【专利技术属性】
技术研发人员:王佳强
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1