The invention provides a method and a device for polymerizing cartoon information information in a search result page. The method includes: collecting network for a plurality of user generated content of the animation class UGC website, from the plurality of UGC website crawl animation class information; mapping the animation class information and animation class keyword crawl; when received from the user associated with the animation class target search word when will the target search keywords animation class relation between words and the mapping of the match, the corresponding animation class keyword matching target animation class information; the target animation class information aggregation to the target search word corresponding to the search results page, presented to the user. The embodiment of the invention can provide more information of the animation class in the search result page, provide more help for users, and extend the reading performance.
【技术实现步骤摘要】
本专利技术涉及互联网应用
,特别是一种在搜索结果页中聚合动漫类资讯信息的方法及装置。
技术介绍
现代网络有大量的UGC(UserGerneratedContent,用户生成内容),其也被称为UCC(UserCreatedContent,用户创建内容),如论坛帖、微信公众号、头条号、兴趣部落帖子等,其中可以包括用户录制的视频、音频,用户拍摄的图片以及用户创作的文字内容等,这些内容里不乏优质资讯,但在各家搜索引擎产品中没有被充分挖掘出来,并添加到相关结果中。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的在搜索结果页中聚合动漫类资讯信息的方法及相应的装置。依据本专利技术的一方面,提供了一种在搜索结果页中聚合动漫类资讯信息的方法,包括:收集网络中针对动漫类的多个用户生成内容UGC网站,从所述多个UGC网站中抓取动漫类资讯信息;建立抓取的所述动漫类资讯信息与动漫类关键词的映射关系;当接收到来自用户的与动漫类相关的目标搜索词时,将所述目标搜索词与所述映射关系中的动漫类关键词进行匹配,得到匹配的动漫类关键词对应的目标动漫类资讯信息;将所述目标动漫类资讯信息聚合到所述目标搜索词对应的搜索结果页中,呈现给所述用户。可选地,从所述多个UGC网站中抓取动漫类资讯信息,包括:抓取指定网站中推荐的针对动漫类的热门词汇,生成包含所述热门词汇的词表;基于生成的所述词表从所述多个UGC网站中抓取动漫类资讯信息。可选地,建立抓取的所述动漫类资讯信息与动漫类关键词的映射关系,包括:在基于生成的所述词表从所述多个UGC网站中抓取动漫类资讯 ...
【技术保护点】
一种在搜索结果页中聚合动漫类资讯信息的方法,包括:收集网络中针对动漫类的多个用户生成内容UGC网站,从所述多个UGC网站中抓取动漫类资讯信息;建立抓取的所述动漫类资讯信息与动漫类关键词的映射关系;当接收到来自用户的与动漫类相关的目标搜索词时,将所述目标搜索词与所述映射关系中的动漫类关键词进行匹配,得到匹配的动漫类关键词对应的目标动漫类资讯信息;将所述目标动漫类资讯信息聚合到所述目标搜索词对应的搜索结果页中,呈现给所述用户。
【技术特征摘要】
1.一种在搜索结果页中聚合动漫类资讯信息的方法,包括:收集网络中针对动漫类的多个用户生成内容UGC网站,从所述多个UGC网站中抓取动漫类资讯信息;建立抓取的所述动漫类资讯信息与动漫类关键词的映射关系;当接收到来自用户的与动漫类相关的目标搜索词时,将所述目标搜索词与所述映射关系中的动漫类关键词进行匹配,得到匹配的动漫类关键词对应的目标动漫类资讯信息;将所述目标动漫类资讯信息聚合到所述目标搜索词对应的搜索结果页中,呈现给所述用户。2.根据权利要求1所述的方法,其中,从所述多个UGC网站中抓取动漫类资讯信息,包括:抓取指定网站中推荐的针对动漫类的热门词汇,生成包含所述热门词汇的词表;基于生成的所述词表从所述多个UGC网站中抓取动漫类资讯信息。3.根据权利要求1或2所述的方法,其中,建立抓取的所述动漫类资讯信息与动漫类关键词的映射关系,包括:在基于生成的所述词表从所述多个UGC网站中抓取动漫类资讯信息后,建立抓取的动漫类资讯信息与相应的热门词汇的映射关系。4.根据权利要求1-3中任一项所述的方法,其中,所述映射关系中各个动漫类关键词对应的动漫类资讯信息包括多条资讯,在建立抓取的所述动漫类资讯信息与动漫类关键词的映射关系之后,所述方法还包括:获取所述映射关系中各个动漫类关键词对应的动漫类资讯信息的属性数据;根据所述属性数据对各个动漫类关键词对应的动漫类资讯信息中多条资讯进行排序,得到排序后的动漫类资讯信息。5.根据权利要求1-4中任一项所述的方法,其中,所述属性数据包括下列至少之一:发布时间、用户阅读数、用户评论数、用户转载数、有无视频、有无图片。6.根据权利要求1-5中任一项所述的方法,其中,将所述目标动漫类资讯信息聚合到所述目标搜...
【专利技术属性】
技术研发人员:王艳丽,陈营营,马华蓉,佟思颖,高苏丹,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。