在搜索结果页中聚合动漫类资讯信息的方法及装置制造方法及图纸

技术编号:15248293 阅读:79 留言:0更新日期:2017-05-02 09:02
本发明专利技术提供了一种在搜索结果页中聚合动漫类资讯信息的方法及装置。该方法包括:收集网络中针对动漫类的多个用户生成内容UGC网站,从所述多个UGC网站中抓取动漫类资讯信息;建立抓取的所述动漫类资讯信息与动漫类关键词的映射关系;当接收到来自用户的与动漫类相关的目标搜索词时,将所述目标搜索词与所述映射关系中的动漫类关键词进行匹配,得到匹配的动漫类关键词对应的目标动漫类资讯信息;将所述目标动漫类资讯信息聚合到所述目标搜索词对应的搜索结果页中,呈现给所述用户。本发明专利技术实施例能够在搜索结果页中提供更多动漫类的资讯信息,为用户提供更多的帮助,延展了阅读性。

Method and device for polymerizing cartoon information information in search result page

The invention provides a method and a device for polymerizing cartoon information information in a search result page. The method includes: collecting network for a plurality of user generated content of the animation class UGC website, from the plurality of UGC website crawl animation class information; mapping the animation class information and animation class keyword crawl; when received from the user associated with the animation class target search word when will the target search keywords animation class relation between words and the mapping of the match, the corresponding animation class keyword matching target animation class information; the target animation class information aggregation to the target search word corresponding to the search results page, presented to the user. The embodiment of the invention can provide more information of the animation class in the search result page, provide more help for users, and extend the reading performance.

【技术实现步骤摘要】

本专利技术涉及互联网应用
,特别是一种在搜索结果页中聚合动漫类资讯信息的方法及装置。
技术介绍
现代网络有大量的UGC(UserGerneratedContent,用户生成内容),其也被称为UCC(UserCreatedContent,用户创建内容),如论坛帖、微信公众号、头条号、兴趣部落帖子等,其中可以包括用户录制的视频、音频,用户拍摄的图片以及用户创作的文字内容等,这些内容里不乏优质资讯,但在各家搜索引擎产品中没有被充分挖掘出来,并添加到相关结果中。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的在搜索结果页中聚合动漫类资讯信息的方法及相应的装置。依据本专利技术的一方面,提供了一种在搜索结果页中聚合动漫类资讯信息的方法,包括:收集网络中针对动漫类的多个用户生成内容UGC网站,从所述多个UGC网站中抓取动漫类资讯信息;建立抓取的所述动漫类资讯信息与动漫类关键词的映射关系;当接收到来自用户的与动漫类相关的目标搜索词时,将所述目标搜索词与所述映射关系中的动漫类关键词进行匹配,得到匹配的动漫类关键词对应的目标动漫类资讯信息;将所述目标动漫类资讯信息聚合到所述目标搜索词对应的搜索结果页中,呈现给所述用户。可选地,从所述多个UGC网站中抓取动漫类资讯信息,包括:抓取指定网站中推荐的针对动漫类的热门词汇,生成包含所述热门词汇的词表;基于生成的所述词表从所述多个UGC网站中抓取动漫类资讯信息。可选地,建立抓取的所述动漫类资讯信息与动漫类关键词的映射关系,包括:在基于生成的所述词表从所述多个UGC网站中抓取动漫类资讯信息后,建立抓取的动漫类资讯信息与相应的热门词汇的映射关系。可选地,所述映射关系中各个动漫类关键词对应的动漫类资讯信息包括多条资讯,在建立抓取的所述动漫类资讯信息与动漫类关键词的映射关系之后,所述方法还包括:获取所述映射关系中各个动漫类关键词对应的动漫类资讯信息的属性数据;根据所述属性数据对各个动漫类关键词对应的动漫类资讯信息中多条资讯进行排序,得到排序后的动漫类资讯信息。可选地,所述属性数据包括下列至少之一:发布时间、用户阅读数、用户评论数、用户转载数、有无视频、有无图片。可选地,将所述目标动漫类资讯信息聚合到所述目标搜索词对应的搜索结果页中,包括:将所述目标动漫类资讯信息聚合到所述目标搜索词对应的搜索结果页的右侧区域。可选地,若所述目标搜索词对应的搜索结果页的右侧区域包含其他推荐数据,将所述目标动漫类资讯信息聚合到所述目标搜索词对应的搜索结果页的右侧区域,包括:根据所述其他推荐数据对所述目标动漫类资讯信息进行去重处理,将去重处理后的动漫类资讯信息聚合至所述目标搜索词对应的搜索结果页的右侧区域。可选地,将所述目标动漫类资讯信息聚合到所述目标搜索词对应的搜索结果页中,包括:从所述目标动漫类资讯信息中提取创建该目标动漫类资讯信息的用户身份信息;将所述目标动漫类资讯信息及其用户身份信息聚合到所述目标搜索词对应的搜索结果页中。可选地,所述目标动漫类资讯信息中包括视频数据,将所述目标动漫类资讯信息聚合到所述目标搜索词对应的搜索结果页中,包括:将所述目标动漫类资讯信息中的视频数据聚合到所述目标搜索词对应的搜索结果页中,以在搜索结果页中触发后播放所述视频数据。可选地,所述目标动漫类资讯信息中包括文本数据,将所述目标动漫类资讯信息聚合到所述目标搜索词对应的搜索结果页中,包括:将所述目标动漫类资讯信息中的文本数据以文字链的形式聚合到所述目标搜索词对应的搜索结果页中。可选地,在将所述目标动漫类资讯信息聚合到所述目标搜索词对应的搜索结果页中,呈现给所述用户之后,所述方法还包括:统计用户针对所述搜索结果页上展现的所述目标动漫类资讯信息的触发操作,得到统计结果;根据所述统计结果确定在后续搜索请求对应的页面中是否展现所述目标动漫类资讯信息。可选地,根据所述统计结果确定在后续搜索请求对应的页面中是否展现所述目标动漫类资讯信息,包括:若所述统计结果为所述触发操作的数量小于指定阈值,则确定在后续搜索请求对应的页面中不再展现所述目标动漫类资讯信息。可选地,从所述多个UGC网站中抓取动漫类资讯信息,包括:从所述多个UGC网站中筛选出至少一个优质UGC网站;从所述至少一个优质UGC网站中抓取动漫类资讯信息。可选地,从所述多个UGC网站中筛选出至少一个优质UGC网站,包括:确定一个或多个衡量因子;根据确定的所述一个或多个衡量因子衡量出所述多个UGC网站的质量情况,并从中筛选出质量满足指定质量条件的至少一个UGC网站作为优质UGC网站。可选地,当衡量因子包括多个时,根据确定的所述多个衡量因子衡量出所述多个UGC网站的质量情况,包括:基于权重策略确定所述多个衡量因子各自的权重;获取所述多个UGC网站的所述多个衡量因子各自的数值;将所述多个UGC网站的所述多个衡量因子各自的数值与权重进行加权求和,得到综合数值;根据所述多个UGC网站各自的综合数值衡量出所述多个UGC网站的质量情况。依据本专利技术的另一方面,还提供了一种在搜索结果页中聚合动漫类资讯信息的装置,包括:抓取模块,适于收集网络中针对动漫类的多个用户生成内容UGC网站,从所述多个UGC网站中抓取动漫类资讯信息;建立模块,适于建立抓取的所述动漫类资讯信息与动漫类关键词的映射关系;匹配模块,适于当接收到来自用户的与动漫类相关的目标搜索词时,将所述目标搜索词与所述映射关系中的动漫类关键词进行匹配,得到匹配的动漫类关键词对应的目标动漫类资讯信息;聚合模块,适于将所述目标动漫类资讯信息聚合到所述目标搜索词对应的搜索结果页中,呈现给所述用户。可选地,所述抓取模块还适于:抓取指定网站中推荐的针对动漫类的热门词汇,生成包含所述热门词汇的词表;基于生成的所述词表从所述多个UGC网站中抓取动漫类资讯信息。可选地,所述建立模块还适于:在基于生成的所述词表从所述多个UGC网站中抓取动漫类资讯信息后,建立抓取的动漫类资讯信息与相应的热门词汇的映射关系。可选地,所述装置还包括:排序模块,适于当所述映射关系中各个动漫类关键词对应的动漫类资讯信息包括多条资讯时,在所述建立模块建立抓取的所述动漫类资讯信息与动漫类关键词的映射关系之后,获取所述映射关系中各个动漫类关键词对应的动漫类资讯信息的属性数据;根据所述属性数据对各个动漫类关键词对应的动漫类资讯信息中多条资讯进行排序,得到排序后的动漫类资讯信息。可选地,所述属性数据包括下列至少之一:发布时间、用户阅读数、用户评论数、用户转载数、有无视频、有无图片。可选地,所述聚合模块还适于:将所述目标动漫类资讯信息聚合到所述目标搜索词对应的搜索结果页的右侧区域。可选地,所述聚合模块还适于:若所述目标搜索词对应的搜索结果页的右侧区域包含其他推荐数据,则根据所述其他推荐数据对所述目标动漫类资讯信息进行去重处理,将去重处理后的动漫类资讯信息聚合至所述目标搜索词对应的搜索结果页的右侧区域。可选地,所述聚合模块还适于:从所述目标动漫类资讯信息中提取创建该目标动漫类资讯信息的用户身份信息;将所述目标动漫类资讯信息及其用户身份信息聚合到所述目标搜索词对应的搜索结果页中。可选地,所述聚合模块还适于:若所述目标动漫类资讯信息中包括视频数据,则将所述目标动本文档来自技高网...

【技术保护点】
一种在搜索结果页中聚合动漫类资讯信息的方法,包括:收集网络中针对动漫类的多个用户生成内容UGC网站,从所述多个UGC网站中抓取动漫类资讯信息;建立抓取的所述动漫类资讯信息与动漫类关键词的映射关系;当接收到来自用户的与动漫类相关的目标搜索词时,将所述目标搜索词与所述映射关系中的动漫类关键词进行匹配,得到匹配的动漫类关键词对应的目标动漫类资讯信息;将所述目标动漫类资讯信息聚合到所述目标搜索词对应的搜索结果页中,呈现给所述用户。

【技术特征摘要】
1.一种在搜索结果页中聚合动漫类资讯信息的方法,包括:收集网络中针对动漫类的多个用户生成内容UGC网站,从所述多个UGC网站中抓取动漫类资讯信息;建立抓取的所述动漫类资讯信息与动漫类关键词的映射关系;当接收到来自用户的与动漫类相关的目标搜索词时,将所述目标搜索词与所述映射关系中的动漫类关键词进行匹配,得到匹配的动漫类关键词对应的目标动漫类资讯信息;将所述目标动漫类资讯信息聚合到所述目标搜索词对应的搜索结果页中,呈现给所述用户。2.根据权利要求1所述的方法,其中,从所述多个UGC网站中抓取动漫类资讯信息,包括:抓取指定网站中推荐的针对动漫类的热门词汇,生成包含所述热门词汇的词表;基于生成的所述词表从所述多个UGC网站中抓取动漫类资讯信息。3.根据权利要求1或2所述的方法,其中,建立抓取的所述动漫类资讯信息与动漫类关键词的映射关系,包括:在基于生成的所述词表从所述多个UGC网站中抓取动漫类资讯信息后,建立抓取的动漫类资讯信息与相应的热门词汇的映射关系。4.根据权利要求1-3中任一项所述的方法,其中,所述映射关系中各个动漫类关键词对应的动漫类资讯信息包括多条资讯,在建立抓取的所述动漫类资讯信息与动漫类关键词的映射关系之后,所述方法还包括:获取所述映射关系中各个动漫类关键词对应的动漫类资讯信息的属性数据;根据所述属性数据对各个动漫类关键词对应的动漫类资讯信息中多条资讯进行排序,得到排序后的动漫类资讯信息。5.根据权利要求1-4中任一项所述的方法,其中,所述属性数据包括下列至少之一:发布时间、用户阅读数、用户评论数、用户转载数、有无视频、有无图片。6.根据权利要求1-5中任一项所述的方法,其中,将所述目标动漫类资讯信息聚合到所述目标搜...

【专利技术属性】
技术研发人员:王艳丽陈营营马华蓉佟思颖高苏丹
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1