网页正文中图片的提取方法及装置制造方法及图纸

技术编号:9406231 阅读:141 留言:0更新日期:2013-12-05 06:07
本发明专利技术公开了一种网页正文中图片的提取方法及装置,属于计算机技术领域。所述方法包括:获取网页正文中的图片节点,并获取所述图片节点的文字描述信息;根据所述图片节点的文字描述信息在获取的图片节点中提取与所述网页正文相关程度最大的图片。本发明专利技术还公开了一种网页正文中图片的提取装置,所述装置包括:第一获取模块和第一提取模块。本发明专利技术提高了提取的图片与网页正文的相关度,从而使得所提取的图片所代表的网页信息主题更明确,极大地提升了用户的体验。

【技术实现步骤摘要】

【技术保护点】
一种网页正文中图片的提取方法,其特征在于,所述方法包括:获取网页正文中的图片节点,并获取所述图片节点的文字描述信息;根据所述图片节点的文字描述信息在获取的图片节点中提取与所述网页正文相关程度最大的图片。

【技术特征摘要】

【专利技术属性】
技术研发人员:蔡兵张凯徐羽
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1