Web页面的标签提取方法及装置制造方法及图纸

技术编号:9113432 阅读:121 留言:0更新日期:2013-09-05 02:36
本发明专利技术提供一种Web页面的标签提取方法及装置。本发明专利技术实施例通过根据Web页面,获得所述Web页面的位置信息和/或锚文本,使得能够根据所述Web页面的位置信息和/或锚文本,提取所述Web页面的第一标签,由于根据Web页面的位置信息和/或锚文本,有选择地提取Web页面的标签,能够避免现有技术中由于将从标题和正文中提取的词语,直接作为Web页面的标签而导致的所提取的标签不能准确地描述Web页面的问题,从而提高了标签提取的可靠性。

【技术实现步骤摘要】

【技术保护点】
一种Web页面的标签提取方法,其特征在于,包括:确定待提取的Web页面;根据所述Web页面,获得所述Web页面的位置信息和/或锚文本;根据所述Web页面的位置信息和/或锚文本,提取所述Web页面的第一标签。

【技术特征摘要】

【专利技术属性】
技术研发人员:黄超刘其文
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1