下载一种网页信息抽取方法及装置的技术资料

文档序号:21833030

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明实施例提供了一种网页信息抽取方法及装置,包括:根据网页的DOM树确定网页的候选元素以及文本信息;根据网页的展示页面截图确定网页的候选位置信息;根据各候选位置信息、各候选元素的文本信息确定各候选元素作为目标抽取元素的第一概率和各候选位置...
该专利属于中移(苏州)软件技术有限公司;中国移动通信集团公司所有,仅供学习研究参考,未经过中移(苏州)软件技术有限公司;中国移动通信集团公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。