下载一种网页内容块的边界确定和分割的方法及系统的技术资料

文档序号:32676298

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本申请提供一种网页内容块的边界确定和分割的方法及系统,所述方法包括:获取待分割网页的DOM树;根据获取的所述DOM树,构建与所述DOM树对应的副本DOM树;将所述副本DOM树中的行内节点与相连的文字节点进行合并处理,以及对所述副本DOM树进...
该专利属于北京大学所有,仅供学习研究参考,未经过北京大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。