下载网页内容自动提取方法的技术资料

文档序号:20329310

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明属于网页内容提取技术领域,具体涉及一种网页内容自动提取方法,特别是适用于期刊文献摘要页面内容的提取,包括:S1、将HTML重新渲染;S2、对DOM树进行分割;S3、对侯选视觉块进行预标注;S4、对侯选视觉块进行标注。该方法采用快速傅里...
该专利属于武汉伯远生物科技有限公司所有,仅供学习研究参考,未经过武汉伯远生物科技有限公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。