温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明属于网页设计领域,公开了一种网页页面最大块提取的方法,包括:首先获取网页源码,针对网页源码中的标签非页面展示的文字部分全部用正则替换成空白行;然后计算出每一行文字的个数形成的函数;形成的函数分布为一行;然后以步长长度为3行之和的一个组...该专利属于中译语通科技(北京)有限公司所有,仅供学习研究参考,未经过中译语通科技(北京)有限公司授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明属于网页设计领域,公开了一种网页页面最大块提取的方法,包括:首先获取网页源码,针对网页源码中的标签非页面展示的文字部分全部用正则替换成空白行;然后计算出每一行文字的个数形成的函数;形成的函数分布为一行;然后以步长长度为3行之和的一个组...