下载一种提取网页正文的方法的技术资料

文档序号:11074233

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

一种提取网页正文的方法,包括:根据待提取的网页的域名,判断预置的站点知识库中是否存储有对应于该域名的用于提取正文的提取信息;若有,则根据所述提取信息对所述网页的正文进行提取;若所述站点知识库中没有对应于该域名的提取信息,或,根据该提取信息对...
该专利属于武汉传神信息技术有限公司所有,仅供学习研究参考,未经过武汉传神信息技术有限公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。