下载一种网页标题提取方法及装置的技术资料

文档序号:8959472

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开了一种网页标题提取方法及装置。该方法包括:构造训练集,将训练集中的每个网页解析为文本块及其属性值的序列,标注这些文本块的类别,将属性值序列和对应的类别处理成分类器能够识别的第一属性向量;利用训练集训练分类器;将需要处理的网页解析为...
该专利属于北京鹏宇成软件技术有限公司所有,仅供学习研究参考,未经过北京鹏宇成软件技术有限公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。