温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明涉及网页数据采集技术领域,尤其涉及一种基于网页标签分析的数据自动采集方法。所述方法包括以下步骤:对获取的目标采集网页数据进行簇间结构特征提取,得到初始DOM树结构特征数据;根据初始DOM树结构特征数据进行页面动态加载监听,生成页面动态...该专利属于兴宁市云诺网络科技有限公司所有,仅供学习研究参考,未经过兴宁市云诺网络科技有限公司授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明涉及网页数据采集技术领域,尤其涉及一种基于网页标签分析的数据自动采集方法。所述方法包括以下步骤:对获取的目标采集网页数据进行簇间结构特征提取,得到初始DOM树结构特征数据;根据初始DOM树结构特征数据进行页面动态加载监听,生成页面动态...