页面处理方法、装置、设备及存储介质制造方法及图纸

技术编号:21033429 阅读:32 留言:0更新日期:2019-05-04 05:08
本发明专利技术提供的页面处理方法、装置、设备及存储介质,属于网页处理技术领域。该页面处理方法包括:爬取目标页面;获取所述目标页面中的目标数据;将所述目标数据转换为目标格式的多个数据单元;根据多个所述数据单元生成新页面。本发明专利技术通过爬取目标页面;获取所述目标页面中的目标数据;将所述目标数据转换为目标格式的多个数据单元;根据多个所述数据单元生成新页面使得用户无需从无到有的进行开发,而是通过先爬取到相关的网页后,得到网页的数据单元,进而可以有效缩短了开发页面的时间,提高了页面开发效率,同时有效节约了开发成本。

【技术实现步骤摘要】
页面处理方法、装置、设备及存储介质
本专利技术涉及网页处理
,具体而言,涉及页面处理方法、装置、设备及存储介质。
技术介绍
随着web(WorldWideWeb,万维网)发展从web1.0时代到web2.0时代,直至今天的技术框架百花齐放,web开发的效率逐渐提升。但是目前网页都是通过工程师开发成对应的界面,从而导致开发成本较高,另外开发周期长,时间成本也比较高。
技术实现思路
本专利技术实施例提供的页面处理方法、装置、设备及存储介质,可以解决现有技术中的无法提高页面处理的精度的技术问题。为了实现上述目的,本专利技术实施例采用的技术方案如下:第一方面,本专利技术实施例提供的一种页面处理方法,包括:爬取目标页面;获取所述目标页面中的目标数据;将所述目标数据转换为目标格式的多个数据单元;根据多个所述数据单元生成新页面。在本专利技术实施例中,通过爬取目标页面;获取所述目标页面中的目标数据;将所述目标数据转换为目标格式的多个数据单元;根据多个所述数据单元生成新页面。使得用户无需从无到有的进行开发,而是通过先爬取到相关的网页后,得到网页的数据单元,进而可以有效缩短了开发页面的时间,提高了页面本文档来自技高网...

【技术保护点】
1.一种页面处理方法,其特征在于,包括:爬取目标页面;获取所述目标页面中的目标数据;将所述目标数据转换为目标格式的多个数据单元;根据多个所述数据单元生成新页面。

【技术特征摘要】
1.一种页面处理方法,其特征在于,包括:爬取目标页面;获取所述目标页面中的目标数据;将所述目标数据转换为目标格式的多个数据单元;根据多个所述数据单元生成新页面。2.根据权利要求1所述的方法,其特征在于,所述获取所述目标页面中的目标数据,包括:提取所述目标页面所对应的页面布局信息;根据所述页面布局信息从所述目标页面中确定出目标数据。3.根据权利要求2所述的方法,其特征在于,所述提取所述目标页面所对应的页面布局信息,包括:提取所述目标页面所对应的页面结构和页面样式;将所述页面结构和所述页面样式作为页面布局信息。4.根据权利要求2所述的方法,其特征在于,所述根据所述页面布局信息从所述目标页面中确定出目标数据,包括:根据所述页面布局信息提取所述页面中的页面元素;提取所述页面元素所对应的页面数据;过滤所述页面数据中与预设参数匹配的数据,得到目标数据。5.根据权利要求1所述的方法,其特征在于,所述将所述目标数据转换为目标格式的多个数据单元,包括:将所述目标数据按照页面标签属性拆分为目标格式的多个数据单元。6.根据权利要求1所述的方法,其特征在于,所述...

【专利技术属性】
技术研发人员:宜博黄江涛
申请(专利权)人:宜创北京科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1