一种网页文章中图片处理的方法及装置制造方法及图纸

技术编号:15938895 阅读:40 留言:0更新日期:2017-08-04 21:45
本发明专利技术公开了一种网页文章中图片处理的方法及装置,该方法包括:根据所述获取到的网页文章Html源代码的Html标签提取网页文章的主体内容;根据图片标签,获取到所述网页文章的图片,并提取所述图片的网络路径地址;提取出获取到的所述图片并进行备份保存至本地服务器,并将网络路径地址替换为对应的本地路径地址,并生成图片文件列表发送至所述本地服务器;当将所述本地服务器上的所述图片文件列表中的图片删除时,对所述网页文章中对应的图片进行移除,同时生成针对所删除图片对应的图片恢复指令。实现了直接从网页文章中过滤出所有图片,并对图片进行相应的处理的目的。

Method and device for processing picture in webpage article

The invention discloses a method and a device for processing a picture \in the article, the method comprises: according to the acquired web page source code Html Html label extraction the content subject\; according to the picture label, access to the web in the pictures, and address the network path. Extract; get the picture and save the back to the local server, and will replace the network path address address corresponding to a local path, and generate a picture file list is sent to the local server; when the local server on the list of the pictures in the picture file is deleted, remove the the pictures of the web page article, at the same time to delete pictures generated corresponding image recovery instructions. It realizes the direct filtering of all the pictures from the web page and the corresponding processing of the picture.

【技术实现步骤摘要】
一种网页文章中图片处理的方法及装置
本专利技术涉及图片过滤
,特别是涉及基于网页文章中图片过滤技术的一种文章中图片处理的方法及装置。
技术介绍
目前,资讯类网站主要是通过文章来传播新闻信息。一般情况下,文章主要是依靠文字作为载体,同时除了文字信息以外,还放置一些图片,以更加形象直观地体现文章内容。根据某些需要,比如要对文章中的文字内容进行单独的编辑时,就需要将网页文章中的图片过滤出来并且进行相应的移除。同时,在某些情况下也会将移除掉的图片进行对应的恢复。而现有技术中,还没有直接从文章中过滤出所有图片并对相应的图片进行移除,并且能够对移除后的图片进行恢复的技术,并且相关方面的研究也比较少。
技术实现思路
针对于上述问题,本专利技术提供一种网页文章中图片处理的方法及装置,实现了直接从网页文章中过滤出所有图片,并对图片进行相应的处理的目的。为了实现上述目的,根据本专利技术的第一方面,提供了一种网页文章中图片处理的方法,该方法包括:获取所述网页文章的Html源代码,根据所述Html源代码的Html标签提取所述网页文章的主体内容;根据所述Html标签中的图片标签,获取到所述网页文章的主体内容中的图片,并提取所述图片的网络路径地址;提取出获取到的所述图片并进行备份保存至本地服务器,并将所述图片的网络路径地址替换为对应的本地路径地址,并生成图片文件列表发送至所述本地服务器,其中,所述图片文件列表包含被提取出的所述图片和与所述图片对应的本地路径地址;当将所述本地服务器上的所述图片文件列表中的图片删除时,对所述网页文章中对应的图片进行移除。优选的,所述将所述本地服务器上的所述图片文件列表中的图片删除时,该方法还包括:生成针对所删除图片对应的图片恢复指令。优选的,该方法还包括:当对删除后的所述网页文章中的图片进行恢复时,调用图片恢复指令,获取所述本地服务器上的所述图片文件列表;根据所述图片文件列表中的所述图片对应的本地路径,查找到在所述本地服务器上备份的所述图片;将所述图片恢复至所述网页文章中。根据本专利技术的第二方面,提供了一种网页文章中图片处理的装置,该装置包括:获取模块,用于获取所述网页文章的Html源代码,根据所述Html源代码的Html标签提取所述网页文章的主体内容;提取模块,用于根据所述Html标签中的图片标签,获取到所述网页文章的主体内容中的图片,并提取所述图片的网络路径地址;文件生成模块,用于提取出获取到的所述图片并进行备份保存至本地服务器,并将所述图片的网络路径地址替换为对应的本地路径地址,并生成图片文件列表发送至所述本地服务器,其中,所述图片文件列表包含被提取出的所述图片和与所述图片对应的本地路径地址;删除模块,用于当将所述本地服务器上的所述图片文件列表中的图片删除时,对所述网页文章中对应的图片进行移除。优选的,所述将所述本地服务器上的所述图片文件列表中的图片删除时,该装置还包括:指令生成模块,用于生成针对所删除图片对应的图片恢复指令。优选的,该装置还包括:调用单元,用于当对删除后的所述网页文章中的图片进行恢复时,调用图片恢复指令,获取所述本地服务器上的所述图片文件列表;查找单元,用于根据所述图片文件列表中的所述图片对应的本地路径,查找到在所述本地服务器上备份的所述图片;恢复单元,用于将所述图片恢复至所述网页文章中。相较于现有技术,本专利技术通过根据所述网页文章的Html标签提取所述网页文章的主体内容,并根据Html标签中的图片标签,获取到所述网页文章的主体内容中的图片,快速获得了网页文章中的所有图片;同时,将获得的图片备份至本地服务器,并将其对应的网络路径地址替换为本地路径地址,生成图片文件列表,当将所述本地服务器上的所述图片文件列表中的图片删除时,对所述网页文章中对应的图片进行移除,并生成针对所删除图片对应的图片恢复指令。进而可以对获得的网页文章中的所有图片进行相应的删除或删除后的恢复的处理。实现了直接从网页文章中过滤出所有图片,并对图片进行相应的处理的目的。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例一提供的一种网页文章中图片处理的方法的流程示意图;图2为本专利技术实施例二提供的一种网页文章中图片处理的装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的说明书和权利要求书及上述附图中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有设定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。实施例一参见图1为为本专利技术实施例一提供的一种网页文章中图片处理的方法的流程示意图,该方法包括以下步骤:S11、获取所述网页文章的Html源代码,根据所述Html源代码的Html标签提取所述网页文章的主体内容;具体的,在网页文章中,除了文章的主体内容以外还有其他的一些干扰因素,比如网页文章中的时间或者重复的内容等,需要根据Html标签提取出网页文章的主体内容,进而对所述的主体内容进行进一步的操作。S12、根据所述Html标签中的图片标签,获取到所述网页文章的主体内容中的图片,并提取所述图片的网络路径地址;优选的,在根据图片标签提取出网页文章的主体内容中的图片时,选用的是通过正则表达式进行匹配选择的,由于采用的正则表达式的匹配规则是动态添加的,并非固定式的,要根据具体的网页的Html源代码进行制定。S13、提取出获取到的所述图片并进行备份保存至本地服务器,并将所述图片的网络路径地址替换为对应的本地路径地址,并生成图片文件列表发送至所述本地服务器,其中,所述图片文件列表包含被提取出的所述图片和与所述图片对应的本地路径地址;S14、当将所述本地服务器上的所述图片文件列表中的图片删除时,对所述网页文章中对应的图片进行移除。相应的,所述将所述本地服务器上的所述图片文件列表中的图片删除时,该方法还包括生成针对所删除图片对应的图片恢复指令。具体的,当生成针对所删除图片对应的图片恢复指令时,该方法还包括:当对删除后的所述网页文章中的图片进行恢复时,调用图片恢复指令,获取所述本地服务器上的所述图片文件列表;根据所述图片文件列表中的所述图片对应的本地路径,查找到在所述本地服务器上备份的所述图片;将所述图片恢复至所述网页文章中。通过本专利技术实施例一公开的技术方案,首先根据所述网页文章的Html标签提取所述网页文章的主体内容,并根据Html标签中的图片标签,获取到所述网页文章的主体内容中的图片,快速获得了网页文章中的所有图片;其次,将获得的图片备份至本地服务器,并将其对应的网络路径地址替换为本地路径地址,生成图片文件列表;本文档来自技高网...
一种网页文章中图片处理的方法及装置

【技术保护点】
一种网页文章中图片处理的方法,其特征在于,该方法包括:获取所述网页文章的Html源代码,根据所述Html源代码的Html标签提取所述网页文章的主体内容;根据所述Html标签中的图片标签,获取到所述网页文章的主体内容中的图片,并提取所述图片的网络路径地址;提取出获取到的所述图片并进行备份保存至本地服务器,并将所述图片的网络路径地址替换为对应的本地路径地址,并生成图片文件列表发送至所述本地服务器,其中,所述图片文件列表包含被提取出的所述图片和与所述图片对应的本地路径地址;当将所述本地服务器上的所述图片文件列表中的图片删除时,对所述网页文章中对应的图片进行移除。

【技术特征摘要】
1.一种网页文章中图片处理的方法,其特征在于,该方法包括:获取所述网页文章的Html源代码,根据所述Html源代码的Html标签提取所述网页文章的主体内容;根据所述Html标签中的图片标签,获取到所述网页文章的主体内容中的图片,并提取所述图片的网络路径地址;提取出获取到的所述图片并进行备份保存至本地服务器,并将所述图片的网络路径地址替换为对应的本地路径地址,并生成图片文件列表发送至所述本地服务器,其中,所述图片文件列表包含被提取出的所述图片和与所述图片对应的本地路径地址;当将所述本地服务器上的所述图片文件列表中的图片删除时,对所述网页文章中对应的图片进行移除。2.根据权利要求1所述的方法,其特征在于,所述将所述本地服务器上的所述图片文件列表中的图片删除时,该方法还包括:生成针对所删除图片对应的图片恢复指令。3.根据权利要求2所述的方法,其特征在于,该方法还包括:当对删除后的所述网页文章中的图片进行恢复时,调用图片恢复指令,获取所述本地服务器上的所述图片文件列表;根据所述图片文件列表中的所述图片对应的本地路径,查找到在所述本地服务器上备份的所述图片;将所述图片恢复至所述网页文章中。4.一种网页文章中图片处理的装置,其特征在于,该装置包括:获取...

【专利技术属性】
技术研发人员:沈文策
申请(专利权)人:福建中金在线信息科技有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1