当前位置: 首页 > 专利查询>叶进蓉专利>正文

一种对网页中的图片进行处理的方法及装置制造方法及图纸

技术编号:17032983 阅读:32 留言:0更新日期:2018-01-13 19:26
本发明专利技术提供了一种对网页中的图片进行处理的方法,包括如下步骤:向网页的后台应用程序提供一虚拟地址空间;在所述虚拟地址空间中将所述携带有至少一幅图片的网页信息转化为二进制计算机代码;对所述网页中的至少一副图片进行标识,赋予每一图片一唯一标识符;根据每一唯一标识符查询对应的网页信息,遍历所述网页信息中的每一二进制计算机代码,将其与图片的二进制计算机代码进行比较,当两者一致时,保存所述网页信息中对应的图片信息,当两者不一致时,删除所述网页信息中对应的其他信息。本发明专利技术方案将不属于图片的其他信息进行删除操作,以避免病毒或恶意代码的攻击,保证了网页中上传的图片的安全性。

【技术实现步骤摘要】
一种对网页中的图片进行处理的方法及装置
本专利技术涉及计算机
,具体涉及一种对网页中的图片进行处理的方法及装置。
技术介绍
目前随着互联网技术应用的发展,大量的多媒体信息通过互联网进行传输,其中,这些多媒体信息中,又包含着大量的图片信息。例如,交易网站、论坛、博客等很多网络应用都支持用户上传图片。但是,用户上传的图片有时会含有一些额外信息如注释、EXIF(可交换图像文件)信息甚至恶意代码、病毒等,或者,用户上传的图片根本就不是浏览器支持的图片。对于一些未严格按照图像格式规范生成的图片,浏览器通常会有一定的容错机制以保证这些图片能够正常显示。在用户浏览上述含有恶意代码、病毒的图片时,容易导致缓冲区溢出,诱发系统漏洞,进而执行病毒代码。为了提高用户上传图片的安全性,并过滤图片中的病毒和恶意代码,通过使用第三方图像处理工具包,比如ImageMagicK、各种编程自带的图像处理函数等,把图片载入内存后重新保存一遍,可以达到去除恶意代码、病毒的目的。但是,由于现有技术对图片的像素进行处理,具体而言,将图片数据按照对应的图像格式进行解码,在内存中还原出图片的所有像素点,然后再对图片进行重新编码并保存,其具有如下缺点:1、占用大量的系统资源;一幅不到1MB的图片,可能由于图像压缩率较高而有着极高的分辨率,如10000×6000,这种情况下,如果这幅图片是32位真彩图片,则它就至少需要占用(10000×6000×4)Byte=240MB的内存空间。另外,由于图像解码编码需要使用大量的CPU资源,这样,在服务器并发量比较高的情况下,很容易造成服务器处理占用资源过多、超时,甚至导致应用服务器进程崩溃。2、有些时候,图像处理技术熟练的用户往往上传的是经过专业图像处理软件优化的高质量高压缩的图片,此时,第三方图像处理工具包在重新保存时,很可能由于算法的差距而导致重新保存后的图片比原图片更大,这样都会造成大量的服务器存储浪费。总之,本领域技术人员需要迫切解决的一个技术问题就是:如何能够降低上述情形下的系统资源和存储资源的占用。
技术实现思路
本专利技术所采用的技术方案是:一种对网页中的图片进行处理的方法,包括如下步骤:向网页的后台应用程序提供一虚拟地址空间;在所述虚拟地址空间中将所述携带有至少一幅图片的网页信息转化为二进制计算机代码;对所述网页中的至少一副图片进行标识,赋予每一图片一唯一标识符;根据每一唯一标识符查询对应的网页信息,遍历所述网页信息中的每一二进制计算机代码,将其与图片的二进制计算机代码进行比较,当两者一致时,保存所述网页信息中对应的图片信息,当两者不一致时,删除所述网页信息中对应的其他信息。进一步地,当两者一致时,保存所述网页信息中对应的图片信息之后还包括:将所述图片信息还原为图片的原格式,使得其以与所述网页兼容的原格式显示在所述网页中。进一步地,所述虚拟地址空间是通过使用平面页表来虚拟化的;其中,所述平面页表将协处理器可读的内存分成预定义内存数量的页面,在所述虚拟地址空间中包含用于指定协处理器可读的内存地址的标识符的页表。进一步地,将所述图片信息还原为图片的原格式,包括以下步骤:检测所述图片的二进制计算机代码中是否包含图片的像素信息,若是,则将二进制计算机代码转码为具有相同像素信息的图片信息;否则,寻找所述图片的二进制计算机代码中包含的能够表示图片清晰度以及色度的其他信息,若有,则将二进制计算机代码转码为具有相同的其他信息的图片信息。进一步地,将所述图片信息的二进制计算机代码转码后,基于每一图片一唯一标识符,匹配所述图片信息在网页上对应的预留排版空间,并在所述预留排版空间处显示所述图片。特别地,本专利技术还提供了一种对网页中的图片进行处理的装置,包括:提供模块,用于向网页的后台应用程序提供一虚拟地址空间;转化模块,用于在所述虚拟地址空间中将所述携带有至少一幅图片的网页信息转化为二进制计算机代码;标识模块,用于对所述网页中的至少一副图片进行标识,赋予每一图片一唯一标识符;遍历模块,用于根据每一唯一标识符查询对应的网页信息,遍历所述网页信息中的每一二进制计算机代码,将其与图片的二进制计算机代码进行比较,当两者一致时,保存所述网页信息中对应的图片信息,当两者不一致时,删除所述网页信息中对应的其他信息进一步地,所述装置还包括:还原模块,用于将所述图片信息还原为图片的原格式,使得其以与所述网页兼容的原格式显示在所述网页中。进一步地,所述虚拟地址空间是通过使用平面页表来虚拟化的;其中,所述平面页表将协处理器可读的内存分成预定义内存数量的页面,在所述虚拟地址空间中包含用于指定协处理器可读的内存地址的标识符的页表。进一步地,所述还原模块包括:检测单元,用于检测所述图片的二进制计算机代码中是否包含图片的像素信息;判断单元,用于若包含图片的像素信息,则将二进制计算机代码转码为具有相同像素信息的图片信息;否则,寻找所述图片的二进制计算机代码中包含的能够表示图片清晰度以及色度的其他信息,若有,则将二进制计算机代码转码为具有相同的其他信息的图片信息。本专利技术的有益效果在于:本专利技术的方案仅需要提供一虚拟地址空间,并将网页中的图片转化为二进制计算机代码,并进行比较,即可得知网页携带有哪些信息,将不属于图片的其他信息进行删除操作,以避免病毒或恶意代码的攻击,保证了网页中上传的图片的安全性。此外,本专利技术中仅比较二进制计算机代码,极大减少了网页所占的内存,极大提高了网页浏览的打开速度。附图说明图1是根据本专利技术一个实施例的用于网络日志文件中的对网页中的图片进行处理的方法的方法流程图;图2是根据本专利技术一个实施例的用于网络日志文件中的多维度数据去重系统的结构图。具体实施方式下面将结合附图及具体实施例对本专利技术作进一步详细说明。如图1所示,本专利技术所采用的技术方案是:一种对网页中的图片进行处理的方法,包括如下步骤:S100、向网页的后台应用程序提供一虚拟地址空间;S200、在所述虚拟地址空间中将所述携带有至少一幅图片的网页信息转化为二进制计算机代码;S300、对所述网页中的至少一副图片进行标识,赋予每一图片一唯一标识符;S400、根据每一唯一标识符查询对应的网页信息,遍历所述网页信息中的每一二进制计算机代码,将其与图片的二进制计算机代码进行比较,当两者一致时,保存所述网页信息中对应的图片信息,当两者不一致时,删除所述网页信息中对应的其他信息。当两者一致时,保存所述网页信息中对应的图片信息之后还包括:S500、将所述图片信息还原为图片的原格式,使得其以与所述网页兼容的原格式显示在所述网页中。所述虚拟地址空间是通过使用平面页表来虚拟化的;其中,所述平面页表将协处理器可读的内存分成预定义内存数量的页面,在所述虚拟地址空间中包含用于指定协处理器可读的内存地址的标识符的页表。将所述图片信息还原为图片的原格式,包括以下步骤:检测所述图片的二进制计算机代码中是否包含图片的像素信息,若是,则将二进制计算机代码转码为具有相同像素信息的图片信息;否则,寻找所述图片的二进制计算机代码中包含的能够表示图片清晰度以及色度的其他信息,若有,则将二进制计算机代码转码为具有相同的其他信息的图片信息。将所述图片信息的二进制计算机代码转码后,基于每一图片一唯一标识符,匹配所述图片信息在网页本文档来自技高网
...
一种对网页中的图片进行处理的方法及装置

【技术保护点】
一种对网页中的图片进行处理的方法,其特征在于,包括如下步骤:向网页的后台应用程序提供一虚拟地址空间;在所述虚拟地址空间中将所述携带有至少一幅图片的网页信息转化为二进制计算机代码;对所述网页中的至少一副图片进行标识,赋予每一图片一唯一标识符;根据每一唯一标识符查询对应的网页信息,遍历所述网页信息中的每一二进制计算机代码,将其与图片的二进制计算机代码进行比较,当两者一致时,保存所述网页信息中对应的图片信息,当两者不一致时,删除所述网页信息中对应的其他信息。

【技术特征摘要】
1.一种对网页中的图片进行处理的方法,其特征在于,包括如下步骤:向网页的后台应用程序提供一虚拟地址空间;在所述虚拟地址空间中将所述携带有至少一幅图片的网页信息转化为二进制计算机代码;对所述网页中的至少一副图片进行标识,赋予每一图片一唯一标识符;根据每一唯一标识符查询对应的网页信息,遍历所述网页信息中的每一二进制计算机代码,将其与图片的二进制计算机代码进行比较,当两者一致时,保存所述网页信息中对应的图片信息,当两者不一致时,删除所述网页信息中对应的其他信息。2.根据权利要求1所述的对网页中的图片进行处理的方法,其特征在于,当两者一致时,保存所述网页信息中对应的图片信息之后还包括:将所述图片信息还原为图片的原格式,使得其以与所述网页兼容的原格式显示在所述网页中。3.根据权利要求2所述的对网页中的图片进行处理的方法,其特征在于,所述虚拟地址空间是通过使用平面页表来虚拟化的;其中,所述平面页表将协处理器可读的内存分成预定义内存数量的页面,在所述虚拟地址空间中包含用于指定协处理器可读的内存地址的标识符的页表。4.根据权利要求2或3所述的对网页中的图片进行处理的方法,其特征在于,将所述图片信息还原为图片的原格式,包括以下步骤:检测所述图片的二进制计算机代码中是否包含图片的像素信息,若是,则将二进制计算机代码转码为具有相同像素信息的图片信息;否则,寻找所述图片的二进制计算机代码中包含的能够表示图片清晰度以及色度的其他信息,若有,则将二进制计算机代码转码为具有相同的其他信息的图片信息。5.根据权利要求4所述的对网页中的图片进行处理的方法,其特征在于,将所述图片信息的二进制计算机代码转码后,基于每一图片...

【专利技术属性】
技术研发人员:叶进蓉
申请(专利权)人:叶进蓉
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1