一种互联网站群杂志文件在线友好阅读的图片切分方法技术

技术编号:17486120 阅读:21 留言:0更新日期:2018-03-17 10:28
本发明专利技术公开了一种互联网站群杂志文件在线友好阅读的图片切分方法,包括,建立文件目录结构,将网站管理用户在后台上传的PDF文件进行存储;用户上传动作完成后,网站群后台自动生成一条任务消息,并将任务消息发送到网站群的消息队列服务器中;消息队列服务器对任务消息按照FIFO的原则进行处理;网站访问者打开杂志链接浏览时,将处理后的杂志地址finalPdfPath直接呈现在浏览器中,默认访问的是index.html,实现翻书效果的杂志阅读。本发明专利技术将互联网网站群中杂志的阅读方式采用在线友好阅读而实现的多层次划分、多层次处理的图片切分算法进行实现,提升了访问者的用户体验效果。

An image segmentation method for online friendly reading of internet station group magazine files

The invention discloses an image segmentation method, the Internet stations including friendly reading files online magazine, a file directory structure, the website management user is stored in the PDF file upload; users upload action is completed, the automatic generation of a task news website group background, and will send the message to the message queuing server task website group; message queue server task message according to the FIFO principle for processing; site visitors open magazine links when browsing the magazine address finalPdfPath directly in the browser, the default access is index.html, implementation of fflippage reading magazines. The invention realizes the multi-level segmentation and multi-level processing of picture segmentation algorithm implemented by online reading in the Internet website group, and improves the user experience effect of visitors.

【技术实现步骤摘要】
一种互联网站群杂志文件在线友好阅读的图片切分方法
本专利技术涉及一种互联网站群杂志文件在线友好阅读的图片切分方法,属于企业门户网站

技术介绍
电子杂志目前已经进入第四代,以HTML5技术为独立于网站存在。电子杂志兼具了平面与互联网两者的特点,且融入了图像、文字、声音、视频、游戏等相互动态结合来呈现给读者。此外,还有超链接、及时互动等网络元素,并且其延展性强,未来可移植到PDA、MOBILE、MP4、PSP及TV(数字电视、机顶盒)平板电脑等多种个人终端进行阅读。但由于Flash技术将全部文字和图片打包在swf格式文件内,所以搜索引擎目前不能收录电子杂志的内容。因此,未来的电子杂志将不再使用Flash,而直接通过浏览器跨平台阅读,使得各种移动设备也能无障碍地看到原版矢量的电子杂志,不再需要下载和存档,大大提升了电子杂志的阅读体验。电子杂志的核心是一个电子文档数据库。数据库中的电子文档携带着各种标识,使得文档可以很方便地从数据库中检中并提取出来,然后按照不同的要求以各种各样的方式“再生”显示。相形之下,印刷版的核心则是一个个“千篇一律”的复本,一旦印刷完毕,装订成册,很难改变其既定的面貌。从存储方式的角度来说,传统的印刷版杂志被保存在世界各地,在个人的书橱或图书馆的书架上,承受着因岁月流逝和反复使用所造成的损伤。而电子杂志的数据库分布在有限的一个或者几个地方,通过网络供订户使用。不同的读者可以选择不同的显示方式,杂志编辑还可以根据需要对文档进行不断的修改和更新。数据库的日常更新和维护以及电子文档的处理是电子杂志发行中非常重要的一个环节。互联网网站群中用户需要可以在浏览器实现翻书效果的杂志阅读体验,而非普通的在浏览器中由上而下的滚动阅读方式。互联网上使用翻书效果的杂志阅读实现技术有电子杂志方式,这种方式需要在客户端浏览器中安装电子杂志阅读的插件,然后通过该插件实现左右翻书效果的阅读体验。此外互联网上也有其他的实现方式,但是都是针对小文件的在线阅读处理,对于大文件无法做到。所以互联网网站群平台需要解决以下几个重要的技术难点和问题:1、如何在不使用客户端插件的情况下让用户直接使用翻书体验效果;2、对于大文件的PDF如果实现在线翻书阅读;3、大文件PDF在线翻书的流畅性如何实现;4、文件在线阅读的及时性如何实现;5、文件被切分为图片后如何整合、有序的组织在一起。以上五个问题都是互联网网站群平台面临需要解决的实际技术问题。互联网网站群平台是企业的面向整个互联网环境下的建站平台以及宣传平台,在对外提供杂志阅读时,不能强制要求网站访问者安装插件,首先安全性不能很好保证,最重要的是会让网站访问者心里产生抵触心理。
技术实现思路
为解决上述技术问题,本专利技术提供一种互联网站群杂志文件在线友好阅读的图片切分方法,将PDF文件进行分割,然后在对小块的PDF文件进行图片转化,使得网站管理用户上传完PDF杂志后,立刻就可以进行效果预览,无需等待时间,大大提高了用户自身的工作效率。为解决上述问题,本专利技术所采用的技术方案如下:一种互联网站群杂志文件在线友好阅读的图片切分方法,包括以下步骤:1)建立文件目录结构,将网站管理用户在后台上传的PDF文件进行存储;2)用户上传动作完成后,网站群后台自动生成一条任务消息,并将任务消息发送到网站群的消息队列服务器中;3)消息队列服务器对任务消息按照FIFO的原则进行处理;4)网站访问者打开杂志链接浏览时,将处理后的杂志地址finalPdfPath直接呈现在浏览器中,默认访问的是index.html,实现翻书效果的杂志阅读。前述的步骤1)中,对PDF文件进行存储的方法为:首先将用户所属组织机构编码orgCode作为第一层目录,在该目录下按照PDF文件类别Catalog建立类别目录,然后在类别目录下面按日期建立子文件夹,将上传的PDF文件存储在相应日期的子文件夹中。前述的步骤2)中,任务消息包含如下字段:组织机构编码orgCode、消息创建人编码userId、业务模块编码serviceCode、消息创建时间createTime、杂志源文件地址pdfPath、处理后的杂志地址finalPdfPath。前述的消息队列服务器会为每个任务消息创建单独的线程进行处理,一旦线程启动成功,那么对应消息队列服务器中的该条任务消息就会移除。前述的消息队列服务器线程的处理过程包括以下步骤:3-1)读取任务消息,提取其中的杂志源文件地址pdfPath,将杂志源文件下载到一个临时目录TMP下,文件命名为TMP_杂志源文件名;3-2)首页判断该杂志源文件的大小是否超过了项目预先设定的阈值threshold,如果超过预先设定的阈值threshold,则转到步骤3-6);否则转入步骤3-3);3-3)网站群消息队列服务器采用icepdf工具将下载的杂志源文件分解转化为图片,转化后的图片数量PICCount和pdf杂志源文件页码相同,图片的命名规则为:首、尾封面图片的命名分别为:杂志源文件名_index和杂志源文件名_end,中间图片命名为:杂志源文件名_页码;3-4)图片转换完毕后,采用jFlip插件将生成的图片组织在一起形成最终的杂志翻书效果文件包,文件包中的文件包括js、css、images和html,其中html是index.html,是杂志翻书效果文件包的入口文件;3-5)最终的文件包形成后,消息队列服务器将该文件包推送到所述步骤1)的文件目录结构中,在按日期建立子文件夹一层创建和杂志源文件名相同的目录,然后将文件包放置到该目录下,最后将处理后的杂志地址finalPdfPath字段值设置为消息队列服务器推送的文件包地址,将finalPdfPath值更新后的任务消息回送到网站群管理后台进行更新存储,线程处理结束;3-6)网站群消息队列服务器采用iText技术将杂志源文件切割为按照阈值threshold大小的若干个小文件,被切割后的小文件的个数等于杂志源文件大小除以阈值threshold,除不尽的将单独作为一个小文件;被切割后的小文件临时存放在TMP_杂志源文件名_split目录路径下,切割后的小文件命名为:杂志源文件名_01、杂志源文件名_02、杂志源文件名_03……以此类推;3-7)网站群消息队列服务器采用icepdf工具对分割后的小文件进行图片转化;3-8)对每个小文件进行图片转化完后,对每个小文件的转化图片按照图片的文件名和页码序号进行组合,然后按照小文件的先后进行集成;3-9)集成完后采用jFlip插件将生成的这些图片组织在一起形成最终的杂志翻书效果文件包;3-10)消息队列服务器将文件包推送到所述步骤1)的文件目录结构中,在按日期建立子文件夹一层创建和杂志源文件名相同的目录,然后将文件包放置到该目录下,最后将处理后的杂志地址finalPdfPath字段值设置为消息队列服务器推送的文件包地址,将finalPdfPath值更新后的任务消息回送到网站群管理后台进行更新存储,线程处理结束。前述的步骤3)的任何一个步骤出现问题,该任务消息执行就会中断,本条任务消息会加入到网站群REDO消息队列中。前述的任务消息进入到REDO消息队列中会立刻重新开始执行,加入到REDO消息队列中的消息不影响消息队列服务器中原有任本文档来自技高网
...
一种互联网站群杂志文件在线友好阅读的图片切分方法

【技术保护点】
一种互联网站群杂志文件在线友好阅读的图片切分方法,其特征在于,包括以下步骤:1)建立文件目录结构,将网站管理用户在后台上传的PDF文件进行存储;2)用户上传动作完成后,网站群后台自动生成一条任务消息,并将任务消息发送到网站群的消息队列服务器中;3)消息队列服务器对任务消息按照FIFO的原则进行处理;4)网站访问者打开杂志链接浏览时,将处理后的杂志地址finalPdfPath直接呈现在浏览器中,默认访问的是index.html,实现翻书效果的杂志阅读。

【技术特征摘要】
1.一种互联网站群杂志文件在线友好阅读的图片切分方法,其特征在于,包括以下步骤:1)建立文件目录结构,将网站管理用户在后台上传的PDF文件进行存储;2)用户上传动作完成后,网站群后台自动生成一条任务消息,并将任务消息发送到网站群的消息队列服务器中;3)消息队列服务器对任务消息按照FIFO的原则进行处理;4)网站访问者打开杂志链接浏览时,将处理后的杂志地址finalPdfPath直接呈现在浏览器中,默认访问的是index.html,实现翻书效果的杂志阅读。2.根据权利要求1所述的一种互联网站群杂志文件在线友好阅读的图片切分方法,其特征在于,所述步骤1)中,对PDF文件进行存储的方法为:首先将用户所属组织机构编码orgCode作为第一层目录,在该目录下按照PDF文件类别Catalog建立类别目录,然后在类别目录下面按日期建立子文件夹,将上传的PDF文件存储在相应日期的子文件夹中。3.根据权利要求1所述的一种互联网站群杂志文件在线友好阅读的图片切分方法,其特征在于,所述步骤2)中,任务消息包含如下字段:组织机构编码orgCode、消息创建人编码userId、业务模块编码serviceCode、消息创建时间createTime、杂志源文件地址pdfPath、处理后的杂志地址finalPdfPath。4.根据权利要求1所述的一种互联网站群杂志文件在线友好阅读的图片切分方法,其特征在于,所述消息队列服务器会为每个任务消息创建单独的线程进行处理,一旦线程启动成功,那么对应消息队列服务器中的该条任务消息就会移除。5.根据权利要求4所述的一种互联网站群杂志文件在线友好阅读的图片切分方法,其特征在于,所述消息队列服务器线程的处理过程包括以下步骤:3-1)读取任务消息,提取其中的杂志源文件地址pdfPath,将杂志源文件下载到一个临时目录TMP下,文件命名为TMP_杂志源文件名;3-2)首页判断该杂志源文件的大小是否超过了项目预先设定的阈值threshold,如果超过预先设定的阈值threshold,则转到步骤3-6);否则转入步骤3-3);3-3)网站群消息队列服务器采用icepdf工具将下载的杂志源文件分解转化为图片,转化后的图片数量PICCount和pdf杂志源文件页码相同,图片的命名规则为:首、尾封面图片的命名分别为:杂志源文件名_index和杂志源文件名_end,中间图片命名为:杂志源文件名_页码;3-4)图片转换完毕后,采用jFlip插件将生成的图片组织在一起形成最终的杂志翻书效果文件包,文...

【专利技术属性】
技术研发人员:黎绍泉朱海东孙峰罗瑛
申请(专利权)人:南京华盾电力信息安全测评有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1