PDF文件转换为HTML内嵌图片的方法及计算机设备技术

技术编号:28501652 阅读:26 留言:0更新日期:2021-05-19 22:46
本发明专利技术涉及一种PDF文件转换为HTML内嵌图片的方法及计算机设备。该方法包括:S1、接收PDF文件,将PDF文件转换为单个HTML文件和多个字体文件,HTML文件中包含PDF文件中每一页截图,每个字体文件包含PDF文件中一类字体;S2、解析HTML文件后分离出CSS文件、JavaScript文件以及多个HTML子文件,每个HTML子文件包含PDF文件的一页截图;删除所有字体文件;S3、存储CSS文件、JavaScript文件和所有HTML子文件。本发明专利技术中每个HTML子文件包含PDF文件的一页图片,实现PDF文件的逐页加载显示,不仅保证加载速度,节省用户流量,还可确保不会出现乱码,保证显示质量。证显示质量。证显示质量。

【技术实现步骤摘要】
PDF文件转换为HTML内嵌图片的方法及计算机设备


[0001]本专利技术涉及PDF网页显示领域,更具体地说,涉及一种PDF文件转换为HTML内嵌图片的方法及计算机设备。

技术介绍

[0002]一些网站资料已PDF(Portable Document Format)文件形式存在,用户使用浏览器访问PDF文件。现有技术中浏览器主要采用两种方式加载PDF文件:
[0003]一种方式是使用PDF插件,直接下载PDF文件。这种方式需要浏览器必须下载PDF插件,并需要下载整个PDF文件。如果PDF文件过大,将导致消耗流量过多,加载时间过长问题。
[0004]另一种方式是服务器将PDF文件转化为HTML文件,浏览器加载HTML文件。这种方式下需要加载整个PDF文件,如果PDF文件过大,将导致消耗流量过多,加载时间过长问题。

技术实现思路

[0005]本专利技术要解决的技术问题在于,针对现有技术的上述缺陷,提供一种PDF文件转换为HTML内嵌图片的方法及计算机设备。
[0006]本专利技术解决其技术问题所采用的技术方案本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种PDF文件转换为HTML内嵌图片的方法,其特征在于,包括:S1、接收PDF文件,将所述PDF文件转换为单个HTML文件和多个字体文件,所述HTML文件中包含所述PDF文件中每一页截图,每个所述字体文件包含所述PDF文件中一类字体;S2、解析所述HTML文件后分离出CSS文件、JavaScript文件以及多个HTML子文件,每个所述HTML子文件包含所述PDF文件的一页截图;删除所有所述字体文件;S3、存储所述CSS文件、所述JavaScript文件和所有所述HTML子文件。2.根据权利要求1所述的PDF文件转换为HTML内嵌图片的方法,其特征在于,所述步骤S3包括:按照所述PDF文件对应的文件编号同一命名所述CSS文件、所述JavaScript文件和所有所述HTML子文件,且每个所述HTML子文件的命名中包含对应的页码信息,将命名后的所述CSS文件、所述JavaScript文件和所有所述HTML子文件存储在同一文件夹中,所述文件夹以所述文件编号命名。3.根据权利要求1所述的PDF文件转换为HTML内嵌图片的方法,其特征在于,在所述步骤S3之后还包括:S4、服务器接收PDF文件访问请求,查找与所述PDF文件访问请求对应的所述CSS文件、所述JavaScript文件和其中一个所述HTML子文件,将查找所得文件下发至浏览器;S5、所述浏览器加载所述CSS文件、所述JavaScript文件和所述HTML子文件,所述HTML子文件显示所述PDF文件的一页内容。4.根据权利要求3所述的PDF文件转换为HTML内嵌图片的方法,其特征在于,所述HTML子文件为所述PDF文件第一页内容...

【专利技术属性】
技术研发人员:方昆
申请(专利权)人:深圳市世强元件网络有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1