PDF文件转换为HTML内嵌图片的方法及计算机设备技术

技术编号：28501652 阅读：26 留言：0更新日期：2021-05-19 22:46

本发明专利技术涉及一种PDF文件转换为HTML内嵌图片的方法及计算机设备。该方法包括：S1、接收PDF文件，将PDF文件转换为单个HTML文件和多个字体文件，HTML文件中包含PDF文件中每一页截图，每个字体文件包含PDF文件中一类字体；S2、解析HTML文件后分离出CSS文件、JavaScript文件以及多个HTML子文件，每个HTML子文件包含PDF文件的一页截图；删除所有字体文件；S3、存储CSS文件、JavaScript文件和所有HTML子文件。本发明专利技术中每个HTML子文件包含PDF文件的一页图片，实现PDF文件的逐页加载显示，不仅保证加载速度，节省用户流量，还可确保不会出现乱码，保证显示质量。证显示质量。证显示质量。

全部详细技术资料下载

【技术实现步骤摘要】
PDF文件转换为HTML内嵌图片的方法及计算机设备

[0001]本专利技术涉及PDF网页显示领域，更具体地说，涉及一种PDF文件转换为HTML内嵌图片的方法及计算机设备。

技术介绍

[0002]一些网站资料已PDF(Portable Document Format)文件形式存在，用户使用浏览器访问PDF文件。现有技术中浏览器主要采用两种方式加载PDF文件：
[0003]一种方式是使用PDF插件，直接下载PDF文件。这种方式需要浏览器必须下载PDF插件，并需要下载整个PDF文件。如果PDF文件过大，将导致消耗流量过多，加载时间过长问题。
[0004]另一种方式是服务器将PDF文件转化为HTML文件，浏览器加载HTML文件。这种方式下需要加载整个PDF文件，如果PDF文件过大，将导致消耗流量过多，加载时间过长问题。

技术实现思路

[0005]本专利技术要解决的技术问题在于，针对现有技术的上述缺陷，提供一种PDF文件转换为HTML内嵌图片的方法及计算机设备。
[0006]本专利技术解决其技术...

【技术保护点】

【技术特征摘要】
1.一种PDF文件转换为HTML内嵌图片的方法，其特征在于，包括：S1、接收PDF文件，将所述PDF文件转换为单个HTML文件和多个字体文件，所述HTML文件中包含所述PDF文件中每一页截图，每个所述字体文件包含所述PDF文件中一类字体；S2、解析所述HTML文件后分离出CSS文件、JavaScript文件以及多个HTML子文件，每个所述HTML子文件包含所述PDF文件的一页截图；删除所有所述字体文件；S3、存储所述CSS文件、所述JavaScript文件和所有所述HTML子文件。2.根据权利要求1所述的PDF文件转换为HTML内嵌图片的方法，其特征在于，所述步骤S3包括：按照所述PDF文件对应的文件编号同一命名所述CSS文件、所述JavaScript文件和所有所述HTML子文件，且每个所述HTML子文件的命名中包含对应的页码信息，将命名后的所述CSS文件、所述JavaScript文件和所有所述HTML子文件存储在同一文件夹中，所述文件夹以所述文件编号命名。3.根据权利要求1所述的PDF文件转换为HTML内嵌图片的方法，其特征在于，在所述步骤S3之后还包括：S4、服务器接收PDF文件访问请求，查找与所述PDF文件访问请求对应的所述CSS文件、所述JavaScript文件和其中一个所述HTML子文件，将查找所得文件下发至浏览器；S5、所述浏览器加载所述CSS文件、所述JavaScript文件和所述HTML子文件，所述HTML子文件显示所述PDF文件的一页内容。4.根据权利要求3所述的PDF文件转换为HTML内嵌图片的方法，其特征在于，所述HTML子文件为所述PDF文件第一页内容...

【专利技术属性】
技术研发人员：方昆，
申请(专利权)人：深圳市世强元件网络有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人