当前位置: 首页 > 专利查询>河南大学专利>正文

一种文档转换阅读方法与系统技术方案

技术编号:12402212 阅读:40 留言:0更新日期:2015-11-28 16:57
本发明专利技术公开了一种文档转换阅读方法与系统,判断目标文档的文档格式;当目标文档格式为Word或Excel格式时,查找数据库是否保存有与当前格式的目标文档对应的Html格式文档,如果有则利用预设组件加载显示所述Html格式文档;否则将目标文档转换为Html格式文档,将所述Html格式文档保存至数据库并利用预设网页显示组件加载显示所述Html格式文档;当目标文档的文档格式为PDF格式时,提取所述目标文档中的内容信息,根据所述目标文档中的信息将所述目标文档转换为图片格式文档,利用预设图片显示插件加载显示所述图片格式文档。可以在无法直接显示Word、Excel或PDF格式的操作系统平台上对以上三种文档格式的内容进行高效地转换显示。

【技术实现步骤摘要】

本专利技术涉及文件格式转换领域,特别是涉及一种文档转换阅读方法与系统
技术介绍
Word与Excel是微软公司开发的一套基于Windows操作系统的办公软件套装的常用组件。PDF是由Adobe公司所开发的独特的跨平台文件格式。Word为一个文字处理应用程序,可以创建纯文本或处理具有图片的文档;EXcel为一款电子表格软件,可以进行各种数据的处理、统计分析和辅助决策操作,广泛地应用于管理、统计财经、金融等众多领域。但是这三种文档的阅读技术并非开源技术,故第三方软件想阅读Word、Excel与PDF文档只能采用第三方技术,通常的做法是从底层开始入手使用C/C++来解析阅读,在一些操作系统平台上如Android平台上这种方法的解析阅读效率较低,性能较低。目前对于这三种文档在Android平台上缺乏一种效率高的解析阅读方法。
技术实现思路
有鉴于此,本专利技术的主要目的在于提供一种文档转换阅读方法与系统,可以高效率地解析阅读Word、Excel或PDF文档的内容。为实现上述目的,本专利技术提供了一种文档转换阅读方法,包括:判断目标文档的文档格式;当所述目标文档的文档格式为Word格式或Excel格式时,查找数据库是否保存有与所述目标文档内容对应的Html格式文档,如果有则利用预设组件加载显示所述Html格式文档;否则将所述目标文档转换为Html格式文档,将所述Html格式文档保存至数据库并利用预设网页显示组件加载显示所述Html格式文档;当所述目标文档的文档格式为PDF格式时,提取所述目标文档中的内容信息与内容显示样式信息,根据所述内容显示样式信息将所述目标文档中的内容信息转换为图片格式文档,利用预设图片显示插件加载显示所述图片格式文档。优选地,将所述目标文档转换为Html格式文档包括:提取所述目标文档的内容信息与内容显示样式信息,根据提取的所述内容显示样式信息按Html文档格式将提取的所述内容信息进行拼装得到对应的Html格式文档。 优选地,所述内容信息包括:所述目标文档中的文字和/或图片。优选地,所述预设组件为Webview组件。优选地,所述预设插件为ViewPager插件。优选地,利用预设插件加载显示所述图片格式文档后还包括:响应用户的截屏请求,对指定的所述图片格式文档的内容进行截取,得到目标截图图片,并将所述目标截图图片保存到数据库。优选地,将所述目标截图图片保存到数据库后还包括:响应用户的PDF转换指令,获取数据库保存的图片中要进行格式转换的目标图片,提取所述目标图片中的内容信息,根据提取的所述目标图片中的内容信息将所述目标图片转换为PDF格式的文档。本专利技术还提供了一种文档转换阅读系统,包括:文档格式判断模块,第一转换阅读模块和第二转换阅读模块;所述文档格式判断模块用于判断目标文档的文档格式;所述第一转换阅读模块用于当所述目标文档的文档格式为Word格式或Excel格式时,查找数据库是否保存有与所述目标文档内容对应的Html格式文档,如果有则利用预设组件加载显示所述Html格式文档;否则将所述目标文档转换为Html格式文档,将所述Html格式文档保存至数据库并利用预设组件加载显示所述Html格式文档;所述第二转换阅读模块用于当所述目标文档的文档格式为PDF格式时,提取所述目标文档中的内容信息与内容显示样式信息,根据所述内容显示样式信息将所述目标文档中的内容信息转换为图片格式文档,利用预设插件加载显示所述图片格式文档。优选地,所述文档转换阅读系统还包括截屏模块;所述截屏模块用于响应用户的截屏请求,对指定的所述图片格式文档的内容进行截取,得到目标截图图片,并将所述目标截图图片保存到数据库。优选地,苏搜狐文档转换阅读系统还包括PDF转换模块;所述PDF转换模块用于响应用户的PDF转换指令,获取数据库保存的图片中要进行格式转换的目标图片,提取所述目标图片中的内容信息,根据提取的所述目标图片中的内容信息将所述目标图片转换为PDF格式的文档。应用本专利技术提供的文档转换阅读方法与系统,判断目标文档的文档格式;当目标文档格式为Word或Excel格式时,查找数据库是否保存有与当前格式的目标文档对应的Html格式文档,如果有则利用预设组件加载显示所述Html格式文档;否则将目标文档转换为Html格式文档,将所述Html格式文档保存至数据库并利用预设网页显示组件加载显示所述Html格式文档;当目标文档的文档格式为PDF格式时,提取所述目标文档中的内容信息,根据所述目标文档中的信息将所述目标文档转换为图片格式文档,利用预设图片显示插件加载显示所述图片格式文档。可以在无法直接显示Word、Excel或PDF格式的操作系统平台上对以上三种文档格式的内容进行高效地转换显示。【附图说明】为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术文档转换阅读方法实施例一的流程图;图2为本专利技术文档转换阅读方法实施例二的流程图;图3为本专利技术文档转换阅读方法实施例三的结构示意图;图4为本专利技术文档转换阅读系统实施例四的结构示意图;图5为本专利技术文档转换阅读系统实施例五的结构示意图。【具体实施方式】下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一:本专利技术提供了一种文档转换阅读方法,图1示出了本专利技术文档转换阅读方法实施例一的流程图,包括:步骤SlOl:判断目标文档的文档格式,当所述目标文档的文档格式为Word格式或Excel格式时,进入步骤S102,当所述目标文档的文档格式为PDF格式时,进入步骤S105:步骤S102:查找数据库是否保存有与所述目标文档内容对应的Html格式文档,如果有则进入步骤S103,否则进入步骤S104 ;当所述目标文档的文档格式为Word格式或Excel格式时,查找数据库是否保存有与当前文档格式的所述目标文档对应的Html文档格式的所述目标文档,实际上为判断是否有目标文档的阅读记录,即判断是否为首次阅读目标文档。步骤S103:利用预设组件加载显示所述Html格式文档;当有目标文档的阅读记录时,数据库可以查找到初次阅读时转换并保存至数据库的Html文档格式的所述目标文档,利用预设的组件如Webview组件加载显示Html文档格式的所述目标文档的内容。步骤S104:将所述目标文档转换为Html格式文档,将所述Html格式文档保存至数据库并利用预设网页显示组件加载显示所述Html格式文档;当没有目标文档的阅读记录时,先将所述目标文档转换为Html文档格式,具体包括:提取所述目标文档的内容信息与内容显示样式信息,内容信息如文档中的文字或图片,内容显示样式信息即文字或图片的样式或排版样式等信息,根据提取的所述内容显示样式信息按Html文档格式将提取的所述内容信息进行拼装得到对应的Html文档格式的本文档来自技高网...

【技术保护点】
一种文档转换阅读方法,其特征在于,包括:判断目标文档的文档格式;当所述目标文档的文档格式为Word格式或Excel格式时,查找数据库是否保存有与所述目标文档内容对应的Html格式文档,如果有则利用预设组件加载显示所述Html格式文档;否则将所述目标文档转换为Html格式文档,将所述Html格式文档保存至数据库并利用预设网页显示组件加载显示所述Html格式文档;当所述目标文档的文档格式为PDF格式时,提取所述目标文档中的内容信息与内容显示样式信息,根据所述内容显示样式信息将所述目标文档中的内容信息转换为图片格式文档,利用预设图片显示插件加载显示所述图片格式文档。

【技术特征摘要】

【专利技术属性】
技术研发人员:梁胜彬邰景磊
申请(专利权)人:河南大学
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1