电子书排版方法及其系统技术方案

技术编号:6035107 阅读:813 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种用于在不同屏幕大小的电子书阅读设备上对电子书进行排版的电子书排版方法,包括:读取电子书中的文本数据;然后分析文本数据的格式;再结合电子书阅读设备的环境参数对文本数据格式进行包括:换行符分析、前后文语境检测及长段落分析的排版优化处理;接着根据排版优化处理的格式对文本数据进行排版;最后显示排版后的电子书文本数据;本发明专利技术还提供了一种电子书排版系统;采用本发明专利技术,可实现优化的排版功能,用户在不同屏幕大小或参数的电子书阅读设备上均可获得良好的阅读效果。

【技术实现步骤摘要】

本专利技术涉及一种电子书排版方法及其系统,更具体的是,涉及一种能适应不同屏 幕大小电子书阅读设备的电子书排版方法及其系统。
技术介绍
一般来说,电子书是指电子版图书,又称e-book,是传统印刷书籍的电子版本,用 户可以使用个人计算机或电子书阅读器等下载电子书进行离线阅读。由于电子书可以从网 上自动下载,用户可用各种电子书设备,如计算机、电子书阅读器或手机进行海量阅读,还 可通过查找、搜索、画线、注释和超链接等实现类似纸质书籍上的功能,随着网络的发展,电 子书的应用也日益广泛。由于携带的便利性,手机和电子书阅读器常常作为电子书的阅读 设备,然而,不同的电子书阅读器或手机具有各自不同的屏幕大小或文本格式,大部分电子 阅读设备都没有自动排版功能,不能根据屏幕的不同大小(自动)调整文字的排版格式,而 且,对于用户从网络下载的电子书,如文本电子书、手机电子书等,由于其格式是针对特定 的电子阅读设备的,采用其他阅读设备下载后,往往不能正确识别或显示其中的段落、换行 和空白行等文本符号,因此,排版功能很差,大大影响了使用者的阅读效果。
技术实现思路
本专利技术的主要目的是提供一种能适用于不同屏幕大小的电子阅读设备、便于使用 者阅读的电子书排版方法。为实现上述目的,本专利技术提供的电子书排版方法用于在不同屏幕大小的电子书阅 读设备上对电子书进行排版,包括读取电子书中的文本数据; 分析文本数据的格式;结合所述电子书阅读设备的环境参数对所述文本数据格式进行包括换行符分析、前 后文语境检测及长段落分析的排版优化处理;根据排版优化处理的格式对文本数据进行排版; 显示排版后的电子书文本数据。由以上方案可见,本专利技术结合了电子书阅读设备的环境参数对读取的电子书文本 数据格式进行排版,删除其中多余的换行和空白部分,分析长段落并结合电子书阅读设备 的环境参数进行段落分割,使得阅读者在不同屏幕大小的电子书阅读设备上均能具有良好 的阅读效果,避免了传统方法中使用不同电子书阅读设备而出现的多余回车换行符号、多 余的空白行及没有回车换行长篇文本的情况,大大优化的排版功能。本专利技术的另一目的是提供一种采用上述方法对电子书阅读设备排版的系统。为实现上述目的,本专利技术提供的电子书排版系统,用于在不同屏幕大小的电子书 阅读设备上对电子书进行排版,包括顺序连接的读取模块、格式分析模块、排版模块和显示 模块;读取模块用于读取电子书的文本数据; 格式分析模块分析文本数据的格式;排版模块结合电子书阅读设备的环境参数对文本数据格式进行排版优化处理并排版; 排版模块包括对文本数据的换行符分析部分、前后文语境检测部分及长段落分析部分; 显示模块用于显示排版后的电子书文本数据。采用本专利技术的系统能够根据不同屏幕大小的电子书阅读设备的环境参数来对文 本数据格式进行排版处理,当排版模块查找到换行符时会对其前后字符进行分析以判断当 前换行符的有效性,并根据语境类型判断长段落的分割点,有效避免了在不同电子书阅读 设备阅读时,由于屏幕大小、像素等环境参数不同而产生的不正确换行、空白字符和长篇文 本的情况,因此,使用本专利技术的系统优化了排版功能、大大提高了阅读效果,适合不同屏幕 大小的电子阅读设备,此外,本系统成本小、安装简单,具有广泛的应用前景。附图说明图1是本专利技术之电子书排版方法的总流程图。图2是本专利技术之电子书排版方法的换行符分析流程图。图3是本专利技术之电子书排版方法的当前字符的前一字符分析排版的示例图。图4是本专利技术之电子书排版方法的当前字符的后一字符分析排版的示例图。图5是本专利技术之电子书排版方法的前后文语境分析示例图。图6是本专利技术之电子书排版方法的长段落分析流程图。图7是本专利技术之电子书排版方法的长段落分析判断条件示意图。图8是本专利技术之电子书排版系统的系统结构示意图。以下结合各实施例及其附图对本专利技术作进一步说明。具体实施例方式电子书排版方法实施例一种用于在不同屏幕大小的电子书阅读设备上对电子书进行排版的电子书排版方法, 参见图1,具体包括如下步骤首先读取电子书中的文本数据;然后分析文本数据的格式; 接着结合电子书阅读设备的环境参数对文本数据格式进行排版优化处理;再根据排版优化 处理的格式对文本数据进行排版;最后显示排版后的电子书文本数据。其中,对文本数据格 式进行排版优化处理的过程包括换行符分析、前后文语境检测及长段落分析。分析文本数据格式具体包括对文本数据进行文本符号分析和段落分析,不同的 电子书格式对应不同的语法分析器(parser),语法分析器完成文本数据格式分析后,进入 下一步骤对换行符进行分析。换行符分析的方法具体是对当前字符的前一字符和后一字符进行检测,以判断当 前换行字符是否有效的方法,通过换行符的分析,可以正确的显示文本数据中的换行符,将 文本数据多余换行和空白行删除,参见图2,其具体步骤如下sal 读取当前字符;sa2 判断所述当前字符是否为换行符,若是则进入下一步骤sa3,否则进入步骤sa8 ; 判断读取的当前字符是否为换行符,若是换行符则对当前字符的前后字符进一步判断,若不是换行符则进入sa8的长段落分析步骤; sa3 读取所述当前字符的前一字符;sa4:判断所述前一字符是否属于问号、省略号、后书名号、后引号、感叹号等句结 束符中的其中之一,若是则初步判断当前换行符有效并进入下一步骤sa5,否则进入步骤 sa8;当前字符为换行符,此时判断当前字符的前一字符是否属于句结束符,若属于句结束 符则判断当前回车字符有效,否则进入步骤sa8的长段落分析过程,同时判断当前回车字 符无效;句结束符包括问号(?)、省略号(……)、后书名号(》)、感叹号(!)、后引号(”)等, 非句结束符则包括逗号(,)、前引号(“),冒号(),顿号(、)等,图3是对当前字符的前一 字符进行判定而进行排版的示例,其中由于读取的当前字符为换行符,则读取前一字符进 行分析,而前一字符为逗号,因此,判断当前换行字符无效。sa5 读取所述当前字符的后一字符;Sa6:判断所述后一字符是否属于项目符号或其他开始符号的其中之一,若是则再次判 断当前换行字符有效并进入下一步骤sa7,否则进入步骤sa8 ;当前一字符属于结束符时, 进一步判断当前字符的后一字符是否属于项目符号或其他开始符号,如·、★、 等,若 属于项目符号或其他开始符号,则判断当前换行字符有效,若不属于上述项目符号或开始 符号,则进入长段落分析过程,并判断当前换行字符无效;图4是对后一字符判断并排版的 示例,当前字符为换行符,由于前一字符为文字,因此进入后一字符的判断,后一字符为省 略号,省略号不属于项目符号或开始符号,因此,判断当前换行字符无效。sa7 前后文语境分析过程,进入步骤sa9 ;通过对当前换行字符的前后字符进行 判断,当前一字符属于句结束符、后一字符属于项目符号或开始符号时,当前换行字符才是 有效的,才能进入前后文语境分析过程;其中,前后文语境分析的方法是根据文本数据的语境类别,如对话、章节、句中、标题 或人物介绍等,然后通过分析所述文本数据中的开始标点、首字符、中间字符、尾标点及尾 字符来判断句子是整句还是半句,从而判断所述当前换行字符是否有效的方法。图5是前 后文语境分析的几个典型示例,其中通过语境判断、开始和尾标点、首尾字符本文档来自技高网...

【技术保护点】
电子书排版方法,用于在不同屏幕大小的电子书阅读设备上对电子书进行排版,其特征在于:该方法包括:读取电子书中的文本数据;分析所述文本数据的格式;结合所述电子书阅读设备的环境参数对所述文本数据格式进行包括:换行符分析、前后文语境检测及长段落分析的排版优化处理;根据所述排版优化处理的格式对所述文本数据进行排版;显示排版后的电子书文本数据。

【技术特征摘要】

【专利技术属性】
技术研发人员:吴浪
申请(专利权)人:珠海全志科技有限公司
类型:发明
国别省市:44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1