一种EPUB文档的校对方法及装置制造方法及图纸

技术编号：8022372 阅读：475 留言：0更新日期：2012-11-29 04:36

本发明专利技术实施例公开了一种EPUB文档的校对方法及装置，涉及文档校对技术，为提高对EPUB文档校对的准确性和校对效率而发明专利技术。一种EPUB文档的校对方法，包括：获取待校对EPUB文档中符合XML规范的目标文档；利用所述目标文档的标签构造所述目标文档的文档结构树，其中所述文档结构树中包括所述目标文档中各节点的结构信息和所述各节点对应的纯文本内容；根据所述文档结构树对所述各节点对应的纯文本内容进行校对，以实现对所述待校对EPUB文档的校对。本发明专利技术实施例主要用于EPUB文档的校对技术中。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及文档校对技术，尤其涉及一种EPUB文档的校对方法及装置。
技术介绍
随着传统纸质媒介数字化的快速发展，电子书产业前景诱人。在电子书数量不断提升的同时，电子书的质量问题也日渐凸显。传统书刊质量主要依赖作者、编辑及校对人员的努力，而计算机校对技术则可以很大程度上提升校对人员的校对效率。现有的校对技术主要可分为两类一是附带型校对，如Microsoft Word, WPS等软件自带的拼写和语法检查功能。二是专业型校对,如WhiteSmoke、黑马校对软件等。这些校对软件目前可适用于word、pdf、ps等格式的文件。 EPUB(electronic publication,电子出版物)作为一种自由的电子书开放标准，已逐步成为数字图书的主流格式。但是，由于EPUB文档的特殊结构等原因，使得现有技术中的校对技术不适用于EPUB文档的校对，从而使得对EPUB文档的校对错误率很高，校对效率低下。因此，急需开发一种适用于EPUB文档的校对方案。
技术实现思路
本专利技术实施例提供一种EPUB文档的校对方法及装置，以提高对EPUB文档校对的准确性和校对效率。本专利技术实施例采用如下技术方案一种EPUB文档的校对方法，包括获取待校对EPUB文档中符合XML规范的目标文档；利用所述目标文档的标签构造所述目标文档的文档结构树，其中所述文档结构树中包括所述目标文档中各节点的结构信息和所述各节点对应的纯文本内容；根据所述文档结构树对所述各节点对应的纯文本内容进行校对，以实现对所述待校对EPUB文档的校对。一种EPUB文档的校对装置，包括文档获取单元，用于获取待校对EPUB文...

【技术保护点】
一种EPUB文档的校对方法，其特征在于，包括：获取待校对EPUB文档中符合可扩展标记语言XML规范的目标文档；利用所述目标文档的标签构造所述目标文档的文档结构树，其中所述文档结构树中包括所述目标文档中各节点的结构信息和所述各节点对应的纯文本内容；根据所述文档结构树对所述各节点对应的纯文本内容进行校对，以实现对所述待校对EPUB文档的校对。

【技术特征摘要】

【专利技术属性】
技术研发人员：吴文元，陈峻峰，
申请(专利权)人：汉王科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人