实现文档格式转换的方法及装置制造方法及图纸

技术编号:14399356 阅读:33 留言:0更新日期:2017-01-11 12:38
本发明专利技术公开一种实现文档格式转换的方法及装置,其中,实现文档格式转换的方法包括:载入word文档;将载入的所述word文档转换为网页文档;及将所述网页文档中的标签转换为原生标记,并根据预存的样式属性与扩展标记之间的对应关系,将标签中的样式属性转换为扩展标记,以得到Markdown文档;其中,所述Markdown文档中保留了所述网页文档中样式属性对应的样式效果。实现文档格式转换的装置包括:word文档加载模块、word文档转换模块及网页文档转换模块。本发明专利技术能避免进行Markdown文档转换中样式效果的丢失,实现Markdown文档中样式效果的再次编辑。

【技术实现步骤摘要】

本专利技术涉及计算机应用
,尤其涉及一种实现文档格式转换的方法及装置
技术介绍
Markdown作为一种轻量级的标记语言,具有很好的可读性。例如,用一个“*”标记包含一段文本就表示该段文本为斜体显示,用两个“*”标记包含一段文本就表示该段文本为粗体显示。Markdown文档采用纯文本的格式编辑,可以采用普通的文本编辑器打开,兼容性极强;也有一些专为Markdown设计的编辑器,可以直接在该专为Markdown设计的编辑器中预览Markdown文档的样式。在各种需要用户编辑输入的应用场景中,Markdown文档已经被广泛地使用。例如,应用于github(版本控制系统)上的项目说明文档。Markdown文档可以很方便地转换成html格式文档即网页文档以及pdf文档等各种更直观的格式文档,当然,有时候也会需要按照用户的实际需求将word文档、网页文档等具有更强的展现样式的格式文档转换为Markdown文档。目前,将word文档转换为Markdown文档的方式主要有如下两种:(1)把word文档转换成网页文档后,直接嵌入到Markdown文档中,因为Markdown文档支持原样输出内嵌的网页文档。这种方式虽然可以最大程度的保留原word文档的样式效果,但无法对该Markdown文档再次编辑。(2)把word文档转换成网页文档后,再把转换后的网页文档进一步地转换成Markdown文档,这种方式保留了Markdown文档的优势,即可以很方便地进行再次编辑。但缺点是会丢失原网页文档的部分样式效果,例如大字号的文本会变成标题,字体颜色会丢失等,进而使得原word文档的展现样式在转换过程中的丢失。因此,无论采用上述何种转换方式,转换后的文档要么不可再次编辑,要么会引起原word文档的展现样式的丢失,使得Markdown文档的应用场景受到限制。
技术实现思路
基于此,有必要提供一种能避免进行Markdown文档转换中样式效果的丢失,实现Markdown文档中样式效果的再次编辑的实现文档格式转换的方法。此外,还有必要提供一种能避免进行Markdown文档转换中样式效果的丢失,实现Markdown文档中样式效果的再次编辑的实现文档格式转换的装置。为了解决上述技术问题,本专利技术所采用的技术方案为:一种实现文档格式转换的方法,包括:载入word文档;将载入的所述word文档转换为网页文档;及将所述网页文档中的标签转换为原生标记,并根据预存的样式属性与扩展标记之间的对应关系,将标签中的样式属性转换为扩展标记,以得到Markdown文档;其中,所述Markdown文档中保留了所述网页文档中样式属性对应的样式效果。一种实现文档格式转换的装置,包括:word文档加载模块、word文档转换模块及网页文档转换模块,其中,word文档加载模块用于载入word文档;word文档转换模块用于将载入的所述word文档转换为网页文档;及网页文档转换模块用于将所述网页文档中的标签转换为原生标记,并根据预存的样式属性与扩展标记之间的对应关系,将标签中的样式属性转换为扩展标记,以得到Markdown文档;其中,所述Markdown文档中保留了所述网页文档中样式属性对应的样式效果。与现有技术相比,本专利技术具有以下有益效果:文档进行格式转换中,在将word文档转换为网页文档之后,将该网页文档中的标签转换为原生标记,并根据预存的样式属性与扩展标记之间的对应关系,将标签中的样式属性转换为扩展标记,由此输出转换完成的Markdown文档,由于word文档至网页文档之间的转换以及网页文档至Markdown文档之间的转换均未丢失其中的样式效果,特征是网页文档的标签中样式属性均转换为对应的扩展标记,以将word文档中的样式效果原原本本地转换至Markdown文档中,使得转换得的Markdown文档既保留了原网页文档的样式效果,又可以很方便地重复编辑,从而扩大了Markdown文档的应用场景。附图说明图1为一实施例的实现文档格式转换的方法的流程图;图2为另一实施例的实现文档格式转换的方法的流程图;图3为图1中网页文档转换为Markdown文档的方法的流程图;图4为一个实施例中通过词法解析器按照规则序列中扩展标记与样式属性之间的对应关系对Markdown文档进行解析,以将Markdown文档还原为网页文档的方法流程图;图5为一实施例的实现文档格式转换的方法的流程图;图6为一个实施例中实现文档格式转换的方法的应用示意图;图7为图6中实现文档格式转换的方法的应用示意图;图8为一实施例的实现文档格式转换的系统的结构框图;图9为另一实施例的实现文档格式转换的系统的结构框图;图10为图9中网页文档转换模块的结构框图;图11为另一实施例的实现文档格式转换的系统的Markdown文档还原模块的结构框图;图12为另一实施例的实现文档格式转换的系统的结构框图;图13为本专利技术实施例所提供的一种服务器的结构示意图。具体实施方式体现本专利技术特征与优点的典型实施方式将在以下的说明中详细叙述。应理解的是本专利技术能够在不同的实施方式上具有各种的变化,其皆不脱离本专利技术的范围,且其中的说明及图示在本质上是当作说明之用,而非用以限制本专利技术。如前所述,由于Markdown文档具有可以很方便地进行再次编辑的优势,已经被广泛地应用于各种需要用户编辑输入的应用场景中。但是,Markdown文档也存在着一个缺点,即在与具有更强的展现样式的word文档的转换过程中往往会引起样式属性的丢失,使Markdown文档的应用场景受到限制。因此,为了扩大Markdown文档的应用场景,使转换得的Markdown文档不仅可再次编辑,同时可以保留原word文档中的样式效果,特提出了一种实现文档格式转换的方法。该方法可依赖于计算机程序,该计算机程序将运行在服务器之上。请参阅图1,在一实施例中,一种实现文档格式转换的方法包括以下步骤:步骤110,载入word文档。本实施例中,该word文档的载入由一文件服务器执行,以利于被载入的word文档能够在该文件服务器上完成后续的文档格式转换步骤。其中,欲转换为Markdown文档的该word文档包含有各种文本内容以及该些文本内容所对应的展现样式,该展现样式均有对应的样式属性,也就是说,该word文档在进行内容显示时所对应的文档页面将显示有各种文本内容,并且该些文本内容所对应的展现样式也将显示于文档页面中。步骤130,将载入的word文档转换为网页文档。本实施例中,文件服务器中,触发打开载入的word文档,并将该word文档转换为网页文档。其中,word文档的打开与转换均可通过开源工具实现,例如,该开源工具可以是开源的办室软件套件。进一步的,对于载入文件服务器的word文档而言,可通过其所在的文件服务器调用跨平台的开源的办公室软件套实现打开与转换。例如,该办公室软件套件可以是OpenOffice开源软件,其可以在Windows、Linux、MacOS等操作系统上执行。该网页文档指的是可以采用纯文本格式进行编辑的文本形式,通过该网页文档即可实现相应的网页页面显示。当然,在其他实施例中,也可以通过本地计算机将载入的word文档转换为网页文档。例如,将本地计算机中保存的word文档直接打开,并将wo本文档来自技高网
...
实现文档格式转换的方法及装置

【技术保护点】
一种实现文档格式转换的方法,其特征在于,包括:载入word文档;将载入的所述word文档转换为网页文档;及将所述网页文档中的标签转换为原生标记,并根据预存的样式属性与扩展标记之间的对应关系,将标签中的样式属性转换为扩展标记,以得到Markdown文档;其中,所述Markdown文档中保留了所述网页文档中样式属性对应的样式效果。

【技术特征摘要】
1.一种实现文档格式转换的方法,其特征在于,包括:载入word文档;将载入的所述word文档转换为网页文档;及将所述网页文档中的标签转换为原生标记,并根据预存的样式属性与扩展标记之间的对应关系,将标签中的样式属性转换为扩展标记,以得到Markdown文档;其中,所述Markdown文档中保留了所述网页文档中样式属性对应的样式效果。2.如权利要求1所述的实现文档格式转换的方法,其特征在于,所述将所述网页文档中的标签转换为原生标记,并根据预先设置的样式属性与扩展标记之间的对应关系,将标签中的样式属性转换为扩展标记,以得到Markdown文档的步骤之前,所述方法还包括:为所述样式属性创建扩展标记;及建立所述样式属性与创建的所述扩展标记之间的对应关系,并保存所述对应关系。3.如权利要求1所述的实现文档格式转换的方法,其特征在于,所述将标签转换为原生标记,并根据预存的样式属性与扩展标记之间的对应关系,将标签中的样式属性转换为扩展标记,以得到Markdown文档的步骤包括:遍历所述网页文档中的标签,判断所述标签是否包含所述样式属性;若为是,则按照所述预存的样式属性与扩展标记之间的对应关系,将所述样式属性转换为所述扩展标记;若为否,则按照标签在原生语法中对应的原生标记将所述标签转换为所述原生标记;及输出包含所述转换得到的原生标记和扩展标记的Markdown文档。4.如权利要求1所述的实现文档格式转换的方法,其特征在于,所述将标签转换为原生标记,并根据预存的样式属性与扩展标记之间的对应关系,将标签中的样式属性转换为扩展标记,以得到Markdown文档的步骤之后,所述方法还包括:通过词法解析器按照规则序列中扩展标记与样式属性之间的对应关系对所述Markdown文档进行解析,以将所述Markdown文档还原为网页文档。5.如权利要求4所述的实现文档格式转换的方法,其特征在于,所述通过词法解析器按照规则序列中扩展标记与样式属性之间的对应关系对所述Markdown文档进行解析,以将所述Markdown文档还原为网页文档的步骤包括:触发运行所述词法解析器;及通过所述词法解析器扫描所述Markdown文档中的标记,将所述标记中的原生标记转换为标签,并根据所述规则序列中扩展标记与样式属性之间的对应关系,将所述标记中的扩展标记转换为样式属性,以输出还原的网页文档。6.如权利要求4所述的实现文档格式转换的方法,其特征在于,所述通过词法解析器按照规则序列中扩展标记与样式属性之间的对应关系对所述Markdown文档进行解析,以将所述Markdow...

【专利技术属性】
技术研发人员:李德斌林捷嘉胡文通陈曦罗奇黄志斌
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1