一种将Markdown文档转换为PDF文档的方法、装置制造方法及图纸

技术编号:23485087 阅读:31 留言:0更新日期:2020-03-10 12:39
本发明专利技术实施例提供了一种将Markdown文档转换为PDF文档的方法,当需要将Markdown文档转换成PDF文档时,可以获取待转换文档,待转换文档为Markdown文档,并从待转换文档中,提取各文档内容单元,以及每个文档内容单元的语法描述信息,其中,一个文档内容单元为语法描述信息相同的一组文档内容,一个文档内容单元的语法描述信息用于表示该文档内容单元的显示格式,以及针对每个文档内容单元,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容,并将从待转换文档中提取的各文档内容单元的转换内容,写入空白PDF文档中,得到转换后的PDF文档,实现了简化Markdown文档转换成PDF文档的过程,提高了转换效率。

A method and device for converting markdown document to PDF document

【技术实现步骤摘要】
一种将Markdown文档转换为PDF文档的方法、装置
本专利技术涉及文档处理
,特别是涉及一种将Markdown文档转换为PDF文档的方法、装置及电子设备。
技术介绍
Markdown是目前互联网上最流行的写作语言,它使用一些简单的符号来标记文本格式,因其简洁的语法、格式以及强大的软件支持,而深受喜爱。而PDF(可移植文档格式,PortableDocumentFormat)文档则是一种电子文件格式,不管是在Windows操作系统、Unix操作系统还是MacOS操作系统中都是通用的。这一特点使得PDF成为在因特网上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件在开始使用PDF格式文件。为了使Markdown文档转换成PDF文档,现有技术通常先将Markdown文档转换成HTML(超文本标记语言,HyperTextMarkupLanguage)文档或Word文档,然后再将HTML文档或者Word文档转换成PDF文档。专利技术人在实现本专利技术的过程中发现,现有技术至少存在如下问题:为了使Markdown文档转换成PDF文档,需先将Markdown文档转换成HTML文档或Word文档,然后再由HTML文档或者Word文档转换成PDF文档,转换过程繁琐,转换效率较低。
技术实现思路
本专利技术实施例的目的在于提供一种将Markdown文档转换为PDF文档的方法,以实现简化Markdown文档转换成PDF文档的过程,提高转换效率。具体技术方案如下:本专利技术实施例提供一种将Markdown文档转换为PDF文档的方法,所述方法包括:获取待转换文档,所述待转换文档为Markdown文档;从所述待转换文档中,提取各文档内容单元,以及每个文档内容单元的语法描述信息,其中,一个文档内容单元为对应同一个语法描述信息的一组文档内容,一个文档内容单元的语法描述信息用于表示该文档内容单元的显示格式;针对每个文档内容单元,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容;将从所述待转换文档中提取的各文档内容单元的转换内容,写入空白PDF文档中,得到转换后的PDF文档。进一步的,所述从所述待转换文档中,提取各文档内容单元,以及每个文档内容单元的语法描述信息,包括:按照预设的Markdown语法规则,从所述待转换文档中提取表示语法描述信息的语法内容单元,一个语法内容单元表示一个语法描述信息;针对每个语法描述信息,确定该语法描述信息所表示的文档内容范围;提取该文档内容范围所包括的文档内容,作为该语法描述信息对应的文档内容单元。进一步的,所述按照预设的Markdown语法规则,从所述待转换文档中提取表示语法描述信息的语法内容单元,包括:按照预设的Markdown语法规则,确定所述待转换文档中的字符是否属于语法内容;将属于语法内容且用于表示一个语法描述信息的一组字符,确定为一个语法内容单元,并提取该语法内容单元。进一步的,所述确定该语法描述信息所表示的文档内容范围,包括:确定该语法描述信息对应的语法内容单元所包含的字符之间的范围,为该语法描述信息所表示的文档内容范围;或者确定该语法描述信息对应的语法内容单元至下一个语法内容单元之间之间的范围,为该语法描述信息所表示的文档内容范围。进一步的,所述按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容,包括:当该文档内容单元的语法描述信息表示该文档内容单元为文本类型时,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的文本内容,得到该文档内容单元的转换内容;或者当该文档内容单元的语法描述信息表示该文档内容单元为图像类型时,从该文档内容单元所表示的地址获取图像,按照该文档内容单元的语法描述信息所表示的显示格式,将该图像转换为该显示格式的转换后图像,作为该文档内容单元的转化内容。本专利技术实施例还提供一种将Markdown文档转换为PDF文档的装置,所述装置包括:文档获取模块,用于获取待转换文档,所述待转换文档为Markdown文档;文档内容提取模块,用于从所述待转换文档中,提取各文档内容单元;语法信息提取模块,用于从所述待转换文档中,提取每个文档内容单元的语法描述信息,其中,一个文档内容单元为对应同一个语法描述信息的一组文档内容,一个文档内容单元的语法描述信息用于表示该文档内容单元的显示格式;内容转换模块,用于针对每个文档内容单元,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容;内容写入模块,用于将从所述待转换文档中提取的各文档内容单元的转换内容,写入空白PDF文档中,得到转换后的PDF文档。进一步的,所述语法信息提取模块,具体用于按照预设的Markdown语法规则,从所述待转换文档中提取表示语法描述信息的语法内容单元,一个语法内容单元表示一个语法描述信息;所述文档内容提取模块,具体用于针对每个语法描述信息,确定该语法描述信息所表示的文档内容范围;并提取该文档内容范围所包括的文档内容,作为该语法描述信息对应的文档内容单元。进一步的,所述语法信息提取模块,具体用于按照预设的Markdown语法规则,确定所述待转换文档中的字符是否属于语法内容,以及将属于语法内容且用于表示一个语法描述信息的一组字符,确定为一个语法内容单元,并提取该语法内容单元。进一步的,所述文档内容提取模块,具体用于确定该语法描述信息对应的语法内容单元所包含的字符之间的范围,为该语法描述信息所表示的文档内容范围;或者,确定该语法描述信息对应的语法内容单元至下一个语法内容单元之间之间的范围,为该语法描述信息所表示的文档内容范围。进一步的,所述内容转换模块,具体用于当该文档内容单元的语法描述信息表示该文档内容单元为文本类型时,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的文本内容,得到该文档内容单元的转换内容;或者当该文档内容单元的语法描述信息表示该文档内容单元为图像类型时,从该文档内容单元所表示的地址获取图像,按照该文档内容单元的语法描述信息所表示的显示格式,将该图像转换为该显示格式的转换后图像,作为该文档内容单元的转换内容。本专利技术实施例还提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现实现上述任一将Markdown文档转换为PDF文档的方法的步骤。本专利技术实施还提供了一种计算机可读存储介质,所述计算机可本文档来自技高网...

【技术保护点】
1.一种将Markdown文档转换为PDF文档的方法,其特征在于,所述方法包括:/n获取待转换文档,所述待转换文档为Markdown文档;/n从所述待转换文档中,提取各文档内容单元,以及每个文档内容单元的语法描述信息,其中,一个文档内容单元为对应同一个语法描述信息的一组文档内容,一个文档内容单元的语法描述信息用于表示该文档内容单元的显示格式;/n针对每个文档内容单元,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容;/n将从所述待转换文档中提取的各文档内容单元的转换内容,写入空白PDF文档中,得到转换后的PDF文档。/n

【技术特征摘要】
1.一种将Markdown文档转换为PDF文档的方法,其特征在于,所述方法包括:
获取待转换文档,所述待转换文档为Markdown文档;
从所述待转换文档中,提取各文档内容单元,以及每个文档内容单元的语法描述信息,其中,一个文档内容单元为对应同一个语法描述信息的一组文档内容,一个文档内容单元的语法描述信息用于表示该文档内容单元的显示格式;
针对每个文档内容单元,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容;
将从所述待转换文档中提取的各文档内容单元的转换内容,写入空白PDF文档中,得到转换后的PDF文档。


2.根据权利要求1所述的方法,其特征在于,所述从所述待转换文档中,提取各文档内容单元,以及每个文档内容单元的语法描述信息,包括:
按照预设的Markdown语法规则,从所述待转换文档中提取表示语法描述信息的语法内容单元,一个语法内容单元表示一个语法描述信息;
针对每个语法描述信息,确定该语法描述信息所表示的文档内容范围;
提取该文档内容范围所包括的文档内容,作为该语法描述信息对应的文档内容单元。


3.根据权利要求2所述的方法,其特征在于,所述按照预设的Markdown语法规则,从所述待转换文档中提取表示语法描述信息的语法内容单元,包括:
按照预设的Markdown语法规则,确定所述待转换文档中的字符是否属于语法内容;
将属于语法内容且用于表示一个语法描述信息的一组字符,确定为一个语法内容单元,并提取该语法内容单元。


4.根据权利要求3所述的方法,其特征在于,所述确定该语法描述信息所表示的文档内容范围,包括:
确定该语法描述信息对应的语法内容单元所包含的字符之间的范围,为该语法描述信息所表示的文档内容范围;或者
确定该语法描述信息对应的语法内容单元至下一个语法内容单元之间的范围,为该语法描述信息所表示的文档内容范围。


5.根据权利要求1所述的方法,其特征在于,所述按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的内容,得到该文档内容单元的转换内容,包括:
当该文档内容单元的语法描述信息表示该文档内容单元为文本类型时,按照该文档内容单元的语法描述信息所表示的显示格式,将该文档内容单元转换为该显示格式的文本内容,得到该文档内容单元的转换内容;或者
当该文档内容单元的语法描述信息表示该文档内容单元为图像类型时,从该文档内容单元所表示的地址获取图像,按照该文档内容单元的语法描述信息所表示的显示格式,将该图像转换为该显示格式的转换后图像,作为该文档内容单元的转换内容。


6.一种将Markdown文档转换为PDF文档的装置,其...

【专利技术属性】
技术研发人员:邓斌
申请(专利权)人:珠海金山办公软件有限公司北京金山办公软件股份有限公司广州金山移动科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1