【技术实现步骤摘要】
一种文档转网页格式的方法
[0001]本专利技术涉及一种文档转网页格式的方法。
技术介绍
[0002]目前市场上有很多Pdf\word文档解析识别工具,只能识别文档的标题、文档的内容,而无法将Pdf\word文档转化成完整地试题,无法满足需求日益多元化的教育行业发展,为了满足不断变化的业务需求,针对特定的使用场景,我们提出了解决方案。
技术实现思路
[0003]本专利技术旨在至少解决现有技术中存在的技术问题之一。为此,本专利技术提出一种文档转网页格式的方法。
[0004]本专利技术的一种实施例解决其技术问题所采用的技术方案是:一种文档转网页格式的方法,包括:
[0005]步骤1、选取待转换文件并判断文件名的后缀,如果后缀是.Pdf,则使用PDF文件解析控件进行解析,如果后缀是.doc\.docx,则使用DOC文件解析控件进行解析;
[0006]步骤2、使用Document.Sections获取Body,根据Body获取DocumentObjectCollection集合,循环集合里的对 ...
【技术保护点】
【技术特征摘要】
1.一种文档转网页格式的方法,其特征在于,包括:步骤1、选取待转换文件并判断文件名的后缀,如果后缀是.Pdf,则使用PDF文件解析控件进行解析,如果后缀是.doc\.docx,则使用DOC文件解析控件进行解析;步骤2、使用Document.Sections获取Body,根据Body获取DocumentObjectCollection集合,循环集合里的对象;步骤3、如果对象类型为段落,则进入步骤4;如果对象类型为Table,则进入步骤5;步骤4、根据段落文本的关键字来构建html试题架构;步骤4.1、循环段落对象;步骤4.11、如果段落对象为图片,将其转换成字节流,并上传至文件服务器,并获得图片在服务器的地址,将服务器地址写进<img>html标签;步骤4.12、如果段落对象为TextRange,根据对象UnderlineStyle属性,判断文本是否存在下划线、加粗、斜体风格;根据对象的SubSuperScript属性,判断文本是否上标、下标、正常显示;根据上述属性正确拼写对应的<span&am...
【专利技术属性】
技术研发人员:何洵,
申请(专利权)人:珠海趣印科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。