一种纸质稿件转换为网络文本页面的方法及系统技术方案

技术编号:15639505 阅读:75 留言:0更新日期:2017-06-15 23:58
本发明专利技术提供了一种纸质稿件转换为网络文本页面的方法及系统,首先通过一扫面设备扫描纸质稿件的内容形成位图文件,并通过文字处理软件将位图文件转换为电子文本文件,再通过网页编辑器将电子文本文件读取到的文字数据进行填充到网页中形成初步的网络文本。通过一连接自动筛选设备在电子文本文件中查找筛选出需要建立超链接的字段,通过该字段的属性及像素在初步形成的网络文本中查找到该字段,并通过网页编辑器添加相应的超链接,形成带超链接的网络文本页面。本发明专利技术将纸质稿件转换为网络文本页面的效率高并且能够自动生成超链接,标题及文字能够矢量改变,方便实用。

【技术实现步骤摘要】
一种纸质稿件转换为网络文本页面的方法及系统
本专利技术涉及计算机通信
,尤其涉及一种纸质稿件转换为网络文本页面的方法及系统。
技术介绍
目前各个无纸化的办公系统,审批系统逐步普及,原来纸质化的word排版的文本。现有技术中大多采用dreamware等类似的网页编辑软件,手动的将原来的word文本转换为单纯的文本网页,修饰性差,并且需要插入超链接时比较麻烦需要人工一一添加,耗时费工效率地。或者通过扫描仪转换成word,再利用word自带的工具转成网络文本,内容复杂,不符合网页文本的要求,生成的只是静态的网页。
技术实现思路
为克服现有技术中存在的纸质稿件转变为网页页面过程复杂,效率低下的问题,本专利技术提供了一种纸质稿件转换为网络文本页面的方法及系统。一种纸质稿件转换为网络文本页面的方法,包括如下步骤:步骤一:通过图像扫描设备将纸质稿件扫描生成位图文件;步骤二:通过文字处理器将位图文件转换为文字处理器文本文件;步骤三:根据文字处理器文本文件的内容选择网页页面模板,将文字处理器文本文件中的文本元素插入网页页面模板中,生成初步的网页页面;步骤四:查找筛选出需要建立超链接的字段,通过该字段的属性及像素在初步形成的网络文本中查找到该字段,通过网页编辑器添加相应的超链接,形成带超链接的网络文本页面。进一步的,包括如下步骤:步骤一:将纸质稿件通过扫描仪转换成tif文件;步骤二:通过文字处理器的OCR文本识别功能将tif文件转成文字文本网页文本;步骤三:根据文字文本网页文本的内容选择网页页面模板,将文字文本网页文本中的文本元素插入网页页面模板中,生成初步的网页页面。进一步的,所述步骤三还包括如下步骤:预先设置网页页面模板:通过网页编辑器绘制多套模板上传至系统中;选择网页页面模板:根据文字处理器文本文件中的文本内容选择页面属性接近的网页页面模板:插入文本内容:根据文字处理器文本文件中的文本内容插入标题和文本修饰控件,所述标题根据文字处理器文本文件中的文本标题确定,所述文本修饰控件用于对网页文本文字进行修饰;生成初步的网页页面:根据网页页面模板的填充内容,通过文本修饰控件生成初步的网页页面。进一步的,所述步骤三还包括如下步骤:优化网页页面元素:根据文本编辑框的大小选择采用input元素或textarea元素控件进行填充;填充网页页面属性:根据文字处理器文本文件中的文字的字体,将字体数据信息转换为像素单位填充到网页页面中;将文字处理器文本文件中的文字转换为命名文本元素的字段。进一步的,所述命名文本元素的字段为拼音字段或者英文字段。本专利技术的另一个目的是提供一种采用所述的纸质稿件转换为网络文本页面的方法的系统,包括:扫描设备,用于扫描纸质稿件,并生成位图文件;连接模块,用于连接扫描设备、文字处理器、网页编辑模块和显示模块;文字处理器,用于将位图文件转换为文字处理器可处理的文字处理器文本文件,并且读取文字处理器文本文件内每一列的内容;网页编辑模块,用于在网页编辑过程中生成网页页面,并且根据文字处理器读取到的内容选择相应的网页页面模板进行填充属性和创建文本编辑框;显示模块,用于显示文字处理器界面和网页页面界面;筛选模块,用于在电子文本文件中查找筛选出需要建立超链接的字段;查找模块,用于根据字段的属性及像素在初步形成的网络文本中查找到该字段;网页编辑器,用于在查找到的字段中添加相应的超链接。进一步的,所述文字处理器包括:文字处理器文本转换单元,用于将扫描设备扫描到的纸质稿件的位图文件转换为文字处理器可处理的文字处理器文本文件;读取单元,用于读取文字处理器文本文件内的每一列的内容;文字处理界面生成模块,用于生成文字处理器文本转换单元和读取单元运行过程中的用户可操作界面。进一步的,所述网页编辑模块包括:文本编辑框创建单元,用于根据文字处理器读取到的文字处理器文本文件中的偶数列的内容进行创建文本编辑框;网页页面模板预生成选择单元,用于在生成网页页面之前生成网页页面模板,并且根据文字处理器读取到的文字处理器文本文件中的内容进行选择合适的网页页面模板;网页页面界面生成单元,用于生成网页编辑模块运行过程中的用户可操作界面和网页页面。进一步的,所述网页编辑模块还包括:属性填充单元,用于根据文字处理器文本文件中的文字的字体,将字体数据信息转换为像素单位填充到网页页面中;将文字处理器文本文件中的文字转换为命名文本元素的字段;网页页面优化单元,用于根据文本编辑框的大小选择采用input元素或textarea元素控件进行填充。与现有技术相比,本专利技术的有益效果是:通过一扫面设备扫描纸质稿件的内容形成位图文件,并通过文字处理软件将位图文件转换为电子文本文件,再通过网页编辑器将电子文本文件读取到的文字数据进行填充到网页中形成初步的网络文本。通过一连接自动筛选设备在电子文本文件中查找筛选出需要建立超链接的字段,通过该字段的属性及像素在初步形成的网络文本中查找到该字段,并通过网页编辑器添加相应的超链接,形成带超链接的网络文本页面,转换效率高,节省人力,耗费时间少。具体实施方式以下结合实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。实施例1本具体实施方式披露了一种纸质稿件转换为网络文本页面的方法,包括如下步骤:步骤一:通过图像扫描设备将纸质稿件扫描生成位图文件。在本专利技术的一个可行的具体实施方式中,可以通过手持式扫描仪或者立式扫描仪进行扫描纸质稿件,并且通过扫描仪连接计算机处理设备将扫描到的图像以tif位图文件的形式进行保存。扫描过程中避免可见光照射影响扫描的质量。采用手持式扫描仪进行扫描时,应当在光线较暗的空间内将纸质稿件平铺在平面上进行扫描。采用立式扫描仪进行扫描时则需要将纸质稿件置于扫面盖板下方并盖紧盖板,不漏亮光。在本专利技术的其他具体实施例中,位图文件还可以是其他格式,例如BMP文件。优选的,图像扫描设备还可以是数码相机或者手机等图像采集类设备,采用数码相机或者手机进行获取图像能够有效的避免图像扫描设备在扫描过程中的曝光问题。步骤二:通过文字处理器将位图文件转换为文字处理器文本文件。在本专利技术的一个可行的具体实施例中,可以采用OfficeDocumentImaging软件作为文字处理器,并通过其自带的OCR文本识别功能将tif文件转成文字文本网页文本。OCR文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程。在本专利技术的其他具体实施例中,还可以通过其他带有图像文字功能的文字处理器进行,例如汉王软件,WPS等。步骤三:根据文字处理器文本文件的内容选择网页页面模板,将文字处理器文本文件中的文本元素插入网页页面模板中,生成初步的网页页面。优选的,在选择网页页面模板之前预先设置多个网页页面模板,通过网页编辑器在插入网页页面时,自动生成网页页面模板供选择。可行的,在本专利技术的一个具体实施方式中,可以通过一网页页面模板服务器进行提供网页页面模板。优选的,选择网页页面模板时根据文字处理器文本文件中的文本内容选择页面属性接近的网页页面模板。具体的,是根据文字文本网页文本中表格的尺寸和样式选择最接近的网页页面模板。确定好网页页面模板之后,根据文字处理器文本文件中本文档来自技高网...

【技术保护点】
一种纸质稿件转换为网络文本页面的方法,其特征在于,包括如下步骤:步骤一:通过图像扫描设备将纸质稿件扫描生成位图文件;步骤二:通过文字处理器将位图文件转换为文字处理器文本文件;步骤三:根据文字处理器文本文件的内容选择网页页面模板,将文字处理器文本文件中的文本元素插入网页页面模板中,生成初步的网页页面;步骤四:查找筛选出需要建立超链接的字段,通过该字段的属性及像素在初步形成的网络文本中查找到该字段,通过网页编辑器添加相应的超链接,形成带超链接的网络文本页面。

【技术特征摘要】
1.一种纸质稿件转换为网络文本页面的方法,其特征在于,包括如下步骤:步骤一:通过图像扫描设备将纸质稿件扫描生成位图文件;步骤二:通过文字处理器将位图文件转换为文字处理器文本文件;步骤三:根据文字处理器文本文件的内容选择网页页面模板,将文字处理器文本文件中的文本元素插入网页页面模板中,生成初步的网页页面;步骤四:查找筛选出需要建立超链接的字段,通过该字段的属性及像素在初步形成的网络文本中查找到该字段,通过网页编辑器添加相应的超链接,形成带超链接的网络文本页面。2.根据权利要求1所述的一种纸质稿件转换为网络文本页面的方法,其特征在于,包括如下步骤:步骤一:将纸质稿件通过扫描仪转换成tif文件;步骤二:通过文字处理器的OCR文本识别功能将tif文件转成文字文本网页文本:步骤三:根据文字文本网页文本的内容选择网页页面模板,将文字文本网页文本中的文本元素插入网页页面模板中,生成初步的网页页面。3.根据权利要求1所述的一种纸质稿件转换为网络文本页面的方法,其特征在于,所述步骤三还包括如下步骤:预先设置网页页面模板:通过网页编辑器绘制多套模板上传至系统中;选择网页页面模板:根据文字处理器文本文件中的文本内容选择页面属性接近的网页页面模板;插入文本内容:根据文字处理器文本文件中的文本内容插入标题和文本修饰控件,所述标题根据文字处理器文本文件中的文本标题确定,所述文本修饰控件用于对网页文本文字进行修饰;生成初步的网页页面:根据网页页面模板的填充内容,通过文本修饰控件生成初步的网页页面。4.根据权利要求3所述的一种纸质稿件转换为网络文本页面的方法,其特征在于,所述步骤三还包括如下步骤:优化网页页面元素:根据文本编辑框的大小选择采用input元素或textarea元素控件进行填充;填充网页页面属性:根据文字处理器文本文件中的文字的字体,将字体数据信息转换为像素单位填充到网页页面中;将文字处理器文本文件中的文字转换为命名文本元素的字段。5.根据权利要求4所述的一种纸质稿件转换为网络文本页面的方法,其特征在于,所述命名文本元素的字段为拼音字段或者英文字段。6.一种采...

【专利技术属性】
技术研发人员:詹洪春
申请(专利权)人:中国医药科学杂志社有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1