网页信息自动录入方法及系统技术方案

技术编号:13176807 阅读:61 留言:0更新日期:2016-05-10 20:28
本发明专利技术公开了网页信息自动录入方法及系统,该方法包括:将目标网页按照网页文档结构生成XML文档;将XML文档转换成对应的数据表,并响应于用户的输入信息,将数据表与本地信息库进行映射后,生成映射字典库;提取本地信息库的数据信息并根据映射字典库的映射关系,将数据信息中的数据内容自动录入到目标网页中;判断本地信息库是否录入完毕,若是,则自动提交到远程后台。本发明专利技术可以将本地信息库的数据信息自动录入到目标网页并提交到远程后台,适用范围广、兼容性强、简单高效率且录入准确率高,可广泛应用于网页信息录入领域中。

【技术实现步骤摘要】

本专利技术涉及信息处理领域,特别是涉及一种网页信息自动录入方法及系统
技术介绍
名词解释: TextBox:文本框; RadioBox:单选框; ComboBox:选择框。 随着信息管理软件逐步由传统的C/S结构向B/S结构转变,越来越多的信息录入都 在网页上实现,这种方式的转变一方面极大减轻了软件实施方的安装、维护工作量,同时在 一定程度也降低了对客户端的设备要求,但像其他任何事物一样,有利必然有弊,其最大的 不足在于客户端信息录入方面与传统C/S结构软件相比,一是在便利化、人机友好性方面有 所欠缺;最主要的是,这种B/S结构应用软件,其数据库非常集中,应用规模广,数据库位于 最核心服务后台,一般不可能向客户端开放任何数据接口,客户端也无从窥探后台数据接 口,这样就造成客户端只有通过客户端网页唯一媒介向后台录入数据。而现实情况是,在客 户端往往已存在这样或那样的信息系统和本地数据库,有诸多现成的信息可供录入。目前 的网页信息录入方式需要手动将各种本地信息库进行录入,无法自动录入各种本地信息, 操作较为繁琐,工作效率低下,而且由于需要大量的人为输入操作,导致数据出错的概率增 大,最后导致录入的准确率较低。
技术实现思路
为了解决上述的技术问题,本专利技术的目的是提供网页信息自动录入方法。本专利技术 的另一目的是提供网页信息自动录入系统 本专利技术解决其技术问题所采用的技术方案是: 网页信息自动录入方法,包括: 51、 将目标网页按照网页文档结构生成XML文档; 52、 将XML文档转换成对应的数据表,并响应于用户的输入信息,将数据表与本地信息 库进行映射后,生成映射字典库; 53、 提取本地信息库的数据信息并根据映射字典库的映射关系,将数据信息中的数据 内容自动录入到目标网页中; 54、 判断本地信息库是否录入完毕,若是,则自动提交到远程后台。 进一步,所述步骤S1,包括: 511、 将目标网页按照网页文档分层进行剥离、解析后,形成XML标准文档格式; 512、 对目标网页的信息内容进行遍历树扫描后,获取对应信息填充到上述XML标准文 档格式中,生成XML文档。 进一步,所述XML标准文档格式包括文档名称、网页层名称、信息单元识别符、信息 单元结构类型以及信息单元数据类型。 进一步,所述步骤S2,包括: 521、 将XML文档转换成对应的数据表; 522、 响应于用户的输入信息,将数据表的网页信息单元识别符与本地信息库的本地信 息单元名称进行映射配对后,生成映射字典库。 进一步,所述步骤S22,其具体为: 分别列表显示数据表的网页信息单元识别符以及本地信息库的本地信息单元名称,并 响应于用户在两个列表上的点击操作信息,将网页信息单元识别符与本地信息单元名称进 行映射配对后,生成映射字典库。 进一步,所述步骤S3,包括: 531、 逐条提取本地信息库中的数据信息; 532、 根据映射字典库的映射关系进行匹配处理,获取与该数据信息对应的网页信息的 数据格式; 533、 根据获取的网页信息的数据格式,将数据信息中的数据内容自动录入到目标网页 中。进一步,所述步骤S33,其具体为: 判断获取的网页信息的数据格式是否为文本框格式,若是,则将数据信息中的数据内 容赋值到目标网页的对应文本框中,反之,若判断获取的网页信息的数据格式为选择框格 式,则计算出数据信息中的数据内容在该选择框中的排序,并将输入光标移动到目标网页 的对应选择框后,根据该排序模拟移动选择框的列表项,最后定格在与该数据内容匹配的 选项后,选择该选项。 本专利技术解决其技术问题所采用的另一技术方案是: 网页信息自动录入系统,包括: 网页提取模块,用于将目标网页按照网页文档结构生成XML文档; 映射模块,用于将XML文档转换成对应的数据表,并响应于用户的输入信息,将数据表 与本地信息库进行映射后,生成映射字典库; 自动录入模块,用于提取本地信息库的数据信息并根据映射字典库的映射关系,将数 据信息中的数据内容自动录入到目标网页中; 自动提交模块,用于判断本地信息库是否录入完毕,若是,则自动提交到远程后台。 进一步,所述网页提取模块包括: 第一子模块,用于将目标网页按照网页文档分层进行剥离、解析后,形成XML标准文档 格式; 第二子模块,用于对目标网页的信息内容进行遍历树扫描后,获取对应信息填充到上 述XML标准文档格式中,生成XML文档。 进一步,所述映射模块包括: 第三子模块,用于将XML文档转换成对应的数据表; 第四子模块,用于响应于用户的输入信息,将数据表的网页信息单元识别符与本地信 息库的本地信息单元名称进行映射配对后,生成映射字典库。 进一步,所述自动录入模块,包括: 第五子模块,用于逐条提取本地信息库中的数据信息; 第六子模块,用于根据映射字典库的映射关系进行匹配处理,获取与该数据信息对应 的网页信息的数据格式; 第七子模块,用于根据获取的网页信息的数据格式,将数据信息中的数据内容自动录 入到目标网页中。 本专利技术的有益效果是:本专利技术的网页信息自动录入方法,包括:将目标网页按照网 页文档结构生成XML文档;将XML文档转换成对应的数据表,并响应于用户的输入信息,将数 据表与本地信息库进行映射后,生成映射字典库;提取本地信息库的数据信息并根据映射 字典库的映射关系,将数据信息中的数据内容自动录入到目标网页中;判断本地信息库是 否录入完毕,若是,则自动提交到远程后台。本方法可以将本地信息库的数据信息自动录入 到目标网页并提交到远程后台,适用范围广、兼容性强、简单高效率且录入准确率高。 本专利技术的另一有益效果是:网页信息自动录入系统,包括:网页提取模块,用于将 目标网页按照网页文档结构生成XML文档;映射模块,用于将XML文档转换成对应的数据表, 并响应于用户的输入信息,将数据表与本地信息库进行映射后,生成映射字典库;自动录入 模块,用于提取本地信息库的数据信息并根据映射字典库的映射关系,将数据信息中的数 据内容自动录入到目标网页中;自动提交模块,用于判断本地信息库是否录入完毕,若是, 则自动提交到远程后台。本系统可以将本地信息库的数据信息自动录入到目标网页并提交 到远程后台,适用范围广、兼容性强、简单高效率且录入准确率高。。【附图说明】下面结合附图和实施例对本专利技术作进一步说明。 图1是本专利技术的网页信息自动录入方法的流程图。【具体实施方式】 参照图1,本专利技术提供了 一种网页信息自动录入方法,包括: 51、 将目标网页按照网页文档结构生成XML文档; 52、 将XML文档转换成对应的数据表,并响应于用户的输入信息,将数据表与本地信息 库进行映射后,生成映射字典库; 53、 提取本地信息库的数据信息并根据映射字典库的映射关系,将数据信息中的数据 内容自动录入到目标网页中; 54、 判断本地信息库是否录入完毕,若是,则自动提交到远程后台。 进一步作为优选的实施方式,所述步骤S1,包括: 511、 将目标网页按照网页文档分层进行剥离、解析后,形成XML标准文档格式; 512、 对目当前第1页1 2 3 本文档来自技高网...

【技术保护点】
网页信息自动录入方法,其特征在于,包括:S1、将目标网页按照网页文档结构生成XML文档;S2、将XML文档转换成对应的数据表,并响应于用户的输入信息,将数据表与本地信息库进行映射后,生成映射字典库;S3、提取本地信息库的数据信息并根据映射字典库的映射关系,将数据信息中的数据内容自动录入到目标网页中;S4、判断本地信息库是否录入完毕,若是,则自动提交到远程后台。

【技术特征摘要】

【专利技术属性】
技术研发人员:赵三多张红卫赵智多陈曲周苡蝶
申请(专利权)人:珠海威泓医疗科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1