The invention discloses an information acquisition method of HTML page, which comprises the following steps: S1. using BHO or npapi plug-in plug-in listening listening mode, listening to \the submission form, and obtain the information form elements in the event processing; information element S2.BHO plugin or npapi plugin will gain access to the encrypted encryption processing; S3. the information transmission to the server. This method does not need to make any changes in the web server, only need to install the plug-in on the client, you can access the information form, and send to the server for statistical information extraction; low cost, can greatly improve the speed and accuracy of information input.
【技术实现步骤摘要】
一种html页面的信息采集方法
本专利技术属于信息与数据处理领域,特别地涉及一种html页面的信息采集方法。
技术介绍
随着信息化程度不断加深,企业对情报信息化集成的渴求也日益强烈;互联网持续增长的信息资源蕴含了巨量的具有商业价值的信息,成为重要的情报信息源头。目前,html页面的信息采集的相关产品为数不多,且产品对用户本身的基础信息设施要求高,实施周期长,系统建设和维护成本高,主要客户是超大型企业和政府,普通企业无力承受。目前在客户机、服务端(C/S)模型下,服务端可以直接获取客户机上提交的表单。但对于第三方应用开发,由于服务端是不可再更改的,这时就无法直接进行html表单统计。
技术实现思路
为解决上述问题,本专利技术的目的在于提供一种无需更改服务端就能实现html页面信息采集的方法。为实现上述目的,本专利技术的技术方案为:一种html页面的信息采集方法,包括以下步骤:S1.采用BHO插件监听方式或npapi插件监听方式,监听网页表单提交事件,并在事件处理中获取表单元素信息;S2.BHO插件或npapi插件将获取到的元素信息进行加密处理;S3.将加密处理过的信息,传输到服务器端。进一步的,在S1中,对于IE内核的浏览器采用BHO插件监听方式;对于非IE内核的浏览器采用npapi插件监听方式。进一步的,BHO插件监听方式包括以下步骤:S111.BHO插件监听浏览器的html文档加载完毕事件;S112.在html文档加载完毕事件中,获取引发鼠标点击事件的对应元素;S113.通过该元素的com接口,获取元素信息;S114.将获取到的元素信息保存在BHO插件中,准 ...
【技术保护点】
一种html页面的信息采集方法,其特征在于,包括以下步骤:S1.采用BHO插件监听方式或npapi插件监听方式,监听网页表单提交事件,并在事件处理中获取表单元素信息;S2.BHO插件或npapi插件将获取到的元素信息进行加密处理;S3.将加密处理过的信息,传输到服务器端。
【技术特征摘要】
1.一种html页面的信息采集方法,其特征在于,包括以下步骤:S1.采用BHO插件监听方式或npapi插件监听方式,监听网页表单提交事件,并在事件处理中获取表单元素信息;S2.BHO插件或npapi插件将获取到的元素信息进行加密处理;S3.将加密处理过的信息,传输到服务器端。2.如权利要求1所述的html页面的信息采集方法,其特征在于,在S1中,对于IE内核的浏览器采用BHO插件监听方式。3.如权利要求1所述的html页面的信息采集方法,其特征在于,在S1中,对于非IE内核的浏览器采用npapi插件监听方式。4.如权利要求2所述的html页面的信息采集方法,其特征在于,BHO插件监听方式包括以下步骤:S111.BHO插件监听浏览器的html文档加载完毕事件;S112.在html文档加载完毕事件中,获取引发鼠标点击事件的对应元素;S113.通过该元素的com接口,获取元素信息;S114.将获取到的元素信息保存在BHO插件中,准备发往服务器。5.如权利要求4所述的html页面的信息采集方法,其特征在于,S112中,若引发鼠标点击事件的是表单提交按钮,对应多个元素,则选取当前html文档需要的对应元素。6.如权利要求3所...
【专利技术属性】
技术研发人员:杨伟丽,
申请(专利权)人:杭州云灵科技有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。