The invention discloses an interface data acquisition method and system, including: S1, login account number and login password of configuration interface WEB system, login of interface WEB system by automatic artificial simulation; S2, identification of login verification code by image recognition technology; S3, verification of configuration login account number and login password and identified login verification code. When the validation is successful, enter S4; S4. According to the preset query strategy, the data of WEB interface system is acquired by network crawler technology; S5, the interface data acquired is processed by data error correction and data completion mechanism; S6, the interface data stored after processing. The invention makes the interface data acquisition simple and efficient, and saves a lot of manpower and time by using the combination of artificial simulation technology, picture recognition technology and network data acquisition technology.
【技术实现步骤摘要】
接口数据获取方法及系统
本专利技术涉及接口数据获取
,特别是涉及一种接口数据获取方法及系统。
技术介绍
现有企业间的接口数据传递,多数是提供各类业务的WEB系统。供应商的工作人员,定时/不定时的登录系统,进入功能,手输过滤条件进行数据查询,并下载数据到EXCEL文件或其他格式的文件上。下载下来的文件,再通过人工的认识进行数据整理和转换。这种方式,往往需要企业配备固定的工作人员,耗费大量的人力成本和时间成本。
技术实现思路
本专利技术针对现有技术存在的问题和不足,提供一种接口数据获取方法及系统。本专利技术是通过下述技术方案来解决上述技术问题的:本专利技术提供一种接口数据获取方法,其特点在于,其包括以下步骤:S1、配置接口WEB系统的登陆账号和登陆密码,通过自动模拟人工的方式进行接口WEB系统的登陆;S2、通过图片识别技术对登陆验证码进行识别;S3、对配置的登陆账号和登陆密码以及识别出的登陆验证码进行验证,在验证成功时,进入步骤S4;S4、根据预设的查询策略通过网络爬虫技术对接口WEB系统的数据进行获取;S5、通过数据纠错和数据补全机制对获取到的接口数据进行处理;S6、存储处理后的接口数据。较佳地,在步骤S4中,通过网络爬虫技术进行excel、cvs、html等文件或者内容获取。较佳地,在步骤S6中,通过mysql文件数据库进行接口数据的存储。本专利技术还提供一种接口数据获取系统,其特点在于,其包括配置登陆模块、识别模块、验证模块、数据获取模块、数据处理模块和数据存储模块;所述配置登陆模块用于配置接口WEB系统的登陆账号和登陆密码,通过自动模拟人工的方式进行 ...
【技术保护点】
1.一种接口数据获取方法,其特征在于,其包括以下步骤:S1、配置接口WEB系统的登陆账号和登陆密码,通过自动模拟人工的方式进行接口WEB系统的登陆;S2、通过图片识别技术对登陆验证码进行识别;S3、对配置的登陆账号和登陆密码以及识别出的登陆验证码进行验证,在验证成功时,进入步骤S4;S4、根据预设的查询策略通过网络爬虫技术对接口WEB系统的数据进行获取;S5、通过数据纠错和数据补全机制对获取到的接口数据进行处理;S6、存储处理后的接口数据。
【技术特征摘要】
1.一种接口数据获取方法,其特征在于,其包括以下步骤:S1、配置接口WEB系统的登陆账号和登陆密码,通过自动模拟人工的方式进行接口WEB系统的登陆;S2、通过图片识别技术对登陆验证码进行识别;S3、对配置的登陆账号和登陆密码以及识别出的登陆验证码进行验证,在验证成功时,进入步骤S4;S4、根据预设的查询策略通过网络爬虫技术对接口WEB系统的数据进行获取;S5、通过数据纠错和数据补全机制对获取到的接口数据进行处理;S6、存储处理后的接口数据。2.如权利要求1所述的接口数据获取方法,其特征在于,在步骤S4中,通过网络爬虫技术进行excel、cvs、html等文件或者内容获取。3.如权利要求1所述的接口数据获取方法,其特征在于,在步骤S6中,通过mysql文件数据库进行接口数据的存储。4.一种接口数据获取系统,其特征在于,其包括配置登陆模块、识别模块、验证模块、...
【专利技术属性】
技术研发人员:王郁,
申请(专利权)人:上海因致信息科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。