一种基于多维标识的数据采集方法技术

技术编号:13244257 阅读:65 留言:0更新日期:2016-05-15 04:41
本发明专利技术公开了一种基于多维标识的数据采集方法,包括:(1)、登陆认证;(2)、访问业务服务器并拉取最新设置;(3)、填写源数据;(4)、对基础标识进行多维标识采集;(5)、对已看订单型号进行多维标识采集;(6)、对时间标识进行多维标识采集;(7)、对意向订单型号进行多维标识采集;用户选择至少1个意向订单型号,然后将基础标识、时间标识、已看订单型号标识、意向订单型号标识发送到数据采集服务器,完成源数据采集。该方法改变了传统网页数据采集的采集模式,由广泛采集转变为区域注册用户采集,由网页采集转变为移动APP注册认证用户的采集,避免了源数据的重复采集,让源数据的更加精准。

【技术实现步骤摘要】

本专利技术涉及一种数据采集
,尤其涉及。
技术介绍
传统网络环境下,汽车、房地产等特殊行业客户的采集捕获数据变化的方式比较常见的是垂直门户网上采集和线下采集,这里主要将网络环境的门户网站线上采集,垂直门户网站通过网上团购、会员用户注册信息中抓取客户基本信息。通过数据采集技术,网站将通过活动链接方式,将用户导流到团购或活动申请界面,用户通过注册报名的方式,按网页输入框输入姓名、联系电话、预计订单时间等,通过网页对应入口,用户基本信息采集完成后(简称源数据),源数据通过采集、上传的方式来处理数据流,其工作原理是:客户在网站填写一份源数据,所在网页服务器负责收集并上传数据,并将描述客户数据源的元数据即主题(共享数据模型)发布到一个或多个公共的信息目录服务器,使有需求的一个或多个需求者可从信息目录服务器获得主题信息、基于主题通过组合裁剪等手段定向信息,并将客户提交给平台专题数据库。但是,网上数据采集技术存在如下问题: (一)、网站采集方式需要进入门户网站,找到活动入口,在通过活动宣传网页,选择申请报名,再进入采集填写入口,且采集填写入口的数据为基本信息,无法实现精准采集和后期的精准分发; (二)使用采集入口触发器方式捕获数据变化主要是基础信息,维度比较单一且精准度不高,同时因维度单一,网站需要为每个源数据进行二次筛选和加工,采集效率很低、精准度低。
技术实现思路
本专利技术的目的是提供,该方法改变了传统网页数据采集的采集模式,由广泛采集转变为区域注册用户采集,由网页采集转变为移动APP注册认证用户的采集,避免了源数据的重复采集,让源数据的更加精准。本专利技术实现其专利技术目的,所采用的技术方案是: ,包括以下步骤: (I)、登陆认证 在客户端上输入用户信息,用户管理服务器对用户信息进行认证判断,若认证注册,则成功登陆,然后进行下一步; (2 )、访问业务服务器并拉取最新设置 成功登陆后,用户管理服务器生成用户token并返回给客户端,同时用户访问业务服务器,并向业务服务器拉取最新设置,然后返回客户端进行下一步; (3)、填写源数据用户在最新设置中填写源数据,包括基础标识、选择至少一个已看订单型号、选择至少一个意向订单型号、时间标识,并将其发送到数据采集服务器;当用户调用源数据采集时,数据采集服务器通过与用户管理服务器关联,启动数据采集服务器,然后进行下一步; (4)、对基础标识进行多维标识采集 通过遍历N日内的历史采集数据,N由数据采集服务器设置,判断源数据中基础标识是否存在;若基础标识存在,则进行下一步; (5)、对已看订单型号进行多维标识采集 用户选择已看订单型号,将已看订单型号作为意向订单型号的比对标识,当意向订单型号标识与已看订单型号标识不重复、不冲突时,进行下一步; (6)、对时间标识进行多维标识采集 通过调用时钟服务,选择源数据的时间标识,对源数据进行年、月、日、时刻的时间标识;然后进行下一步; (7)、对意向订单型号进行多维标识采集 用户选择至少I个意向订单型号,然后将基础标识、时间标识、已看订单型号标识、意向订单型号标识发送到数据采集服务器,完成源数据采集。进一步地,上述步骤(I)用户管理服务器对用户信息进行认证判断,还包括:若无法登陆,则用户未注册,用户管理服务器收到未注册提示。进一步地,上述步骤(4)对基础标识进行多维标识采集,还包括:通过遍历N日内的历史采集数据,NS数据采集服务器设置,判断源数据中基础标识是否存在;若不存在则提示客户端不可上传分享,不将其发送到数据采集服务器。进一步地,上述步骤(5)对已看订单型号进行多维标识采集,还包括:用户选择已看订单型号,将已看订单型号作为意向订单型号的比对标识,当意向订单型号标识与已看订单型号标识重复、冲突时,无法完成源数据采集。与现有技术相比,本专利技术的有益效果是: (一)、本专利技术改变了传统网页数据采集的采集模式,由广泛采集转变为区域注册用户采集,由网页采集转变为移动APP注册认证用户的采集。(二)、本专利技术用户上传的客户源数据,发生在用户与客户就订单意向进行现场沟通、追踪和深度沟通后的时间段,客户意向行为已进入订单比价实施阶段。(三)、本专利技术无论注册用户何时进行源数据采集,平台得到的都是具有多维标识的精准数据,同时配合更新标识位策略、优先上传机制、维度标识数据剔重策略,避免了源数据的重复采集,让源数据的更加精准。下面结合【具体实施方式】对本专利技术作进一步的详细说明。【具体实施方式】实施例本例的数据采集方法是这样实现的: 1、登陆认证 移动APP用户输入手机号码与密码,用户管理服务器判断经纪人状态两种状态:已注册、未注册;未注册,则无法登陆,经纪人收到未激活提示。若已注册:成功登陆,用户管理服务器生成用户唯一token(记号)并返回给手机端,然后访问业务服务器,向服务器拉取最新设置(包括:分享奖励值、可分享源数据、每一条源数据可选择品牌数、今日已分享数、用户关联品牌、城市等基本信息),再返回手机APP端。2、源数据采集调用: 移动APP认证通过的用户填写源数据:包括基础标识(姓名、电话)、选择已看订单型号(必选I个)、选择意向订单型号(必选I个,当前第1页1 2 本文档来自技高网...

【技术保护点】
一种基于多维标识的数据采集方法,包括以下步骤:(1)、登陆认证在客户端上输入用户信息,用户管理服务器对用户信息进行认证判断,若认证注册,则成功登陆,然后进行下一步;(2)、访问业务服务器并拉取最新设置成功登陆后,用户管理服务器生成用户token并返回给客户端,然后用户访问业务服务器,并向业务服务器拉取最新设置,然后进行下一步;(3)、填写源数据用户在最新设置中填写源数据,包括基础标识、选择至少一个已看订单型号、选择至少一个意向订单型号、时间标识,并将其发送到数据采集服务器;当用户调用源数据采集时,数据采集服务器通过与用户管理服务器关联,启动数据采集服务器,然后进行下一步;(4)、对基础标识进行多维标识采集通过遍历N日内的历史采集数据,N由数据采集服务器设置,判断源数据中基础标识是否存在;若基础标识存在,则进行下一步;(5)、对已看订单型号进行多维标识采集用户选择已看订单型号,将已看订单型号作为意向订单型号的比对标识,当意向订单型号标识与已看订单型号标识不重复、不冲突时,进行下一步;(6)、对时间标识进行多维标识采集通过调用时钟服务,选择源数据的时间标识,对源数据进行年、月、日、时刻的时间标识;然后进行下一步;(7)、对意向订单型号进行多维标识采集用户选择至少一个意向订单型号,然后将基础标识、已看订单型号标识、时间标识、意向订单型号标识发送到数据采集服务器,完成源数据采集。...

【技术特征摘要】

【专利技术属性】
技术研发人员:缪勇
申请(专利权)人:成都反思科技有限公司
类型:发明
国别省市:四川;51

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1