数据更新方法及装置制造方法及图纸

技术编号:13636330 阅读:57 留言:0更新日期:2016-09-02 23:36
本发明专利技术公开一种数据更新方法及装置,方法包括:根据特征库中存储的第一网站的搜索关键字特征,生成包括第一网站的搜索关键字特征的最小完整统一资源定位符URL;特征库用于存储多个网站的搜索关键字特征;基于最小完整URL向第一网站的服务器发送访问请求;接收服务器发送的状态码;对状态码进行分析,确认第一网站的搜索关键字特征发生变化时,对特征库中存储的第一网站的搜索关键字特征进行更新。采用本发明专利技术,能够提高检测搜索关键字特征发生变化的实时性和效率,降低人力成本。

【技术实现步骤摘要】

本专利技术涉及通信
的网络管理技术,尤其涉及一种数据更新方法及装置
技术介绍
随着互联网技术的发展,各种网络应用层出不穷,其中搜索功能是人们日常工作生活中使用最为普遍和重要的应用之一,与搜索功能紧密关联的是搜索关键字,搜索关键字是指用户在网页的搜索框中键入的关键字,参见图1示出的用户的部分搜索记录,其中“pq=zhongguo”、“q=zhongguo”、“wd=zhongguo”、“wq=zhongguo”、“q=zhongguo”就是搜索关键字,基于搜索关键字的应用范围很多,例如,网站或商家可能会通过用户的搜索记录了解用户感兴趣的需求,为用户提供更多的相关推送,或者,基于对用户的搜索记录的分析获得产品研发销售的新机会;基于用户搜索记录进行网站搜索关键词的优化等,可见,获取搜索关键字是实现基于搜索关键字的应用所必不可少的,为了获取搜索关键字,常用的方法通过比较特定的字符串或者正则表达式匹配来获取数据,这些特定的字符串和正则表达式就是搜索关键字特征。由于搜索网站技术和业务范围的变化和扩展,当网站内部架构、业务应用或对用户行为的分析等进行调整后,网站的域名及一些搜索参数可能会发生变化,就会导致搜索关键字特征也在持续地变化,此时,需要及时更新搜索关键字特征,要不然就无法有效获得搜索关键字。目前常用的检查搜索关键字特征是否发生变化的方法包括:(1)通过周期性的检查,逐个分析各个搜索网站的搜索行为是否发生变化,这种方法需要花费大量的人工成本,效率低;(2)接收到用户反馈后,分析相应的搜索网站的搜索行为是否发生变化,这种方法被
动滞后,所维护数据的实时性差。
技术实现思路
有鉴于此,本专利技术实施例期望提供一种数据更新方法及装置,能够提高检测搜索关键字特征发生变化的效率,保证特征库中所存储的多个网站的搜索关键字特征的实时性,降低维护特征库中数据所需的人力成本。为达到上述目的,本专利技术的技术方案是这样实现的:本专利技术实施例提供一种数据更新方法,所述方法包括:根据特征库中存储的第一网站的搜索关键字特征,生成包括所述第一网站的搜索关键字特征的最小完整统一资源定位符(URL,Uniform Resource Locator);所述特征库用于存储多个网站的搜索关键字特征;基于所述最小完整URL向所述第一网站的服务器发送访问请求;接收所述服务器发送的状态码;对所述状态码进行分析,确认所述第一网站的搜索关键字特征发生变化时,对所述特征库中存储的所述第一网站的搜索关键字特征进行更新。可选的,所述根据特征库中存储的第一网站的搜索关键字特征,生成包括所述第一网站的搜索关键字特征的最小完整统一资源定位符URL,包括:根据特征库中存储的第一网站的域名、路径及搜索关键字,生成包括所述第一网站的域名、路径及搜索关键字的最小完整URL。可选的,所述对所述状态码进行分析,确认所述第一网站的搜索关键字特征发生变化时,对所述特征库中存储的所述第一网站的搜索关键字特征进行更新,包括:基于预设处理条件对所述状态码进行分析,当确定所述状态码不是符合所述预设处理条件的状态码时,确认所述第一网站的搜索关键字特征发生变化;对所述特征库中存储的所述第一网站的搜索关键字特征进行更新。可选的,所述对所述状态码进行分析,确认所述第一网站的搜索关键字特征发生变化时,对所述特征库中存储的所述第一网站的搜索关键字特征进行更
新,包括:基于预设处理条件对所述状态码进行分析,当确定所述状态码是符合所述预设处理条件的状态码时,变更所述最小完整URL中的搜索关键字特征;基于变更的最小完整URL访问所述第一网站,并接收所述第一网站的服务器发送的与所述变更的最小完整URL对应的状态码;基于所述预设处理条件对所述与所述变更的最小完整URL对应的状态码进行分析;当确定所述与所述变更的最小完整URL对应的状态码不是符合所述预设处理条件的状态码时,确认所述第一网站的搜索关键字特征没有发生变化。可选的,所述对所述状态码进行分析,确认所述第一网站的搜索关键字特征发生变化时,对所述特征库中存储的所述第一网站的搜索关键字特征进行更新,包括:对所述状态码进行分析,确认所述第一网站的搜索关键字特征发生变化时,基于所述第一网站的域名访问所述第一网站,通过在所述第一网站的网页进行搜索获得搜索记录;对所述搜索记录进行分析,从所述搜索记录中提取与所述第一网站的更新的搜索关键字特征;基于所述第一网站的更新的搜索关键字特征,对所述特征库中存储的所述第一网站的搜索关键字特征进行更新。本专利技术实施例还提供一种数据更新装置,所述装置包括:生成模块,用于根据特征库中存储的第一网站的搜索关键字特征,生成包括所述第一网站的搜索关键字特征的最小完整URL;所述特征库用于存储多个网站的搜索关键字特征;发送模块,用于基于所述最小完整URL向所述第一网站的服务器发送访问请求;接收模块,用于接收所述服务器发送的状态码;更新模块,用于对所述状态码进行分析,确认所述第一网站的搜索关键字特征发生变化时,对所述特征库中存储的所述第一网站的搜索关键字特征进行
更新。可选的,所述生成模块,具体用于根据特征库中存储的第一网站的域名、路径及搜索关键字,生成包括所述第一网站的域名、路径及搜索关键字的最小完整URL。可选的,所述更新模块,具体用于:基于预设处理条件对所述状态码进行分析,当确定所述状态码不是符合所述预设处理条件的状态码时,确认所述第一网站的搜索关键字特征发生变化;对所述特征库中存储的所述第一网站的搜索关键字特征进行更新。可选的,所述更新模块,具体用于:基于预设处理条件对所述状态码进行分析,当确定所述状态码是符合所述预设处理条件的状态码时,变更所述最小完整URL中的搜索关键字特征;基于变更的最小完整URL访问所述第一网站,并接收所述第一网站的服务器发送的与所述变更的最小完整URL对应的状态码;基于所述预设处理条件对所述与所述变更的最小完整URL对应的状态码进行分析;当确定所述与所述变更的最小完整URL对应的状态码不是符合所述预设处理条件的状态码时,确认所述第一网站的搜索关键字特征没有发生变化。可选的,所述更新模块,具体用于:对所述状态码进行分析,确认所述第一网站的搜索关键字特征发生变化时,基于所述第一网站的域名访问所述第一网站,通过在所述第一网站的网页进行搜索获得搜索记录;对所述搜索记录进行分析,从所述搜索记录中提取与所述第一网站的更新的搜索关键字特征;基于所述第一网站的更新的搜索关键字特征,对所述特征库中存储的所述第一网站的搜索关键字特征进行更新。本专利技术实施例中,针对特征库中存储的任意一个网站的搜索关键字特征(以第一网站为例),基于第一网站的搜索关键字特征生成包括第一网站的搜索关键字特征的最小完整URL,该最小完整URL避免了搜索记录中复杂网址形式和
冗余信息,简单直观且易于维护,通过访问该最小完整URL得到第一网站的服务器发送的状态码,只需要分析状态码就能够确认第一网站的搜索关键字特征是否发生变化,提高了检测搜索关键字特征是否发生变化的效率,降低了维护特征库中数据所需的人力成本;本实施例可以通过自动化工具(例如脚本)实现,能够及时检测到所关注的各个网站的搜索关键字特征的变化并进行更新,保证了特征本文档来自技高网
...

【技术保护点】
一种数据更新方法,其特征在于,所述方法包括:根据特征库中存储的第一网站的搜索关键字特征,生成包括所述第一网站的搜索关键字特征的最小完整统一资源定位符URL;所述特征库用于存储多个网站的搜索关键字特征;基于所述最小完整URL向所述第一网站的服务器发送访问请求;接收所述服务器发送的状态码;对所述状态码进行分析,确认所述第一网站的搜索关键字特征发生变化时,对所述特征库中存储的所述第一网站的搜索关键字特征进行更新。

【技术特征摘要】
1.一种数据更新方法,其特征在于,所述方法包括:根据特征库中存储的第一网站的搜索关键字特征,生成包括所述第一网站的搜索关键字特征的最小完整统一资源定位符URL;所述特征库用于存储多个网站的搜索关键字特征;基于所述最小完整URL向所述第一网站的服务器发送访问请求;接收所述服务器发送的状态码;对所述状态码进行分析,确认所述第一网站的搜索关键字特征发生变化时,对所述特征库中存储的所述第一网站的搜索关键字特征进行更新。2.根据权利要求1所述的方法,其特征在于,所述根据特征库中存储的第一网站的搜索关键字特征,生成包括所述第一网站的搜索关键字特征的最小完整统一资源定位符URL,包括:根据特征库中存储的第一网站的域名、路径及搜索关键字,生成包括所述第一网站的域名、路径及搜索关键字的最小完整URL。3.根据权利要求1所述的方法,其特征在于,所述对所述状态码进行分析,确认所述第一网站的搜索关键字特征发生变化时,对所述特征库中存储的所述第一网站的搜索关键字特征进行更新,包括:基于预设处理条件对所述状态码进行分析,当确定所述状态码不是符合所述预设处理条件的状态码时,确认所述第一网站的搜索关键字特征发生变化;对所述特征库中存储的所述第一网站的搜索关键字特征进行更新。4.根据权利要求1所述的方法,其特征在于,所述对所述状态码进行分析,确认所述第一网站的搜索关键字特征发生变化时,对所述特征库中存储的所述第一网站的搜索关键字特征进行更新,包括:基于预设处理条件对所述状态码进行分析,当确定所述状态码是符合所述预设处理条件的状态码时,变更所述最小完整URL中的搜索关键字特征;基于变更的最小完整URL访问所述第一网站,并接收所述第一网站的服务
\t器发送的与所述变更的最小完整URL对应的状态码;基于所述预设处理条件对所述与所述变更的最小完整URL对应的状态码进行分析;当确定所述与所述变更的最小完整URL对应的状态码不是符合所述预设处理条件的状态码时,确认所述第一网站的搜索关键字特征没有发生变化。5.根据权利要求1所述的方法,其特征在于,所述对所述状态码进行分析,确认所述第一网站的搜索关键字特征发生变化时,对所述特征库中存储的所述第一网站的搜索关键字特征进行更新,包括:对所述状态码进行分析,确认所述第一网站的搜索关键字特征发生变化时,基于所述第一网站的域名访问所述第一网站,通过在所述第一网站的网页进行搜索获...

【专利技术属性】
技术研发人员:张磊崔咏梅
申请(专利权)人:北京网康科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1