一种关键词库更新方法及装置制造方法及图纸

技术编号:21891721 阅读:25 留言:0更新日期:2019-08-17 14:26
本申请提供了一种关键词库更新方法及装置,其中,该关键词库更新方法包括获取目标监测数据,并从目标监测数据中提取出目标用户代理UA的信息;从目标UA的信息中提取目标UA的类型对应的目标关键字;判断目标关键字中是否存在预设字符;若存在,则确定目标监测数据为网页WEB流量数据,并利用目标关键字更新WEB关键字库;若不存在,则确定目标监测数据为应用程序APP流量数据,并利用目标关键字更新APP关键字库。本申请利用目标监测数据中目标UA的信息,来确定该目标监测数据为WEB流量数据,还是为APP流量数据,能够自动更新WEB关键字库和APP关键字库,减少人工干预,进而提高识别目标监测数据为WEB流量数据或APP流量数据的准确率。

A Method and Device for Keyword Library Renewal

【技术实现步骤摘要】
一种关键词库更新方法及装置
本申请涉及数据处理
,具体而言,涉及一种关键词库更新方法及装置。
技术介绍
用户通过服务平台推送的资讯,可以获取大量的信息,进而便利和丰富自己的生活。服务平台为了更好的服务用户,根据用户浏览资讯的方式,来制定为该用户推送资讯的策略,使得用户体验度高。通常,监测平台的服务器接收到用户浏览资讯后产生的监测数据(即资讯的流量信息),将监测数据与预先建立的网页WEB关键字库中的关键字、应用程序APP关键字库中的关键字进行匹配,进而确定该监测数据的来源类型(即为WEB流量数据或为APP流量数据),以使得服务平台可以根据该监测数据的来源类型制定推送资讯的策略。但是,上述WEB关键字库和APP关键字库中的关键字全部为人为收集,难以根据新的关键字更新WEB关键字库和APP关键字库,耗时耗力,并且使得确定该监测数据的来源类型时,准确率低。
技术实现思路
有鉴于此,本申请实施例的目的在于提供一种关键词库更新方法及装置,能够自动更新WEB关键字库和APP关键字库,减少人工干预,进而提高识别目标监测数据为WEB流量数据或APP流量数据的准确率。第一方面,本申请实施例提供了一种关键词库更新方法,其中,包括:获取目标监测数据,并从所述目标监测数据中提取出目标用户代理UA的信息;从所述目标UA的信息中提取所述目标UA的类型对应的目标关键字;判断所述目标关键字中是否存在预设字符;若存在,则确定所述目标监测数据为网页WEB流量数据,并利用所述目标关键字更新WEB关键字库;若不存在,则确定所述目标监测数据为应用程序APP流量数据,并利用所述目标关键字更新APP关键字库。结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,还包括:从所述目标UA的信息中查找是否存在WEB关键字库中的任一关键字;若存在,则确定所述目标监测数据为WEB流量数据。结合第一方面,本申请实施例提供了第一方面的第二种可能的实施方式,其中,所述从所述目标UA的信息中提取所述目标UA的类型对应的目标关键字,包括:将所述目标UA的信息包括的字符串转换成小写形式;根据正则表达式对小写形式的字符串进行切割,得到多个第一候选关键字;按照空格对每个第一候选关键字进行切割,得到多个第二候选关键字;从所述多个第二候选关键字中,删除与所述目标UA的类型特征无关的候选关键字之后,得到所述目标UA的类型对应的目标关键字。结合第一方面,本申请实施例提供了第一方面的第三种可能的实施方式,其中,还包括:将更新后的WEB关键字库展示给后台工作人员,以使所述后台工作人员进行校验。第二方面,本申请实施例还提供了一种关键词库更新装置,其中,包括:获取模块,用于获取目标监测数据,并从所述目标监测数据中提取出目标用户代理UA的信息;提取模块,用于从所述目标UA的信息中提取所述目标UA的类型对应的目标关键字;判断模块,用于判断所述目标关键字中是否存在预设字符;第一更新模块,用于若存在,则确定所述目标监测数据为网页WEB流量数据,并利用所述目标关键字更新WEB关键字库;第二更新模块,用于若不存在,则确定所述目标监测数据为应用程序APP流量数据,并利用所述目标关键字更新APP关键字库。结合第二方面,本申请实施例提供了第二方面的第一种可能的实施方式,其中,还包括:查找模块,用于从所述目标UA的信息中查找是否存在WEB关键字库中的任一关键字;若存在,则确定所述目标监测数据为WEB流量数据。结合第二方面,本申请实施例提供了第二方面的第二种可能的实施方式,其中,包括:所述提取模块,具体用于将所述目标UA的信息包括的字符串转换成小写形式;根据正则表达式对小写形式的字符串进行切割,得到多个第一候选关键字;按照空格对每个第一候选关键字进行切割,得到多个第二候选关键字;从所述多个第二候选关键字中,删除与所述目标UA的类型特征无关的候选关键字之后,得到所述目标UA的类型对应的目标关键字。结合第二方面,本申请实施例提供了第二方面的第三种可能的实施方式,其中,还包括:校验模块,用于将更新后的WEB关键字库展示给后台工作人员,以使所述后台工作人员进行校验。第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面的第一种可能的实施方式至第一方面的的第三种可能的实施方式中任一种可能的实施方式中的步骤。第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面的第一种可能的实施方式至第一方面的的第三种可能的实施方式中任一种可能的实施方式中的步骤。本申请实施例提供的一种关键词库更新方法及装置,其中,该关键词库更新方法包括获取目标监测数据,并从目标监测数据中提取出目标用户代理UA的信息;从目标UA的信息中提取目标UA对应的目标关键字;判断目标关键字中是否存在预设字符;若存在,则确定目标监测数据为WEB流量数据,并利用该目标关键字更新WEB关键字库;若不存在,则确定目标监测数据为应用程序APP流量数据。本申请实施例利用目标监测数据中目标UA的信息,来确定该目标监测数据为WEB流量数据,还是为APP流量数据,能够自动更新WEB关键字库和APP关键字库,减少人工干预,进而提高识别目标监测数据为WEB流量数据或APP流量数据的准确率。为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1示出了本申请实施例所提供的一种关键词库更新方法的流程图;图2示出了本申请实施例所提供的另一种关键词库更新方法的流程图;图3示出了本申请实施例所提供的一种关键词库更新装置的结构示意图;图4示出了本申请实施例所提供的电子设备的结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。目前,监测平台的服务器接收到用户浏览资讯后产生的监测数据(即资讯的流量信息),将监测数据与预先建立的网页WEB关键字库中的关键字、应用程序APP关键字库中的关键字进行匹配,进而确定该监测数据的来源类型(即为WEB流量数据或为APP流量数据)。但是,WEB关键字库和APP关键字库中的关键字全部为人为收集,难以根据本文档来自技高网...

【技术保护点】
1.一种关键词库更新方法,其特征在于,包括:获取目标监测数据,并从所述目标监测数据中提取出目标用户代理UA的信息;从所述目标UA的信息中提取所述目标UA的类型对应的目标关键字;判断所述目标关键字中是否存在预设字符;若存在,则确定所述目标监测数据为网页WEB流量数据,并利用所述目标关键字更新WEB关键字库;若不存在,则确定所述目标监测数据为应用程序APP流量数据,并利用所述目标关键字更新APP关键字库。

【技术特征摘要】
1.一种关键词库更新方法,其特征在于,包括:获取目标监测数据,并从所述目标监测数据中提取出目标用户代理UA的信息;从所述目标UA的信息中提取所述目标UA的类型对应的目标关键字;判断所述目标关键字中是否存在预设字符;若存在,则确定所述目标监测数据为网页WEB流量数据,并利用所述目标关键字更新WEB关键字库;若不存在,则确定所述目标监测数据为应用程序APP流量数据,并利用所述目标关键字更新APP关键字库。2.根据权利要求1所述的关键词库更新方法,其特征在于,还包括:从所述目标UA的信息中查找是否存在WEB关键字库中的任一关键字;若存在,则确定所述目标监测数据为WEB流量数据。3.根据权利要求1所述的关键词库更新方法,其特征在于,所述从所述目标UA的信息中提取所述目标UA的类型对应的目标关键字,包括:将所述目标UA的信息包括的字符串转换成小写形式;根据正则表达式对小写形式的字符串进行切割,得到多个第一候选关键字;按照空格对每个第一候选关键字进行切割,得到多个第二候选关键字;从所述多个第二候选关键字中,删除与所述目标UA的类型特征无关的候选关键字之后,得到所述目标UA的类型对应的目标关键字。4.根据权利要求1所述的关键词库更新方法,其特征在于,还包括:将更新后的WEB关键字库展示给后台工作人员,以使所述后台工作人员进行校验。5.一种关键词库更新装置,其特征在于,包括:获取模块,用于获取目标监测数据,并从所述目标监测数据中提取出目标用户代理UA的信息;提取模块,用于从所述目标UA的信息中提取所述目标UA的类型对应的目标关键字;判断模块,用于判断所述目标关键字中是...

【专利技术属性】
技术研发人员:何晶刘杨
申请(专利权)人:秒针信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1