【技术实现步骤摘要】
关键字的还原方法及装置
本专利技术涉及计算机
,具体而言,涉及关键字的还原方法及装置。
技术介绍
目前,对于用户的网络访问行为的获取和还原多采用DPI服务和ETL服务器实现,即采用DPI服务器获取用户的网络访问数据,然后通过ETL服务器对用户的网络访问数据进行还原,从而可以获知用户的行为。用户的网络访问行为包括在搜索网站中搜索的关键字,对于还原用户在搜索网站中搜索了什么关键字,现有的方法是通过查找用户的网络访问数据中的关键字特征标识,来确定哪些字段是用户检索的关键字,然后将相应的字段还原为具体的关键字。但是,由于不同的搜索网站,其产生的关键字特征标识是不同的,现有的关键字还原方法只能按照预先设置好的规则还原某一个特定的搜索网站的关键字,普适性低。
技术实现思路
本专利技术的目的在于提供一种关键字的还原方法和装置,以解决上述的问题。在本专利技术的实施例中提供了一种关键字的还原方法,该方法包括:预先建立关键字特征标识库;关键字特征标识库中包含与多个预设的搜索网站一一对应的参考关键字特征标识,以及与参考关键字特征标识一一对应的字段提取规则;若用户的网络 ...
【技术保护点】
一种关键字的还原方法,其特征在于,包括:预先建立关键字特征标识库;所述关键字特征标识库中包含与多个预设的搜索网站一一对应的参考关键字特征标识,以及与所述参考关键字特征标识一一对应的字段提取规则;若用户的网络访问数据中包含与所述关键字特征标识库中的参考关键字特征标识相同的标识字符串,则按照与所述标识字符串相同的参考关键字特征标识对应的字段提取规则提取出待转换的字符串;将所述待转换的字符串还原为关键字。
【技术特征摘要】
1.一种关键字的还原方法,其特征在于,包括: 预先建立关键字特征标识库; 所述关键字特征标识库中包含与多个预设的搜索网站一一对应的参考关键字特征标识,以及与所述参考关键字特征标识一一对应的字段提取规则; 若用户的网络访问数据中包含与所述关键字特征标识库中的参考关键字特征标识相同的标识字符串,则按照与所述标识字符串相同的参考关键字特征标识对应的字段提取规则提取出待转换的字符串; 将所述待转换的字符串还原为关键字。2.根据权利要求1所述的方法,其特征在于,所述关键字特征标识库包括:参考关键字特征标识bs。3.根据权利要求2所述的方法,其特征在于,所述关键字特征标识库包括:参考关键字特征标识&q。4.根据权利要求3所述的方法,其特征在于,所述关键字特征标识库包括:参考关键字特征标识 search ? keyword。5.根据权利要求4所述的方法,其特征在于,所述字段提取规则包括:提取所述参考关键字特征标识后的第一个=和第一个&之间的字符串。6.一种关键字的还原装置,其特征在于,包括:关键字特征...
【专利技术属性】
技术研发人员:祝守宇,赵林,黄长波,
申请(专利权)人:北京西塔网络科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。