一种终端识别方法和识别服务器技术

技术编号:16472570 阅读:21 留言:0更新日期:2017-10-29 00:15
本发明专利技术实施例公开了一种终端识别方法,包括:获取现网中的超文本传输协议HTTP访问日志,所述HTTP访问日志包括跟踪区域码TAC和用户代理UA信息;根据TAC码和关键词的对应关系,确定所述HTTP访问日志的TAC码对应的关键词;当所述HTTP访问日志的UA信息中存在所述关键词时,确定所述关键词为所述HTTP访问日志对应的终端类型标识。进一步的,本发明专利技术实施例还公开了一种识别服务器。

Terminal identification method and identification server

The embodiment of the invention discloses a terminal identification method: get in the existing network hypertext transfer protocol HTTP access logs, the HTTP logs include tracking area code TAC and UA user agent information; according to the corresponding relationship between TAC codes and keywords, keywords of the HTTP access log of the corresponding TAC code the presence of the keywords; when the HTTP access log UA information, determine the type of terminal identifies the key words for the corresponding HTTP access log. Furthermore, the embodiment of the invention also discloses an identification server.

【技术实现步骤摘要】
一种终端识别方法和识别服务器
本专利技术涉及通信领域的设备识别技术,尤其涉及一种终端识别方法和识别服务器。
技术介绍
随着蜂窝通信技术的发展,用户友好型移动终端类型越来越多,能够应用于移动终端的应用也越来越多,移动终端已经成为人们生活不可或缺的一部分。由于移动终端的广泛应用,使得通信网络中进行传输的网页数据较多,但是不同的移动终端能够接收和处理的网页类型可能不同,使用不同移动终端的用户的使用习惯也不同,例如,有些使用诺基亚的用户喜欢浏览美食类网页,有些使用三星的用户喜欢浏览体育网页,还有些使用苹果的用户喜欢浏览娱乐网页。运营商为了精准的为使用不同类型移动终端的用户提供不同的服务,需要根据用户的浏览历史识别移动终端的类型。具体的,识别服务器可以从海量的超文本传输协议(HyperTextTransferProtocol,HTTP)请求报头的跟踪区域(Trackingareacode,TAC)码中检索不同网页对应的移动终端类型。为了实现从UA信息中检索移动终端类型,标准组织制定了两种规范,一种是万维网联合会制定的CC/PP标准,另一种是利用开放移动联盟制定的CC/PP词典。根据这两种规范设置的移动终端的格式,可以被识别服务器识别。但是,基于CC/PP标准规范检索移动终端信息的方法需要限定HTTP中携带移动终端类型的字节位置以及移动终端类型的书写方式,由于市场多样性,很多移动终端并不遵循CC/PP标准规范,使得终端识别的准确率较低。
技术实现思路
为解决上述技术问题,本专利技术实施例期望提供一种终端识别方法和识别服务器,能够提高终端识别的准确率。本专利技术的技术方案是这样实现的:一方面,本专利技术实施例提供一种终端识别方法,包括:获取现网中的超文本传输协议HTTP访问日志,所述HTTP访问日志包括跟踪区域码TAC和用户代理UA信息;根据TAC码和关键词的对应关系,确定所述HTTP访问日志的TAC码对应的关键词;当所述HTTP访问日志的UA信息中存在所述关键词时,确定所述关键词为所述HTTP访问日志对应的终端类型标识。可选的,在所述获取现网中的HTTP访问日志之前,所述方法包括:从现网中采集多条HTTP访问日志,每条HTTP访问日志包括TAC码和UA信息,每个UA信息包括多个UA元素;根据每条HTTP访问日志的TAC码和UA信息中UA元素,组成第一属性对集合,所述第一属性对集合包括多个属性对,每个属性对包括一个TAC码和与所述TAC码对应的UA信息中的一个UA元素;根据所述第一属性对集合,获取每个TAC码的关键词,并建立TAC码和关键词的对应关系,TAC码的关键词为所述TAC码对应的UA信息中的一个UA元素。可选的,所述根据所述第一属性对集合,获取每个TAC码的关键词包括:计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的杰卡德Jacard系数;选择每个TAC码对应的Jacard系数最大的属性对包括的UA元素作为对应TAC码的关键词。可选的,在所述计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的Jacard系数之前,所述方法还包括:根据预设词典,筛除所述第一属性对集合中与终端类型无关的UA元素对应的属性对,获取第二属性对集合;所述计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的Jacard系数包括:计算所述第二属性对集合中每个属性对包括的TAC码和UA元素的Jacard系数。可选的,在所述计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的Jacard系数之前,所述方法还包括:计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的相关系数;按照所述相关系数的由大到小,排列每个TAC码对应的属性对;选择排列后每个TAC码对应的前预设数量个属性对组成第三属性对集合;所述计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的Jacard系数包括:计算所述第三属性对集合中每个属性对包括的TAC码和UA元素的Jacard系数。另一方面,本专利技术实施例提供一种识别服务器,包括:第一获取单元,用于获取现网中的超文本传输协议HTTP访问日志,所述HTTP访问日志包括跟踪区域码TAC和用户代理UA信息;第一确定单元,用于根据TAC码和关键词的对应关系,确定所述HTTP访问日志的TAC码对应的关键词;第二确定单元,用于当所述HTTP访问日志的UA信息中存在所述关键词时,确定所述关键词为所述HTTP访问日志对应的终端类型标识。可选的,所述服务器包括:采集单元,用于从现网中采集多条HTTP访问日志,每条HTTP访问日志包括TAC码和UA信息,每个UA信息包括多个UA元素;组成单元,用于根据每条HTTP访问日志的TAC码和UA信息中UA元素,组成第一属性对集合,所述第一属性对集合包括多个属性对,每个属性对包括一个TAC码和与所述TAC码对应的UA信息中的一个UA元素;第二获取单元,用于根据所述第一属性对集合,获取每个TAC码的关键词,并建立TAC码和关键词的对应关系,TAC码的关键词为所述TAC码对应的UA信息中的一个UA元素。可选的,所述第二获取单元具体用于:计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的杰卡德Jacard系数;选择每个TAC码对应的Jacard系数最大的属性对包括的UA元素作为对应TAC码的关键词。可选的,所述服务器还包括:筛选单元,用于根据预设词典,筛除所述第一属性对集合中与终端类型无关的UA元素对应的属性对,获取第二属性对集合;所述第二获取单元具体用于:计算所述第二属性对集合中每个属性对包括的TAC码和UA元素的Jacard系数。可选的,所述服务器还包括:计算单元,用于计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的相关系数;排列单元,用于按照所述相关系数的由大到小,排列每个TAC码对应的属性对;选择单元,用于选择排列后每个TAC码对应的前预设数量个属性对组成第三属性对集合;所述第二获取单元具体用于:计算所述第三属性对集合中每个属性对包括的TAC码和UA元素的Jacard系数。本专利技术实施例提供了一种终端识别方法和识别服务器,所述终端识别方法包括:获取现网中的超文本传输协议HTTP访问日志,所述HTTP访问日志包括跟踪区域码TAC和用户代理UA信息;根据TAC码和关键词的对应关系,确定所述HTTP访问日志的TAC码对应的关键词;当所述HTTP访问日志的UA信息中存在所述关键词时,确定所述关键词为所述HTTP访问日志对应的终端类型标识。相较于现有技术,可以预先建立TAC码和关键词的对应关系,然后根据TAC码和关键词的对应关系,确定所述HTTP访问日志的TAC码对应的关键词,即使有的终端未按照标准使用TAC码,也能够根据TAC码的关键词确定HTTP访问日志对应的终端类型,提高了终端识别的准确率。附图说明图1为本专利技术实施例提供的一种终端识别方法的流程示意图1;图2为本专利技术实施例提供的一种终端识别方法的流程示意图2;图3为本专利技术实施例提供的一种HTTP访问日志的格式示意图;图4为本专利技术实施例提供的一种识别服务器的结构示意图1;图5为本专利技术实施例提供的一种识别服务器的结构示意图2;图6为本专利技术实施例提供的一种识别服务器的结构示意图3;图7为本专利技术实施例提本文档来自技高网...
一种终端识别方法和识别服务器

【技术保护点】
一种终端识别方法,其特征在于,包括:获取现网中的超文本传输协议HTTP访问日志,所述HTTP访问日志包括跟踪区域码TAC和用户代理UA信息;根据TAC码和关键词的对应关系,确定所述HTTP访问日志的TAC码对应的关键词;当所述HTTP访问日志的UA信息中存在所述关键词时,确定所述关键词为所述HTTP访问日志对应的终端类型标识。

【技术特征摘要】
1.一种终端识别方法,其特征在于,包括:获取现网中的超文本传输协议HTTP访问日志,所述HTTP访问日志包括跟踪区域码TAC和用户代理UA信息;根据TAC码和关键词的对应关系,确定所述HTTP访问日志的TAC码对应的关键词;当所述HTTP访问日志的UA信息中存在所述关键词时,确定所述关键词为所述HTTP访问日志对应的终端类型标识。2.根据权利要求1所述的方法,其特征在于,在所述获取现网中的HTTP访问日志之前,所述方法包括:从现网中采集多条HTTP访问日志,每条HTTP访问日志包括TAC码和UA信息,每个UA信息包括多个UA元素;根据每条HTTP访问日志的TAC码和UA信息中UA元素,组成第一属性对集合,所述第一属性对集合包括多个属性对,每个属性对包括一个TAC码和与所述TAC码对应的UA信息中的一个UA元素;根据所述第一属性对集合,获取每个TAC码的关键词,并建立TAC码和关键词的对应关系,TAC码的关键词为所述TAC码对应的UA信息中的一个UA元素。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一属性对集合,获取每个TAC码的关键词包括:计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的杰卡德Jacard系数;选择每个TAC码对应的Jacard系数最大的属性对包括的UA元素作为对应TAC码的关键词。4.根据权利要求3所述的方法,其特征在于,在所述计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的Jacard系数之前,所述方法还包括:根据预设词典,筛除所述第一属性对集合中与终端类型无关的UA元素对应的属性对,获取第二属性对集合;所述计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的Jacard系数包括:计算所述第二属性对集合中每个属性对包括的TAC码和UA元素的Jacard系数。5.根据权利要求3所述的方法,其特征在于,在所述计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的Jacard系数之前,所述方法还包括:计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的相关系数;按照所述相关系数的由大到小,排列每个TAC码对应的属性对;选择排列后每个TAC码对应的前预设数量个属性对组成第三属性对集合;所述计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的...

【专利技术属性】
技术研发人员:郑辉唐蓉
申请(专利权)人:中国移动通信集团河北有限公司
类型:发明
国别省市:河北,13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1