The embodiment of the invention discloses a terminal identification method: get in the existing network hypertext transfer protocol HTTP access logs, the HTTP logs include tracking area code TAC and UA user agent information; according to the corresponding relationship between TAC codes and keywords, keywords of the HTTP access log of the corresponding TAC code the presence of the keywords; when the HTTP access log UA information, determine the type of terminal identifies the key words for the corresponding HTTP access log. Furthermore, the embodiment of the invention also discloses an identification server.
【技术实现步骤摘要】
一种终端识别方法和识别服务器
本专利技术涉及通信领域的设备识别技术,尤其涉及一种终端识别方法和识别服务器。
技术介绍
随着蜂窝通信技术的发展,用户友好型移动终端类型越来越多,能够应用于移动终端的应用也越来越多,移动终端已经成为人们生活不可或缺的一部分。由于移动终端的广泛应用,使得通信网络中进行传输的网页数据较多,但是不同的移动终端能够接收和处理的网页类型可能不同,使用不同移动终端的用户的使用习惯也不同,例如,有些使用诺基亚的用户喜欢浏览美食类网页,有些使用三星的用户喜欢浏览体育网页,还有些使用苹果的用户喜欢浏览娱乐网页。运营商为了精准的为使用不同类型移动终端的用户提供不同的服务,需要根据用户的浏览历史识别移动终端的类型。具体的,识别服务器可以从海量的超文本传输协议(HyperTextTransferProtocol,HTTP)请求报头的跟踪区域(Trackingareacode,TAC)码中检索不同网页对应的移动终端类型。为了实现从UA信息中检索移动终端类型,标准组织制定了两种规范,一种是万维网联合会制定的CC/PP标准,另一种是利用开放移动联盟制定的CC/PP词典。根据这两种规范设置的移动终端的格式,可以被识别服务器识别。但是,基于CC/PP标准规范检索移动终端信息的方法需要限定HTTP中携带移动终端类型的字节位置以及移动终端类型的书写方式,由于市场多样性,很多移动终端并不遵循CC/PP标准规范,使得终端识别的准确率较低。
技术实现思路
为解决上述技术问题,本专利技术实施例期望提供一种终端识别方法和识别服务器,能够提高终端识别的准确率。本专利技术的技术方案是 ...
【技术保护点】
一种终端识别方法,其特征在于,包括:获取现网中的超文本传输协议HTTP访问日志,所述HTTP访问日志包括跟踪区域码TAC和用户代理UA信息;根据TAC码和关键词的对应关系,确定所述HTTP访问日志的TAC码对应的关键词;当所述HTTP访问日志的UA信息中存在所述关键词时,确定所述关键词为所述HTTP访问日志对应的终端类型标识。
【技术特征摘要】
1.一种终端识别方法,其特征在于,包括:获取现网中的超文本传输协议HTTP访问日志,所述HTTP访问日志包括跟踪区域码TAC和用户代理UA信息;根据TAC码和关键词的对应关系,确定所述HTTP访问日志的TAC码对应的关键词;当所述HTTP访问日志的UA信息中存在所述关键词时,确定所述关键词为所述HTTP访问日志对应的终端类型标识。2.根据权利要求1所述的方法,其特征在于,在所述获取现网中的HTTP访问日志之前,所述方法包括:从现网中采集多条HTTP访问日志,每条HTTP访问日志包括TAC码和UA信息,每个UA信息包括多个UA元素;根据每条HTTP访问日志的TAC码和UA信息中UA元素,组成第一属性对集合,所述第一属性对集合包括多个属性对,每个属性对包括一个TAC码和与所述TAC码对应的UA信息中的一个UA元素;根据所述第一属性对集合,获取每个TAC码的关键词,并建立TAC码和关键词的对应关系,TAC码的关键词为所述TAC码对应的UA信息中的一个UA元素。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一属性对集合,获取每个TAC码的关键词包括:计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的杰卡德Jacard系数;选择每个TAC码对应的Jacard系数最大的属性对包括的UA元素作为对应TAC码的关键词。4.根据权利要求3所述的方法,其特征在于,在所述计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的Jacard系数之前,所述方法还包括:根据预设词典,筛除所述第一属性对集合中与终端类型无关的UA元素对应的属性对,获取第二属性对集合;所述计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的Jacard系数包括:计算所述第二属性对集合中每个属性对包括的TAC码和UA元素的Jacard系数。5.根据权利要求3所述的方法,其特征在于,在所述计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的Jacard系数之前,所述方法还包括:计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的相关系数;按照所述相关系数的由大到小,排列每个TAC码对应的属性对;选择排列后每个TAC码对应的前预设数量个属性对组成第三属性对集合;所述计算所述第一属性对集合中每个属性对包括的TAC码和UA元素的...
【专利技术属性】
技术研发人员:郑辉,唐蓉,
申请(专利权)人:中国移动通信集团河北有限公司,
类型:发明
国别省市:河北,13
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。