解析器制造技术

技术编号:20987748 阅读:19 留言:0更新日期:2019-04-29 20:23
本公开提供了一种用于解析用户代理字符串的方法。基于用户代理字符串模式,从用户代理字符串提取信息。基于所提取的信息的模式,将所提取的信息映射到预定义信息。

Parser

This disclosure provides a method for parsing user agent strings. Based on the user agent string pattern, information is extracted from the user agent string. Based on the pattern of the extracted information, the extracted information is mapped to the predefined information.

【技术实现步骤摘要】
【国外来华专利技术】解析器
技术介绍
用户代理是代表用户进行操作的软件。当在网络协议中操作时,用户代理通常通过向应用服务器提交被称为用户代理字符串的特征识别字符串来识别自身。该用户代理字符串包含该用户代理的各种身份信息,例如:应用类型、设备信息、操作系统(OS)、OS版本、软件供应商、软件版本、浏览器和浏览器版本。从用户代理字符串收集这样的用户代理信息,使得进一步操作得以进行,例如,实时地识别用户代理的特征,按照用户代理来分析应用日志数据,等等。
技术实现思路
以下提供本
技术实现思路
以介绍将在下文具体实施方式中进一步描述的一些概念。本
技术实现思路
不旨在标识所要求保护的话题的关键特征或者必要特征,也不旨在用于限制所要求保护的话题的范围。本公开的实施例提供了一种用于解析用户代理字符串(UAS)的方法。基于用户代理字符串模式,从用户代理字符串提取信息。基于所提取的信息的模式,将所提取的信息映射到预定义信息。应该理解,上述一个或多个方面包括在下文充分描述且在权利要求书中特别指出的特征。以下描述和附图详细陈述了所述一个或多个方面的某些说明性的特征。这些特征仅表示利用各方面原理的各种方式,而本公开旨在涵盖所有此类方面以及其等效物。附图说明以下将结合附图来描述所公开的各个方面,这些附图是用来说明而不是限制所公开的各个方面。图1示出了根据一个实施例的能够实现所描述的技术的示例性环境。图2示出了根据一个实施例的示例性计算设备。图3示出了根据一个实施例的解析系统的示例性框架。图4示出了根据一个实施例的示例性映射器。图5示出了根据一个实施例的用于更新用户代理字符串模式的示例性框架。图6示出了根据一个实施例的解析系统的示例性框架。图7示出了根据一个实施例的用于解析用户代理字符串的示例性过程。图8示出了根据一个实施例的用于解析用户代理字符串的示例性装置。图9示出了根据一个实施例的示例性计算系统。具体实施方式以下将结合若干示例性实施方式来阐述本公开。应该理解,阐述这些实施方式仅仅是为了使本领域技术人员能够更好地理解并且从而实施本公开的实施例,而不代表对本公开的范围的任何限制。图1示出了能够实现本公开的实施例的示例性环境。应该理解,描述该环境的结构和功能仅仅是为了说明的目的,而不代表对本公开的范围作出任何限制。本公开可以利用不同的结构或功能来实现。示例性环境或系统100包括网络150。网络150可以通过各种类型的网络中的一个或多个来实现,例如局域网(LAN)、广域网(WAN)、无线网络等,它们被统一示出为网络150。网络150可以包括可以进一步覆盖独立自组织网络等的各种无线子网络中的任何一个,以为诸如设备110、120等的客户端设备提供面向基础设施的连接。这种子网络可以包括网状网络、无线LAN(WLAN)网络、蜂窝网络等。网络150可以进一步包括通过无线无线电链路等连接的终端、网关、路由器等的自主系统。网络150被配置为将诸如服务器计算设备130、140的一个或多个服务器及其各自的组件与诸如客户端设备110、120的其他计算设备连接。网络150能够使用任何形式的计算机可读介质将信息从一个电子设备传送到另一个电子设备。客户端计算设备110、120可以包括能够通过网络150接收和发送消息的任何设备。客户端计算设备110、120的示例包括蜂窝电话、智能电话、射频(RF)设备、音乐播放器、数字照相机、个人数字助理(PDA)、手持式计算机、个人计算机、笔记本电脑、可穿戴式计算机、平板电脑、自动汽车、组合一个或多个前述设备的集成设备,等等。客户端设备110、120中的一个或多个还可以被配置为通过有线和/或无线网络进行操作。通常,客户端设备110、120在能力和特征方面范围广泛。例如,蜂窝电话可以具有数字键盘和仅可以显示文本的有限行单色LCD显示器。再例如,具备网络功能的客户端设备可具有触敏屏幕、触控笔以及既可以显示文本又可以显示图形的多行彩色LCD显示器。具备网络功能的客户端设备可以包括被配置为接收和发送网页和基于网络的消息等的浏览器应用。该浏览器应用可被配置为采用包括无线应用协议消息(WAP)等几乎任何基于网络的语言,接收和显示图形、文本、多媒体等。在一个实施例中,可以使浏览器应用能够采用以下中的一个或多个来显示和发送信息:手持设备标记语言(HDML)、无线标记语言(WML)、无线标记语言脚本(WMLScript)、Java脚本(JavaScript)、标准通用标记语言(SMGL)、超文本标记语言(HTML)、可扩展标记语言(XML)、Java脚本对象表示法(JSON)等。客户端计算设备110、120还可以包括客户端应用,其被配置为向另一个计算设备发送内容或者从另一个计算设备接收内容,该另一个计算设备包括但不限于服务器计算设备130、140或其他客户端计算设备。该客户端应用可以包括提供和接收文本内容、多媒体信息等的能力。该客户端应用可以进一步提供标识自身的信息,包括类型、能力、名称等。此类信息的示例包括用户代理字符串。客户端计算设备110、120还可以被配置为,例如通过电子邮件、短消息服务(SMS)、多媒体消息服务(MMS)、即时消息(IM)、互联网中继聊天(IRC)、可扩展通讯和表示协议(XMPP)等,向另一个计算设备传输消息。然而,本公开不限于这些消息协议,并且实际上可以采用任何其他消息协议。客户端设备110、120可以被进一步配置为包括允许用户登录到由另一个计算设备管理的用户帐户的客户端应用。例如,这样的用户帐户可被配置为使用户能够在网络上接收电子邮件、发送/接收IM消息、SMS消息、访问所选网页、下载脚本、应用或各种其他内容、或执行各种其他操作。不过,也可以在不登录到用户帐户的情况下,执行对消息的管理,或对内容的访问和/或下载。因此,客户端设备110、120的用户可以使用各种客户端应用中的任何一种以访问内容、读取网页、接收/发送消息,等等。例如,用户可以使用浏览器或其他客户端应用来访问被实现为服务器计算设备130或140的网络服务器提供的网页。用户代理字符串解析系统150可以连接到服务器计算设备130和140。用户代理字符串解析系统150可以用于解析由服务器计算设备130或140从在各种客户端计算设备110或120处的各种客户端应用接收的用户代理字符串。在一个示例中,用户代理字符串解析系统150可以从用户代理字符串获得用户代理信息,并将该用户代理信息实时地提供给服务器计算设备130或140。在另一示例中,用户代理字符串解析系统150可以解析从服务器计算设备130和140中的至少一个获得的关于用户代理字符串的日志数据。通过解析该日志数据获得的用户代理信息可以进一步用于分析用户代理的行为。尽管用户代理字符串解析系统被示为用于服务器计算设备130和140的后端系统,但是应该理解,在一些实现中,可以部署多于一个用户代理字符串解析系统,并且应该理解,在一些实现中,用户代理字符串解析系统可以被实现在或并入到服务器计算设备130或140中。图2中的框图示出了可以用于实施本公开实施例的计算设备200的示例性物理组件。在一些实施例中,计算设备200可以是客户端计算机设备110、120中的一个。在一些实施例中,计算设备200可以是服务器计算机设备130、140中的一个。在一些本文档来自技高网...

【技术保护点】
1.一种用于解析用户代理字符串的方法,包括:基于用户代理字符串模式,从用户代理字符串提取信息;以及基于所提取的信息的模式,将所提取的信息映射到预定义信息。

【技术特征摘要】
【国外来华专利技术】1.一种用于解析用户代理字符串的方法,包括:基于用户代理字符串模式,从用户代理字符串提取信息;以及基于所提取的信息的模式,将所提取的信息映射到预定义信息。2.根据权利要求1所述的方法,其中,所述用户代理字符串模式是使用正则表达式来定义的,并且所提取的信息的模式是使用正则表达式来定义的。3.根据权利要求1所述的方法,其中,所提取的信息包括应用信息、操作系统信息和设备信息中的至少一个。4.根据权利要求3所述的方法,其中,所述预定义信息包括与所提取的设备信息相对应的设备模型信息、设备类别信息和设备制造商信息中的至少一个。5.根据权利要求3所述的方法,其中,所述预定义信息包括与所提取的操作系统信息相对应的操作系统友好名称信息、设备模型信息、设备类别信息和设备制造商信息中的至少一个。6.根据权利要求3所述的方法,其中,所述预定义信息包括与所提取的应用信息相对应的应用友好名称信息、操作系统名称信息、操作系统友好名称信息、设备模型信息、设备类别信息和设备制造商信息中的至少一个。7.根据权利要求1所述的方法,进一步包括:跟踪多个用户代理字符串中的被识别的用户代理字符串的覆盖百分比;和/或跟踪多个被识别的用户代理字符串中的被准确识别的用户代理字符串的准确度百分比。8.根据权利要求7所述的方法,进一步包括:当所述覆盖百分比和/或所述准确度百分比小于阈值时,进行警报。9.根据权利要求8所述的方法,进一步包括:基于不被识别的用户代理字符串和/或被不准确识别的用户代理字符串,更新所述用户代理字符串模式。10.根据权利要求9所述的方法,进一步包括:基于所更新的用户代理字符串模式,解析所述不被识别的用户代理字符串和/或被不准确识别的用户代理字符串;跟踪所述不被识别的用户代理字符串和/或被不准确识别的用户代理字符串的所述覆盖百分比和/或所述准确度百分比;以及如果所述不被识别的用户代理字符串和/或被不准确识别的用户代理字符串的所述覆盖百分比和/或所述准确度百分比小于阈值,...

【专利技术属性】
技术研发人员:聂倩倩
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1