用于识别访问域名的方法和系统技术方案

技术编号:24293841 阅读:30 留言:0更新日期:2020-05-26 20:57
本公开提供了一种用于识别访问域名的方法和系统,涉及通信技术领域。在该方法中,解析HTTPS报文中的SNI中的服务器名称。如果SNI中存在服务器名称,则以该服务器名称作为访问域名,否则查询DNS缓存条目,使用IP报文中的IP五元组与所述DNS缓存条目进行匹配。如果DNS缓存条目中存在与IP五元组相匹配的域名,则从相匹配的域名中选取DNS缓存条目的时间戳与HTTPS报文的时间戳的差值最小的域名作为访问域名。如果DNS缓存条目不存在与IP五元组相匹配的域名,则查找HTTPS报文中的Connect字段中的域名。在查找到Connect字段中的域名的情况下,以所查找到的该域名作为访问域名。本公开可以获得用户访问的域名。

Methods and systems for identifying access domain names

【技术实现步骤摘要】
用于识别访问域名的方法和系统
本公开涉及通信
,特别涉及一种用于识别访问域名的方法和系统。
技术介绍
目前,HTTPS(HyperTextTransferProtocoloverSecureSocketLayer,基于安全套接层的超文本传输协议)采用SSL(SecureSocketsLayer,安全套接层)/TLS(TransportLayerSecurity,传输层安全)加密。HTTPS对请求消息和响应消息都进行了加密,导致DPI(DeepPacketInspection,深度包检测)无法通过识别HTTPS头部字段的方式来获得用户访问的域名。这造成当前识别到的HTTPS流量的利用价值比较低。
技术实现思路
本公开的实施例解决的一个技术问题是:提供一种用于识别访问域名的方法,以获得用户访问的域名。根据本公开实施例的一个方面,提供了一种用于识别访问域名的方法,包括:解析HTTPS报文中的服务器名称指示SNI中的服务器名称;如果所述SNI中存在服务器名称,则以该服务器名称作为访问域名,否则查询域名系统DNS缓存条目,使用IP报文中的IP五元组与所述DNS缓存条目进行匹配;如果所述DNS缓存条目中存在与所述IP五元组相匹配的域名,则从相匹配的域名中选取DNS缓存条目的时间戳与所述HTTPS报文的时间戳的差值最小的域名作为访问域名;如果所述DNS缓存条目不存在与所述IP五元组相匹配的域名,则查找所述HTTPS报文中的连接Connect字段中的域名;以及在查找到所述Connect字段中的域名的情况下,以所查找到的该域名作为访问域名。在一些实施例中,所述方法还包括:在没有查找到所述Connect字段中的域名的情况下,根据所述HTTPS报文中的目的IP地址、以及IP地址与域名的对应关系,获得对应的访问域名。在一些实施例中,查找所述HTTPS报文中的Connect字段中的域名的步骤包括:在客户端与服务器的握手阶段,截获所述HTTPS报文并读取所述HTTPS报文的Connect字段中的域名。在一些实施例中,所述IP五元组包括:源IP地址、源端口、目的IP地址、目的端口和传输层协议。根据本公开实施例的另一个方面,提供了一种用于识别访问域名的系统,包括:解析单元,用于解析HTTPS报文中的服务器名称指示SNI中的服务器名称,在所述SNI中存在服务器名称的情况下以该服务器名称作为访问域名;匹配单元,用于在所述SNI中不存在服务器名称的情况下查询域名系统DNS缓存条目,使用IP报文中的IP五元组与所述DNS缓存条目进行匹配,在所述DNS缓存条目中存在与所述IP五元组相匹配的域名的情况下,从相匹配的域名中选取DNS缓存条目的时间戳与所述HTTPS报文的时间戳的差值最小的域名作为访问域名;以及查找单元,用于在所述DNS缓存条目不存在与所述IP五元组相匹配的域名的情况下,查找所述HTTPS报文中的连接Connect字段中的域名,并在查找到所述Connect字段中的域名的情况下,以所查找到的该域名作为访问域名。在一些实施例中,所述系统还包括:获取单元,用于在没有查找到所述Connect字段中的域名的情况下,根据所述HTTPS报文中的目的IP地址、以及IP地址与域名的对应关系,获得对应的访问域名。在一些实施例中,所述查找单元用于在客户端与服务器的握手阶段,截获所述HTTPS报文并读取所述HTTPS报文的Connect字段中的域名。在一些实施例中,所述IP五元组包括:源IP地址、源端口、目的IP地址、目的端口和传输层协议。根据本公开实施例的另一个方面,提供了一种用于识别访问域名的系统,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器的指令执行如前所述的方法。根据本公开实施例的另一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现如前所述的方法的步骤。在上述方法中,解析HTTPS报文中的SNI中的服务器名称。如果该SNI中存在服务器名称,则以该服务器名称作为访问域名,否则查询DNS缓存条目,使用IP报文中的IP五元组与该DNS缓存条目进行匹配。如果该DNS缓存条目中存在与该IP五元组相匹配的域名,则从相匹配的域名中选取DNS缓存条目的时间戳与HTTPS报文的时间戳的差值最小的域名作为访问域名。如果该DNS缓存条目不存在与IP五元组相匹配的域名,则查找该HTTPS报文中的Connect字段中的域名。在查找到该Connect字段中的域名的情况下,以所查找到的该域名作为访问域名。通过该方法,可以获得用户访问的域名。通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。附图说明构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:图1是示出根据本公开一些实施例的用于识别访问域名的方法的流程图;图2是示出根据本公开另一些实施例的用于识别访问域名的方法的流程图;图3是示出根据本公开一些实施例的用于识别访问域名的系统的结构图;图4是示出根据本公开另一些实施例的用于识别访问域名的系统的结构图;图5是示出根据本公开另一些实施例的用于识别访问域名的系统的结构图。具体实施方式现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。图1是示出根据本公开一些实施例的用于识别访问域名的方法的流程图。如图1所示,该方法可以包括步骤S102~S110。在步骤S102,解析HTTPS报文中的SNI(ServerNameIndication,服务器名称指示)中的服务器名称(ServerName)。例如,DPI系统可以获取HTTPS报文,并解析HTTPS报文中的SNI中的服务器名称。这里,SNI是HTTPS报文中的一组字段(或者称为一个子集)。该SNI是在握手阶段进行交互的,该阶段还未开始加密,因此可以对HTTPS报文中的SNI进行解析。如果该SNI中存在服务器名称(即流程中,如果是),则过本文档来自技高网...

【技术保护点】
1.一种用于识别访问域名的方法,包括:/n解析HTTPS报文中的服务器名称指示SNI中的服务器名称;/n如果所述SNI中存在服务器名称,则以该服务器名称作为访问域名,否则查询域名系统DNS缓存条目,使用IP报文中的IP五元组与所述DNS缓存条目进行匹配;/n如果所述DNS缓存条目中存在与所述IP五元组相匹配的域名,则从相匹配的域名中选取DNS缓存条目的时间戳与所述HTTPS报文的时间戳的差值最小的域名作为访问域名;/n如果所述DNS缓存条目不存在与所述IP五元组相匹配的域名,则查找所述HTTPS报文中的连接Connect字段中的域名;以及/n在查找到所述Connect字段中的域名的情况下,以所查找到的该域名作为访问域名。/n

【技术特征摘要】
1.一种用于识别访问域名的方法,包括:
解析HTTPS报文中的服务器名称指示SNI中的服务器名称;
如果所述SNI中存在服务器名称,则以该服务器名称作为访问域名,否则查询域名系统DNS缓存条目,使用IP报文中的IP五元组与所述DNS缓存条目进行匹配;
如果所述DNS缓存条目中存在与所述IP五元组相匹配的域名,则从相匹配的域名中选取DNS缓存条目的时间戳与所述HTTPS报文的时间戳的差值最小的域名作为访问域名;
如果所述DNS缓存条目不存在与所述IP五元组相匹配的域名,则查找所述HTTPS报文中的连接Connect字段中的域名;以及
在查找到所述Connect字段中的域名的情况下,以所查找到的该域名作为访问域名。


2.根据权利要求1所述的方法,还包括:
在没有查找到所述Connect字段中的域名的情况下,根据所述HTTPS报文中的目的IP地址、以及IP地址与域名的对应关系,获得对应的访问域名。


3.根据权利要求1所述的方法,其中,查找所述HTTPS报文中的Connect字段中的域名的步骤包括:
在客户端与服务器的握手阶段,截获所述HTTPS报文并读取所述HTTPS报文的Connect字段中的域名。


4.根据权利要求1所述的方法,其中,
所述IP五元组包括:源IP地址、源端口、目的IP地址、目的端口和传输层协议。


5.一种用于识别访问域名的系统,包括:
解析单元,用于解析HTTPS报文中的服务器名称指示SNI中的服务器名称,在所述SNI中存在服务器名称的情况下以该服务器名称作为访问域名...

【专利技术属性】
技术研发人员:李文云曹维华叶玉剑王晴姜松
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1