System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 域名网站识别方法、服务器、电子设备及存储介质技术_技高网

域名网站识别方法、服务器、电子设备及存储介质技术

技术编号:41245191 阅读:2 留言:0更新日期:2024-05-09 23:55
本申请实施例提出了一种域名网站识别方法、服务器、电子设备及存储介质,能够在不依赖于SNI字段的情况实现对所访问的域名网站的精确识别。其中,域名网站识别方法包括:目标服务器接收DPI所发送的目标数据流;目标服务器从目标数据流中提取在HTTPS协议的握手阶段的第一字节序列,和/或在HTTPS协议的加密传输阶段的第二字节序列,其中,当第一字节序列中出现SNI字段时,SNI字段被预设二进制数所替换,第一字节序列与第二字节序列的总字节数为目标固定值;将第一字节序列和/或第二字节序列输入域名网站识别模型,输出目标业务对应的目标域名网站。

【技术实现步骤摘要】

【】本申请实施例涉及通信,尤其涉及一种域名网站识别方法、服务器、电子设备及存储介质


技术介绍

0、
技术介绍

1、目前,随着互联网技术的发展,对网络通讯安全要求逐渐提高,因此,https协议被广泛运用到web应用服务当中,以防止数据在传输过程中被窃取、篡改,确保用户的隐私安全,同时,流量监测和业务统计作为网络管理和维护的重要工作,需要对https流量所访问的域名网站进行识别。

2、现有技术中,通过提取https协议tls握手阶段中的sni字段对https流量所访问的域名网站进行识别,由于sni字段存在着流量伪装的问题,导致对用户所访问的域名网站进行识别所获得的识别结果的精确度较低。


技术实现思路

0、
技术实现思路

1、本申请实施例提供了一种域名网站识别方法、服务器,电子设备及存储介质,能够在不依赖于sni字段的情况实现对所访问的域名网站的精确识别。

2、第一方面,本申请实施例提供了一种域名网站识别方法,应用于服务器,所述方法包括:

3、所述目标服务器接收dpi所发送的目标数据流,所述目标数据流为业务服务器与客户端之间基于https协议在执行目标业务时所产生的;

4、所述目标服务器从所述目标数据流中提取在https协议的握手阶段的第一字节序列,和/或在https协议的加密传输阶段的第二字节序列,其中,当所述第一字节序列中出现sni字段时,所述sni字段被等字节数的预设二进制数所替换,所述第一字节序列与所述第二字节序列的总字节数为目标固定值;

5、将所述第一字节序列和/或所述第二字节序列输入域名网站识别模型,输出所述目标业务对应的目标域名网站。

6、本申请实施例中,当用户访问域名网站时,在客户端与业务服务器之间会基于https协议产生数据流,此时dpi能够采集上述数据流,并且目标服务器可以通过dpi接收上述数据流,当目标服务器接收到目标数据流后,基于https协议,可以提取在https协议的握手阶段的第一字节序列,和/或在https协议的加密传输阶段的第二字节序列,上述的第一字节序列与第二字节序列的总字节数为固定值,即目标服务器从目标数据流中提取的总字节数是固定的,并且当上述的第一字节序列中出现sni字段时,需要将上述sni字段隐去,即通过预设的二进制数将其替换掉,保证输入域名网站识别模型中的上述第一字节序列中不含有sni字段,而第二字节序列中原本就不含有sni字段,因此,通过上述的第一字节序列和/或上述第二字节序列识别用户所访问的域名网站,保证了对https流量所访问的域名网站的识别的准确性。

7、可选的,所述目标服务器从所述目标数据流中提取在https协议的握手阶段的第一字节序列,和/或在https协议的加密传输阶段的第二字节序列包括:

8、所述目标服务器从所述目标数据流中提取在https协议的握手阶段的连续字节数据,所述连续字节数据的总字节数为所述目标固定值;

9、若所述连续字节数据中存在所述sni字段,根据所述预设二进制对所述sni字段进行替换,并将替换后的所述连续字节数据作为所述第一字节序列;

10、将所述第一字节序列和/或所述第二字节序列输入域名网站识别模型,输出所述目标业务对应的目标域名网站包括:

11、将替换后的所述连续字节数据输入所述域名网站识别模型,输出所述目标业务对应的所述目标域名网站。

12、本申请实施例中,可以提取https协议的握手阶段中任一字节数满足目标固定值的连续字节数据,并且在确定上述连续字节数据中包括有sni字段时,利用等字节数的预设二进制数对其进行替换,即利用不包含有sni字段的第一字节序列对https流量所访问的域名网站进行识别,从而保证了对https流量所访问的域名网站的识别的准确性。

13、可选的,所述目标服务器从所述目标数据流中提取在https协议的握手阶段的第一字节序列,和/或在https协议的加密传输阶段的第二字节序列包括:

14、所述目标服务器从所述目标数据流中提取在https协议的握手阶段的非连续字节数据,所述非连续字节数据的总字节数为所述目标固定值;

15、若所述非连续字节数据中存在所述sni字段,根据所述预设二进制对所述sni字段进行替换,并将替换后的所述非连续字节数据作为所述第一字节序列;

16、将所述第一字节序列和/或所述第二字节序列输入域名网站识别模型,输出所述目标业务对应的目标域名网站包括:

17、将替换后的所述非连续字节数据输入所述域名网站识别模型,输出所述目标业务对应的所述目标域名网站。

18、本申请实施例中,可以提取https协议的握手阶段中任一字节数满足目标固定值的非连续字节数据,而非连续字节数据可以认为包括有更多的时空特征,同时在确定上述非连续字节数据中包括有sni字段时,利用等字节数的预设二进制数对其进行替换,即利用不包含有sni字段且由非连续字节数据所构成的第一字节序列对https流量所访问的域名网站进行识别,从而保证了对https流量所访问的域名网站的识别的准确性。

19、可选的,所述目标服务器从所述目标数据流中提取在https协议的握手阶段的第一字节序列,和/或在https协议的加密传输阶段的第二字节序列包括:

20、所述目标服务器从所述目标数据流中提取在https协议的握手阶段的非连续字节数据,所述非连续字节数据的总字节数为第一固定值;

21、若所述非连续字节数据中存在所述sni字段,根据所述预设二进制对所述sni字段进行替换,并将替换后的所述非连续字节数据作为所述第一字节序列;

22、所述目标服务器从所述目标数据流中提取在https协议的加密传输阶段的连续字节数据,所述连续字节数据的总字节数为第二固定值,所述第一固定值与所述第二固定值之和为所述目标固定值;

23、将所述连续字节数据作为所述第二字节序列;

24、将所述第一字节序列和/或所述第二字节序列输入域名网站识别模型,输出所述目标业务对应的目标域名网站包括:

25、将替换后的所述非连续字节数据以及所述连续字节数据输入所述域名网站识别模型,输出所述目标业务对应的所述目标域名网站。

26、本申请实施例中,可以先提取https协议的握手阶段中的任一字节数满足第一固定值的非连续字节数据,即在握手阶段提取目标数据流中更多的时空特征,同时确定上述非连续字节数据中包括有sni字段时,利用等字节数的预设二进制数对其进行替换,再提取https协议的加密传输阶段中的任一字节数满足第二固定值的连续字节数据,上述第一固定值与第二固定值之和为目标固定值,在上述的加密传输阶段中,所以上述连续字节数据中不包含sni字段,然后利用不包含有sni字段且由非连续字节数据所构成的第一字节序列与不包含sni字段且由连续字节数据所构成的第二字节序列对https流量所访问的域名网站进本文档来自技高网...

【技术保护点】

1.一种域名网站识别方法,其特征在于,应用于目标服务器,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述目标服务器从所述目标数据流中提取在HTTPS协议的握手阶段的第一字节序列,和/或在HTTPS协议的加密传输阶段的第二字节序列包括:

3.根据权利要求1所述的方法,其特征在于,所述目标服务器从所述目标数据流中提取在HTTPS协议的握手阶段的第一字节序列,和/或在HTTPS协议的加密传输阶段的第二字节序列包括:

4.根据权利要求1所述的方法,其特征在于,所述目标服务器从所述目标数据流中提取在HTTPS协议的握手阶段的第一字节序列,和/或在HTTPS协议的加密传输阶段的第二字节序列包括:

5.根据权利要求1所述的方法,其特征在于,所述目标服务器从所述目标数据流中提取在HTTPS协议的握手阶段的第一字节序列,和/或在HTTPS协议的加密传输阶段的第二字节序列包括:

6.根据权利要求1所述的方法,其特征在于,所述目标服务器从所述目标数据流中提取在HTTPS协议的握手阶段的第一字节序列,和/或在HTTPS协议的加密传输阶段的第二字节序列包括:

7.根据权利要求1所述的方法,其特征在于,所述目标服务器从所述目标数据流中提取在HTTPS协议的握手阶段的第一字节序列,和/或在HTTPS协议的加密传输阶段的第二字节序列包括:

8.根据权利要求1所述的方法,其特征在于,所述域名网站识别模型包括依次连接的输入层、双向GRU层、注意力机制层以及输出层:其中,

9.一种电子设备,其特征在于,所述电子设备包括至少一个处理器以及与所述至少一个处理器连接的存储器,所述至少一个处理器用于执行存储器中存储的计算机程序时实现如权利要求1-8任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8任一项所述方法的步骤。

...

【技术特征摘要】

1.一种域名网站识别方法,其特征在于,应用于目标服务器,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述目标服务器从所述目标数据流中提取在https协议的握手阶段的第一字节序列,和/或在https协议的加密传输阶段的第二字节序列包括:

3.根据权利要求1所述的方法,其特征在于,所述目标服务器从所述目标数据流中提取在https协议的握手阶段的第一字节序列,和/或在https协议的加密传输阶段的第二字节序列包括:

4.根据权利要求1所述的方法,其特征在于,所述目标服务器从所述目标数据流中提取在https协议的握手阶段的第一字节序列,和/或在https协议的加密传输阶段的第二字节序列包括:

5.根据权利要求1所述的方法,其特征在于,所述目标服务器从所述目标数据流中提取在https协议的握手阶段的第一字节序列,和/或在https协议的加密传输阶段的第二字节序列包括:

6.根据权...

【专利技术属性】
技术研发人员:高翔王雷彭伟闫冰朱明博孙善勇张宏阳李陆
申请(专利权)人:中国移动通信集团山东有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1