报文信息提取方法及装置制造方法及图纸

技术编号:13793047 阅读:78 留言:0更新日期:2016-10-06 05:37
本发明专利技术提供一种报文信息提取方法及装置,该方法包括:获取服务器响应于客户端发送的请求报文,向客户端返回的响应报文;过滤掉响应报文中不包括目标信息的响应报文;从未过滤掉的响应报文中提取所述目标信息。本发明专利技术中报文信息提取装置通过只针对响应报文进行分析,并在对响应报文进行分析之前,过滤掉不包括目标信息的响应报文,可以提高报文分析速度,从而提高管理员获取网络监控信息的速度。

【技术实现步骤摘要】

本专利技术涉及通信
,特别涉及一种报文信息提取方法及装置
技术介绍
随着产业技术的发展,技术研发机构越来越注重其自主知识产权的保护。为了保证机构自主研发的技术不轻易外泄,需要对互联网进行监控,以便管理员及时了解机构用户通过客户端所访问的服务器上的互联网内容。然而,现有技术中,通常对客户端与服务器之间的所有交互报文进行分析,因此分析速度较慢,从而导致管理员获取网络监控信息的速度较慢。
技术实现思路
有鉴于此,本专利技术提供一种报文信息提取方法及装置,以解决网络监控信息获取速度较慢的问题。根据本专利技术实施例的第一方面,本专利技术提供一种报文信息提取方法,所述方法包括:获取服务器响应于客户端发送的请求报文,向所述客户端返回的响应报文;过滤掉所述响应报文中不包括目标信息的响应报文;从未过滤掉的响应报文中提取所述目标信息。根据本专利技术实施例的第二方面,本专利技术提供一种报文信息提取装置,所述装置包括:获取单元,用于获取服务器响应于客户端发送的请求报文,向所述客户
端返回的响应报文;过滤单元,用于过滤掉所述响应报文中不包括目标信息的响应报文;提取单元,用于从未过滤掉的响应报文中提取所述目标信息。综上所述,由于采用了上述技术方案,本专利技术的有益效果是:本专利技术实施例中,报文信息提取装置通过只针对响应报文进行分析,并在对响应报文进行分析之前,过滤掉不包括目标信息的响应报文,可以提高报文分析速度,从而提高管理员获取网络监控信息的速度。附图说明图1是应用本专利技术实施例实现报文信息提取的应用场景示意图;图2是本专利技术报文信息提取方法的一个实施例流程图;图3是本专利技术报文信息提取方法的另一个实施例框图;图4是本专利技术报文信息提取装置所在设备的一种硬件结构图;图5是本专利技术报文信息提取装置的一个实施例框图。具体实施方式为了使本
的人员更好地理解本专利技术实施例中的技术方案,并使本专利技术实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本专利技术实施例中技术方案作进一步详细的说明。参见图1,为应用本专利技术实施例实现报文信息提取的应用场景示意图。图1中,客户端可以为电脑、手机和iPad等,报文信息提取装置可以为路由器和交换机等。用户可以通过客户端请求访问服务器中提供的资源,报文信息提取装置用于获取客户端向服务器发送的请求报文以及服务器向客户端返回的响应报文。在本专利技术实施例中,报文信息提取装置首先获取服务器响应于客户端发送的请求报文,向客户端返回的响应报文;然后过滤掉这些响应报文中不包括目标信息的响应报文,并从未过滤掉的响应报文中提取目标信息,由此可
见,在本专利技术实施例中报文信息提取装置通过只针对响应报文进行分析,并在对响应报文进行分析之前,过滤掉不包括目标信息的响应报文,可以提高报文分析速度,从而提高管理员获取网络监控信息的速度。参见图2,为本专利技术报文信息提取方法的一个实施例的流程图,包括:步骤201、获取服务器响应于客户端发送的请求报文,向客户端返回的响应报文。在本专利技术的优选实施例中,当用户通过客户端请求访问服务器中的资源时,客户端向服务器发送请求报文,服务器在接收到请求报文后,向客户端返回响应报文。经研究发现,只有当服务器向客户端返回的响应报文中包括纯文本内容时,报文信息提取装置才能根据响应报文中的纯文本内容,获得管理员实现网络监控所需要的信息。由于服务器向客户端返回的响应报文中是否包括纯文本内容由响应报文的类型来决定(例如html类型的响应报文中可能包括纯文本内容,JavaScript类型的响应报文中肯定不包括纯文本内容),并且根据服务器响应机制的不同,针对同一种类型的响应报文,服务器可以将网页响应报文中的内容以纯文本形式返回,也可以将网页响应报文中的内容以非纯文本形式返回,因此根据网页响应报文的类型,只能确定该响应报文中可能包括纯文本内容,不能确定该响应报文中一定包括纯文本内容。另外,客户端向服务器发送的请求报文中通常包括用于表示其对应响应报文的类型的标识符。综上所述,在本实施例中报文信息提取装置可以首先获取客户端发送的请求报文,然后根据该请求报文中用于表示服务器响应于该请求报文,向客户端返回的响应报文的类型的标识符,判断服务器响应于该请求报文,向客户端返回的响应报文中是否可能包括纯文本内容。当服务器响应于该请求报文,向客户端返回的响应报文中可能包括纯文本内容时,报文信息提取装置可以获取服务器响应于该请求报文,向客户端返回的响应报文。本实施例中报文信息提取装置只有在请求报文中标识符显示其对应响应报文中可能包括纯文本内容时,才获取与该请求报文对应的响应报文,由此本实施例通过只
针对可能包括纯文本内容的响应报文进行分析,可以提高分析速度,从而提高管理员获取网络监控信息的速度。例如,当用户基于HTTP(HyperText Transfer Protocol,超文本传输协议)协议通过客户端访问服务器上的网页时,报文信息提取装置可以首先获取客户端发送的HTTP请求报文。由于HTTP请求报文包括起始行、报文头部和报文主体三部分,其中,起始行中URL(Uniform Resoure Locator:统一资源定位器)的后缀标识符可以用于表示服务器响应于该HTTP请求报文,向客户端返回的响应报文的类型,因此报文信息提取装置可以在获取客户端发送的HTTP请求报文后,查找到该HTTP请求报文中起始行的URL,并判断该URL的后缀标识符是否为html(HyperText Mark-up Language,超文本标记语言)。当该HTTP请求报文中起始行的URL的后缀标识符为html时,表示服务器响应于该请求报文,向客户端返回的响应报文中可能包括纯文本内容,此时报文信息提取装置可以获取服务器响应于该HTTP请求报文,向客户端返回的HTTP响应报文。需要注意的是:当该报文信息提取装置为路由器或交换机时,由于客户端与服务器进行报文交互采用会话流的形式,因此报文信息提取装置可以很容易地区分出各个请求报文与各个响应报文之间的对应关系,从而可以准确地获取可能包括纯文本内容的响应报文。当该报文信息提取装置并非路由器或交换机时,报文信息提取装置可以在获取客户端发送的请求报文以及服务器发送的响应报文的同时,获取客户端的IP(Internet Protocol,网络协议)地址以及服务器的IP地址,从而根据客户端和服务器的IP地址来确定各个请求报文与各个响应报文之间的对应关系,进而准确地获取可能包括纯文本内容的响应报文。步骤202、过滤掉响应报文中不包括目标信息的响应报文。在本专利技术的优选实施例中,由于服务器向客户端返回的网页响应报文中包括用于表示响应报文中的内容是否为纯文本的标识符,因此报文提取装置可以根据响应报文中用于表示该响应报文中内容是否为纯文本的标识符,判
断响应报文中的内容是否为纯文本。本实施例中报文信息提取装置在提取目标信息时,只针对肯定包括纯文本内容的响应报文提取目标信息,由此可以提高管理员获取网络监控信息的速度。需要注意的是:本实施例中响应报文中的内容可以是指响应报文的部分内容或者全部内容。例如,当用户基于HTTP协议通过客户端访问服务器上的网页时,由于HTTP响应报文的报文头中的内容类型Content-Type字段可以用于本文档来自技高网
...

【技术保护点】
一种报文信息提取方法,其特征在于,所述方法包括:获取服务器响应于客户端发送的请求报文,向所述客户端返回的响应报文;过滤掉所述响应报文中不包括目标信息的响应报文;从未过滤掉的响应报文中提取所述目标信息。

【技术特征摘要】
1.一种报文信息提取方法,其特征在于,所述方法包括:获取服务器响应于客户端发送的请求报文,向所述客户端返回的响应报文;过滤掉所述响应报文中不包括目标信息的响应报文;从未过滤掉的响应报文中提取所述目标信息。2.根据权利要求1所述的方法,其特征在于,在获取服务器响应于客户端发送的请求报文,向所述客户端返回的响应报文之前,所述方法还包括:获取所述客户端发送的请求报文;根据所述请求报文中用于表示所述服务器响应于所述请求报文,向所述客户端返回的响应报文的类型的标识符,判断所述服务器响应于所述请求报文,向所述客户端返回的响应报文中是否可能包括纯文本内容;所述获取服务器响应于客户端发送的请求报文,向所述客户端返回的响应报文包括:当所述服务器响应于所述请求报文,向所述客户端返回的响应报文中可能包括纯文本内容时,获取所述服务器响应于所述请求报文,向所述客户端返回的响应报文。3.根据权利要求2所述的方法,其特征在于,所述根据所述请求报文中用于表示所述服务器响应于所述请求报文,向所述客户端返回的响应报文的类型的标识符,判断所述服务器响应于所述请求报文,向所述客户端返回的响应报文中是否可能包括纯文本内容包括:判断所述请求报文中统一资源定位符URL的后缀标识符是否表示所述服务器响应于所述请求报文,向所述客户端返回的响应报文中可能包括纯文本内容;所述当所述服务器响应于所述请求报文,向所述客户端返回的响应报文中包括纯文本内容时,获取所述服务器响应于所述请求报文,向所述客户端
\t返回的响应报文包括:若所述请求报文中URL的后缀标识符表示所述服务器响应于所述请求报文,向所述客户端返回的响应报文中可能包括纯文本内容,获取所述服务器响应于所述请求报文,向所述客户端返回的响应报文。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述过滤掉所述响应报文中不包括目标信息的响应报文包括:根据所述响应报文中用于表示所述响应报文中内容是否为纯文本的标识符,判断所述响应报文中的内容是否为纯文本;若是,则表示所述响应报文中包括所述目标信息,不过滤掉所述响应报文;否则表示所述响应报文中不包括所述目标信息,过滤掉所述响应报文。5.根据权利要求4所述的方法,其特征在于...

【专利技术属性】
技术研发人员:王奇
申请(专利权)人:杭州迪普科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1