特征匹配方法和装置制造方法及图纸

技术编号:6539020 阅读:182 留言:0更新日期:2012-04-11 18:40
本发明专利技术实施例涉及一种特征匹配方法和装置,其中,该特征匹配方法包括:根据已学习的历史特征数据集合,对接收到的输入数据进行特征匹配;若所述历史特征数据集合中存在与所述输入数据全部匹配的历史特征数据,则根据与所述输入数据匹配的历史特征数据获取匹配结果;若所述历史特征数据集合中不存在与所述输入数据全部匹配的历史特征数据,则将所述输入数据的全部或部分发送至匹配引擎进行特征匹配。本发明专利技术实施例将输入数据与已学习的历史特征数据集合进行比较,如果历史特征数据集合中存在全部匹配的历史特征数据,可以直接得到匹配结果,降低了访问特征库的频率,提高了匹配速度和效率。

【技术实现步骤摘要】

本专利技术实施例涉及通信
,特别涉及一种特征匹配方法和装置
技术介绍
随着互联网的飞速发展,网络的业务种类越来越多,新业务层出不穷且越来越复杂,新问题也越来越多。例如在网络控制和带宽管理方面,P2P业务占据了 70%的网络带宽资源,有的甚至是对网络带宽的恶意占用,严重影响了用户的体验;在网络安全方面,网络入侵和攻击越来越多的集中在应用层,普通的防火墙对于藏身于IP包净荷之中的病毒传播、攻击作用较弱;另外,运营商为了避免沦为“管道商”的尴尬,还有按内容计费的需求。为了解决这些问题,需要对网络上的数据包应用层内容进行识别,从而产生了深度包检测(De印Packet Inspection ;简称DPI)技术。DPI技术为对不同业务的应用层内容进行分析,提取出能唯一区别某个业务的特征规则;将网络上的数据包与该特征规则进行匹配,如果匹配成功,则可以识别出该业务,进而执行与该业务对应的操作。现有的DPI 技术中,当匹配引擎接收到网络数据包时,将网络数据包的一部分(或全部)数据与特征库中的数据结构进行匹配。特征库的数据量大,一般存储在片外。专利技术人在实现本专利技术的过程中发现现有技术至少存在如下问题匹配引擎接收到重复的网络数据包时,匹配操作重复,访问特征库的动作频繁,造成匹配速度慢、效率低。
技术实现思路
本专利技术实施例提供一种特征匹配方法和装置,用以解决现有特征匹配速度慢、效率低的问题,提高匹配速度和效率。本专利技术实施例提供一种特征匹配方法,包括根据已学习的历史特征数据集合,对接收到的输入数据进行特征匹配;若所述历史特征数据集合中存在与所述输入数据全部匹配的历史特征数据,则根据与所述输入数据匹配的历史特征数据获取匹配结果;若所述历史特征数据集合中不存在与所述输入数据全部匹配的历史特征数据,则将所述输入数据的全部或部分发送至匹配引擎进行特征匹配。本专利技术实施例又提供一种特征匹配装置,包括记忆分拣单元和匹配引擎;所述记忆分拣单元包括数据集匹配模块和判决模块;所述数据集匹配模块,用于根据已学习的历史特征数据集合,对接收到的输入数据进行特征匹配;所述判决模块,用于若所述历史特征数据集合中存在与所述输入数据全部匹配的历史特征数据,则根据与所述输入数据匹配的历史特征数据获取匹配结果;若所述历史特征数据集合中不存在与所述输入数据全部匹配的历史特征数据,则将所述输入数据的全部或部分发送至所述匹配引擎进行特征匹配;所述匹配引擎,用于根据特征库中对接收到的输入数据进行特征匹配。本专利技术实施例提供的特征匹配方法和装置,将输入数据与已学习的历史特征数据集合进行比较,如果历史特征数据集合中存在全部匹配的历史特征数据,可以直接得到匹配结果,降低了访问特征库的频率,提高了匹配速度和效率。附图说明图1为本专利技术特征匹配方法第一实施例的流程示意图;图加为本专利技术特征匹配方法第二实施例的流程示意图;图2b为本专利技术特征匹配方法第二实施例的应用场景的示意图;图3a为本专利技术特征匹配方法第三实施例的流程示意图;图北为本专利技术特征匹配方法第三实施例的应用场景的示意图;图4为本专利技术特征匹配装置第一实施例的结构示意图;图5为本专利技术特征匹配装置第一实施例的示意图。具体实施例方式下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。图1为本专利技术特征匹配方法第一实施例的流程示意图,如图1所示,该特征匹配方法包括步骤101、根据已学习的历史特征数据集合,对接收到的输入数据进行特征匹配;在执行步骤101之前,可以接收并学习所述匹配引擎发送的历史特征数据及其对应的匹配结果,具体地匹配引擎根据特征库中规则对输入数据进行特征匹配后,如果匹配成功,可以将该输入数据对应的与特征库中规则相匹配的特征数据和匹配结果发送给记忆分拣单元。记忆分拣单元接收到已经匹配成功的特征数据和匹配结果后,可以将该特征数据保存为历史特征数据,并保存该历史特征数据对应的匹配结果。其中,记忆分拣单元将历史特征数据保存到历史特征数据集合中时,可以采用一定的算法,例如哈希(hash)算法或直接映射等方法进行保存,然后可以根据一定的规则定期更新历史特征数据集合,例如 如果用hash算法建立历史特征数据集合,在出现hash冲突时,可以用新的hash表项代替旧的hash表项,完成历史特征数据集合的更新;或者也可以采用其他的规则,例如最近最不经常使用规则等,更新历史特征数据集合。后续的处理过程中,记忆分拣单元接收到输入数据后,与先前学习到的与特征库中规则相匹配的历史特征数据进行比较。其中,特征库是用一定数据结构表示的特征集,包括大量的数据结构。匹配引擎可以包含一个或多个串行或并行的子匹配引擎。当匹配引擎接收到输入数据时,逐次取出输入数据的一部分或全部与特征库中的数据结构进行匹配, 当输入数据与表示某个特征的数据结构匹配上时,可以输出匹配到的特征。如果输入数据在特征库没有匹配上任何特征,则可以输出未匹配信息。步骤102、若所述历史特征数据集合中存在与所述输入数据全部匹配的历史特征数据,则根据与所述输入数据匹配的历史特征数据获取匹配结果;如果输入数据与历史特征数据集合中的某条历史特征数据完全相同(即两者全部匹配),则记忆分拣单元可以直接将该历史特征数据对应的匹配结果作为当前输入数据的匹配结果,当前输入数据不需要再送给匹配引擎进行匹配,可以直接将该匹配结果发送给结果管理模块进行处理,确定最终的输出结果。例如如果输入数据为统一资源定位符 (URL),该URL与历史特征数据集合中的某条已有的URL全部匹配,则可以将该已有的URL 对应的匹配结果作为当前输入的URL的匹配结果;如果输入数据为字符串,该字符串与历史特征数据集合中的某条已有的字符串全部匹配,则可以将该已有的字符串对应的匹配结果作为当前输入的字符串的匹配结果。步骤103、若所述历史特征数据集合中不存在与所述输入数据全部匹配的历史特征数据,则将所述输入数据的全部或部分发送至匹配引擎进行特征匹配。其中,历史特征数据集合中不存在与输入数据全部匹配的历史特征数据具体可以包括历史特征数据集合中的任意一条历史特征数据与输入数据全部不匹配,此时,可以直接将该输入数据发送至匹配引擎进行特征匹配;或者虽然历史特征数据集合中没有与输入数据全部匹配的历史特征数据,但有与输入数据部分匹配的历史特征数据,此时记忆分拣单元可以将所述输入数据中未匹配的部分发送至匹配引擎进行特征匹配并通知匹配引擎从特征库中开始匹配的位置;匹配引擎可以按照该从特征库开始匹配的位置对输入数据未匹配成功的部分进行匹配,无需对全部的输入数据进行匹配,从而可以提高匹配速度。其中,匹配引擎可以由一个或多个串行或并行的匹配子引擎组成,每个匹配子引擎访问特征库,根据特定的算法确定输入数据中需要匹配的部分是否能够匹配上特征库中的规则。如果匹配上了,则一方面将输入数据的部分或全部及匹配结果返回给记忆分拣单元,记录到历史特征数据集合中,一方面将匹配结果发送给结果管理模块。结果管理模块则可以根据接收到的记忆分拣单元和匹配引擎的匹配结果,采用特定的规则进行处理,确定最终的输出结果ο进一步地,步骤103可以包括以下示例示例一、所述输入数据为统一资源定位符(URL),所述统一资源定位符包括主机名 (host)禾口路径(path) ο若所述历史特征本文档来自技高网...

【技术保护点】
1.一种特征匹配方法,其特征在于,包括:根据已学习的历史特征数据集合,对接收到的输入数据进行特征匹配;若所述历史特征数据集合中存在与所述输入数据全部匹配的历史特征数据,则根据与所述输入数据匹配的历史特征数据获取匹配结果;若所述历史特征数据集合中不存在与所述输入数据全部匹配的历史特征数据,则将所述输入数据的全部或部分发送至匹配引擎进行特征匹配。

【技术特征摘要】
1.一种特征匹配方法,其特征在于,包括根据已学习的历史特征数据集合,对接收到的输入数据进行特征匹配; 若所述历史特征数据集合中存在与所述输入数据全部匹配的历史特征数据,则根据与所述输入数据匹配的历史特征数据获取匹配结果;若所述历史特征数据集合中不存在与所述输入数据全部匹配的历史特征数据,则将所述输入数据的全部或部分发送至匹配引擎进行特征匹配。2.根据权利要求1所述的特征匹配方法,其特征在于,所述输入数据为统一资源定位符,所述统一资源定位符包括主机名和路径,所述若所述历史特征数据集合中不存在与所述输入数据全部匹配的历史特征数据,则将所述输入数据的全部或部分发送至匹配引擎进行特征匹配,包括若所述历史特征数据集合中的历史特征数据与所述主机名和路径全部不匹配,则将所述主机名和路径发送至匹配引擎进行特征匹配; 或者,若所述历史特征数据集合中存在与所述主机名全部匹配的历史特征数据,将所述路径发送至匹配引擎进行特征匹配;或者在存在与所述路径为部分匹配的历史特征数据时,将所述路径的未匹配的部分发送至匹配引擎进行特征匹配;或者将主机名和所述路径发送至匹配引擎进行特征匹配。3.根据权利要求1所述的特征匹配方法,其特征在于,所述输入数据为字符串,所述若所述历史特征数据集合中不存在与所述输入数据全部匹配的历史特征数据,则将所述输入数据的全部或部分发送至匹配引擎进行特征匹配,包括若所述历史特征数据集合中的历史特征数据与所述字符串全部不匹配,则将所述字符串发送至匹配引擎进行特征匹配;或者,若所述历史特征数据集合中不存在与所述字符串全部匹配的历史特征数据,但存在与所述字符串部分匹配的历史特征数据,则将所述字符串发送至匹配引擎进行特征匹配;或者将所述字符串未匹配的部分发送至匹配引擎进行特征匹配。4.根据权利要求1-3任一所述的特征匹配方法,其特征在于,还包括 接收并学习所述匹配引擎发送的历史特征数据及其对应的匹配结果。5.一种特征匹配装置,其特征在于,包括记忆分拣单元和匹配引擎;所...

【专利技术属性】
技术研发人员:阳生丙曾佳周咸春王晓波
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:94

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1