一种文件检测的方法与设备技术

技术编号:13638396 阅读:30 留言:0更新日期:2016-09-03 03:29
本申请的目的是提供一种文件检测的方法与设备。与现有技术相比,本申请通过获取待检测文件,并抽取所述待检测文件中的内容信息,将所述内容信息与预设的策略进行匹配,得到匹配结果,若所述匹配结果为匹配成功,执行策略触发动作。本申请采用预设策略对待检测文档的内容信息进行检测,实现了只检测待检测文档中的内容信息,避免了对内容载体的加密处理,提高了企业的运行效率。同时,若待检测文件中的内容信息与预设的策略匹配,则执行策略触发动作,即对窃取企业机密数据的行为进行报警和阻断,可使得企业的机密数据、信息得到有效的保护。

【技术实现步骤摘要】

本申请涉及计算机领域,尤其涉及一种文件检测的技术。
技术介绍
企业机密数据、信息被盗一直是一个令企业担忧的问题。目前,为了解决企业数据通过无线网络、USB等存储设备泄密的问题,一些安全厂商提出了一些解决方案,虽然起到了一定的防护作用,但是也存在很大的漏洞与不足:(1)物理隔绝技术:有些企业不提供上网环境,有线网络、无线WiFi等都不允许私自使用。PC端直接封堵或者拆除USB接口。但是,这样一来,各种网络资源得不到员工的充分利用,USB接口的封堵也限制了其他USB设备的使用,给员工的正常工作带来了一些麻烦,同时也降低了工作的效率。(2)文件加密技术:有些企业采用加解密技术,对某一类型的文档进行统一加密,例如财务部门可能会把所有的excel文件进行加密、创作部门可能会把所有的word文件进行加密。这样员工窃取加密后的文件也不能使用。这种技术的缺点在于一刀切,要么word文档全部加密、要么不加密。而且,这样导致员工的普通word文档也遭到强制加密,给员工日常生活的文件传输带来了困扰。另外,文件统一加密的缺陷也是很明显的,员工很容易将一个文件的内容转换为其他格式的文件从而逃避加密处理。无论是物理隔绝技术还是文件加密技术,都在实际使用中存在有极大的弊端与麻烦,其不能既防护企业机密数据、信息被盗,又能不影响员工的日常工作、降低其工作效率。
技术实现思路
本申请的一个目的是提供一种文件检测的方法和设备。根据本申请的一个方面,提供了一种文件检测的方法,其中,该方法包括:获取待检测文件,并抽取所述待检测文件中的内容信息;将所述内容信息与预设的策略进行匹配,得到匹配结果;若所述匹配结果为匹配成功,则执行策略触发动作。根据本申请的另一个方面,提供了一种文件检测的设备,其中,该设备包括:第一装置,用于获取待检测文件,并抽取所述待检测文件中的内容信息;第二装置,用于将所述内容信息与预设的策略进行匹配,得到匹配结果;第三装置,用于当若所述匹配结果为匹配成功时,则执行策略触发动作。与现有技术相比,本申请通过获取待检测文件,并抽取所述待检测文件中的内容信息,将所述内容信息与预设的策略进行匹配,得到匹配结果,若所述匹配结果为匹配成功,执行策略触发动作。本申请采用预设策略对待检测文档的内容信息进行检测,实现了只检测待检测文档中的内容信息,避免了对内容载体的加密处理,提高了企业的运行效率。同时,若待检测文件中的内容信息与预设的策略匹配,则执行策略触发动作,即对窃取企业机密数据的行为进行报警和阻断,可使得企业的机密数据、信息得到有效的保护。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1示出根据本申请一个方面的一种文件检测的方法流程图;图2示出根据本申请一个优选实施例的一种文件检测的方法流程图;图3示出根据本申请另一个方面的一种文件检测的设备示意图;图4示出根据本申请一个优选实施例的一种文件检测的设备示意图。附图中相同或相似的附图标记代表相同或相似的部件。具体实施方式下面结合附图对本申请作进一步详细描述。在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。图1示出根据本申请一个方面的一种文件检测的方法流程图,其中,该方法包括步骤S11、步骤S12和步骤S13。具体地,在步骤S11中,设备1获取待检测文件,并抽取所述待检测文件中的内容信息;在步骤S12中,设备1将所述内容信息与预设的策略进行匹配,得到匹配结果;在步骤S13中,若所述匹配结果为匹配成功,设备1则执行策略触发动作。在此,所述设备1包括但不限于用户设备、网络设备、或用户设备与网络设备通过网络相集成所构成的设备。所述用户设备其包括但不限于计算机、触控终端等。其中,所述网络设备包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限
于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。所述网络设备其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。优选地,设备1还可以是运行于所述用户设备、网络设备、或用户设备与网络设备、网络设备、触摸终端或网络设备与触摸终端通过网络相集成所构成的设备上的脚本程序。当然,本领域技术人员应能理解上述设备1仅为举例,其他现有的或今后可能出现的设备1如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。在步骤S11中,设备1获取待检测文件,并抽取所述待检测文件中的内容信息。例如,设备1通过网关分析FTP、http、smtp、pop3、smb等协议获取待检测的原始文件A和描述原始文件的文件B,其中,所获取的原始文件A包括word文件、excel文件、PowerPoint文件、PDF文件、xml文件、html文件、图片文件、7z文件、rar文件和zip文件;描述原始文件的文件B中含有文件协议、源/目的IP和端口号、文件大小、文件类型和原始文件路径等信息。获取所述待检测文件后,从所获取的原始文件A中抽取内容信息。优选地,在步骤S11中,设备1获取用户上传、下载或者复制到存储介质中的文件。例如,设备1通过网关分析、抓取用户上传至网络中的文件、从网络上下载的文件,或者通过信息获取技术(例如hook)抓取用户复制到U盘、硬盘等USB存储介质中文件,对所抓取的文件进行检测,以免用户利用此种机会将企业机密信息窃取之。优选地,抽取的内容信息为所述待检测文件中的所有文本信息,即在步骤S11中,设备1抽取所述待检测文件中的所有文本信息。例如,设备1抽取通过网关分析、抓取的用户上传至网络中或者从网络中下载的word文件、excel文件、PowerPoint文件、PDF文件、x本文档来自技高网
...

【技术保护点】
一种文件检测的方法,其中,该方法包括:获取待检测文件,并抽取所述待检测文件中的内容信息;将所述内容信息与预设的策略进行匹配,得到匹配结果;若所述匹配结果为匹配成功,则执行策略触发动作。

【技术特征摘要】
1.一种文件检测的方法,其中,该方法包括:获取待检测文件,并抽取所述待检测文件中的内容信息;将所述内容信息与预设的策略进行匹配,得到匹配结果;若所述匹配结果为匹配成功,则执行策略触发动作。2.根据权利要求1所述的方法,其中,获取待检测文件,包括:获取用户上传、下载或者复制到存储介质中的文件。3.根据权利要求1所述的方法,其中,抽取所述待检测文件中的内容信息,包括:抽取所述待检测文件中的所有文本信息。4.根据权利要求1至3中任一项所述的方法,其中,所述策略包括策略级别以及至少一项策略内容;将所述内容信息与预设的策略进行匹配,得到匹配结果,包括:按照策略级别由高至低,将所述内容信息依次与预设的策略中的策略内容进行匹配,若匹配成功,则得到匹配结果;否则,与下一策略级别的策略中的策略内容进行匹配。5.根据权利要求4所述的方法,其中,所述策略内容至少包括关键字、结构化信息、文件指纹和机器学习模型中的任一项。6.根据权利要求5所述的方法,其中,该方法还包括:通过训练样本文件更新所述文件指纹和机器学习模型。7.根据权利要求1所述的方法,其中,所述执行策略触发动作至少包括记录日志、发送报警信息和阻断网络中的任一项。8.一种文件检测的设备,其中,该设备...

【专利技术属性】
技术研发人员:李梦雅王志龙石印
申请(专利权)人:上海上讯信息技术股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1