一种文件的监控方法、装置及系统制造方法及图纸

技术编号:10660939 阅读:93 留言:0更新日期:2014-11-19 20:19
本申请公开了一种文件的监控方法、装置及系统,用以解决现有技术中由于监控粒度较粗而出现的对文件约束过紧,或敏感文件泄露风险较大的问题。该方法确定文件中包含的各特征词,以及各特征词所在的敏感词库,并根据预设的每个敏感词库对应的敏感程度权值以及各特征词在该文件中出现的次数,确定该文件的敏感等级,根据该文件的敏感等级对该文件进行监控。由于上述方法除了可以判断一个文件是否为敏感文件以外,还可确定其敏感等级,并根据确定的敏感等级对该文件进行监控,因此实现了对文件的细粒度监控,避免了对敏感文件的约束过紧,而且,由于上述方法无需用户自行判断其是否为敏感文件,因此也降低了敏感文件泄露的风险。

【技术实现步骤摘要】
【专利摘要】本申请公开了一种文件的监控方法、装置及系统,用以解决现有技术中由于监控粒度较粗而出现的对文件约束过紧,或敏感文件泄露风险较大的问题。该方法确定文件中包含的各特征词,以及各特征词所在的敏感词库,并根据预设的每个敏感词库对应的敏感程度权值以及各特征词在该文件中出现的次数,确定该文件的敏感等级,根据该文件的敏感等级对该文件进行监控。由于上述方法除了可以判断一个文件是否为敏感文件以外,还可确定其敏感等级,并根据确定的敏感等级对该文件进行监控,因此实现了对文件的细粒度监控,避免了对敏感文件的约束过紧,而且,由于上述方法无需用户自行判断其是否为敏感文件,因此也降低了敏感文件泄露的风险。【专利说明】一种文件的监控方法、装置及系统
本申请涉及通信
,特别涉及一种文件的监控方法、装置及系统。
技术介绍
电子信息技术的发展为企业办公带来了极大的便利,大大提高了工作效率,但同 时也增加了重要文件泄露的风险。许多机构(如政府、企业、军队等)内部都有大量的敏感文 件不能泄露到外部,但是,机构内部的工作人员可能有意或无意的将敏感文件泄露出去。 在现有技术中,主要采用以下两种方法避免敏感文件的泄露: 第一种、预先在系统中保存敏感词,针对存储的文件,判断该文件中是否存在预设 的敏感词,若是,则确定该文件为敏感文件,根据预设的策略对该文件进行监控,否则,确定 该文件为非敏感文件,不对该文件进行监控。 第二种、用户针对待上传的文件,设置该文件是否为敏感文件,若设置为敏感文 件,则还可设置该文件的访问权限,将该待上传的文件以及相应的设置信息上传到系统保 存,系统根据该文件的设置信息对该文件进行监控。 但是,在现有技术的第一种方法中,系统对于一个文件只能判断其是或不是敏感 文件,并根据判断结果和预设策略对其进行监控,因此监控粒度较粗,很容易出现约束过紧 的问题。而现有技术的第二种方法则需要用户自身具有判断一个文件是否为敏感文件的能 力,一旦用户判断错误,就会造成敏感文件的泄露。
技术实现思路
本专利技术实施例提供一种文件的监控方法、装置及系统,用以解决现有技术中由于 监控粒度较粗而出现的对文件约束过紧,或敏感文件泄露风险较大的问题。 本专利技术实施例提供的一种文件的监控方法,包括: 代理服务器接收上传的文件;并 对所述文件进行分词处理,得到所述文件中包含的各特征词;以及 针对每个特征词,根据预设的每个敏感词库中包含的特征词,确定该特征词所在 的敏感词库; 根据预设的每个敏感词库对应的敏感程度权值,以及各特征词在所述文件中出现 的次数,确定所述文件的敏感等级; 所述代理服务器将所述文件以及确定的所述文件的敏感等级发送给文件服务器 保存,用于使所述文件服务器根据所述文件的敏感等级监控所述文件。 本专利技术实施例提供的一种文件的监控方法,包括: 文件服务器接收并保存代理服务器发送的文件以及所述文件的敏感等级;并 根据针对所述文件的敏感等级预设的监控策略,对所述文件进行监控。 本专利技术实施例提供的一种文件的监控装置,包括: 接收模块,用于接收上传的文件; 分词模块,用于对所述文件进行分词处理,得到所述文件中包含的各特征词; 库确定模块,用于针对每个特征词,根据预设的每个敏感词库中包含的特征词,确 定该特征词所在的敏感词库; 等级确定模块,用于根据预设的每个敏感词库对应的敏感程度权值,以及各特征 词在所述文件中出现的次数,确定所述文件的敏感等级; 发送模块,用于将所述文件以及确定的所述文件的敏感等级发送给文件服务器保 存,用于使所述文件服务器根据所述文件的敏感等级监控所述文件。 本专利技术实施例提供的一种文件的监控装置,包括: 接收存储模块,用于接收并保存代理服务器发送的文件以及所述文件的敏感等 级; 监控模块,用于根据针对所述文件的敏感等级预设的监控策略,对所述文件进行 监控。 本专利技术实施例提供的一种文件的监控系统,包括: 代理服务器,用于接收上传的文件,对所述文件进行分词处理,得到所述文件中包 含的各特征词;针对每个特征词,根据预设的每个敏感词库中包含的特征词,确定该特征词 所在的敏感词库;根据预设的每个敏感词库对应的敏感程度权值,以及各特征词在所述文 件中出现的次数,确定所述文件的敏感等级;将所述文件以及确定的所述文件的敏感等级 发送给文件服务器; 所述文件服务器,用于接收并保存所述代理服务器发送的文件以及所述文件的敏 感等级,根据针对所述文件的敏感等级预设的监控策略,对所述文件进行监控。 本专利技术实施例提供一种文件的监控方法、装置及系统,该方法确定文件中包含的 各特征词,以及各特征词所在的敏感词库,并根据预设的每个敏感词库对应的敏感程度权 值以及各特征词在该文件中出现的次数,确定该文件的敏感等级,根据该文件的敏感等级 对该文件进行监控。由于上述方法除了可以判断一个文件是否为敏感文件以外,还可确定 其敏感等级,并根据确定的敏感等级对该文件进行监控,因此实现了对文件的细粒度监控, 避免了对敏感文件的约束过紧,而且,由于上述方法无需用户自行判断其是否为敏感文件, 因此也降低了敏感文件泄露的风险。 【专利附图】【附图说明】 图1为本专利技术实施例提供的文件监控过程; 图2为本专利技术实施例提供的第一种文件的监控装置结构示意图; 图3为本专利技术实施例提供的第二种文件的监控装置结构示意图; 图4为本专利技术实施例提供的文件的监控系统结构示意图。 【具体实施方式】 本专利技术实施例根据文件中包含的特征词确定文件的敏感等级,并根据敏感等级对 该文件进行监控,实现了对文件的细粒度监控,避免了对敏感文件的约束过紧,也降低了敏 感文件泄露的风险。 下面结合附图对本申请优选的实施方式进行详细说明。 图1为本专利技术实施例提供的文件监控过程,具体包括以下步骤: S101 :代理服务器接收上传的文件。 在本专利技术实施例中,机构内部的用户要将文件上传到该机构的文件服务器存储 时,可先通过安装在其终端上的客户端并使用其账号登录到系统,再将要上传的文件进行 上传。本专利技术实施例中在用户的终端与文件服务器之间预置一个代理服务器,当用户将文 件上传到文件服务器时,该文件先被代理服务器接收。 S102 :对该文件进行分词处理,得到该文件中包含的各特征词。 代理服务器接收到用户上传的文件后,对该文件进行分词处理,以得到该文件中 包含的各特征词。 具体的,代理服务器可先将接收到的文件转换为文本信息,再对转换的该文本信 息进行分词处理,得到该文本信息中包含的各分词,最后将得到的各分词中除预设的无用 词以外的分词确定为得到的特征词。 例如,代理服务器可先将接收到的各种格式的文件同一转换为.txt文本,再对转 换后的.txt文本进行分词处理,得到.txt文本中的各分词。假设预设的无用词包括"的"、 "地"、"个",则代理服务器将得到的各分词中除"的"、"地"、"个"这三个分词以外的分词确 定为接收到的文件中包含的特征词。 S103:针对每个特征词,根据预设的每个敏感词库中包含的特征词,确定该特征词 所在本文档来自技高网
...
一种文件的监控方法、装置及系统

【技术保护点】
一种文件的监控方法,其特征在于,包括:代理服务器接收上传的文件;并对所述文件进行分词处理,得到所述文件中包含的各特征词;以及针对每个特征词,根据预设的每个敏感词库中包含的特征词,确定该特征词所在的敏感词库;根据预设的每个敏感词库对应的敏感程度权值,以及各特征词在所述文件中出现的次数,确定所述文件的敏感等级;所述代理服务器将所述文件以及确定的所述文件的敏感等级发送给文件服务器保存,用于使所述文件服务器根据所述文件的敏感等级监控所述文件。

【技术特征摘要】

【专利技术属性】
技术研发人员:梁坤杨红张勇
申请(专利权)人:中国移动通信集团湖南有限公司
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1