【技术实现步骤摘要】
一种基于浏览器的网站上传拦截方式与系统
[0001]本专利技术涉及网络安全
,特别涉及一种基于浏览器的网站上传拦截方法和系统。
技术介绍
[0002]大数据时代,计算机网络应用范围进一步扩展,现在每年储存各类数据的数据量正在接近EB量级。各类数据的传播给人们生活、工作带来了极大便利,同时也带来了安全隐患。
[0003]网络信息面临着损坏、窃取、泄露和篡改等威胁,这严重影响信息安全,对国家、企业和个人信息构成巨大威胁。现有网络信息防护措施较为传统,不能适应大数据时代的信息防护要求。为提高网络信息安全,需针对现有网络信息防护特点,提出具有针对性的防护措施,为计算机网络信息安全构筑起安全体系。
技术实现思路
[0004]本专利技术提供了一种基于浏览器的网站上传拦截方式,用以解决非法网站上传拦截问题:
[0005]本专利技术提出的一种基于浏览器的网站上传拦截方法,所述方法过程包括:
[0006]S1、管理系统设置需要拦截的信息,存入后台数据库系统,生成风险管理系统数据库;
[0007]S2、浏览器监控用户上传的信息,提取所述用户上传的信息的特征和关键词得到用户上传信息特征,并与所述风险管理系统数据库中的特征和/或关键词进行匹配得到匹配结果;
[0008]S3、管理系统根据匹配结果决定是否拦截,并将经常被拦截的用户加入关注列表。
[0009]进一步的,一种基于浏览器的网站上传拦截方式,管理系统设置需要拦截的信息,存入后台数据库系统,生成风险管理系统数据库;包 ...
【技术保护点】
【技术特征摘要】
1.一种基于浏览器的网站上传拦截方法与系统,其特征在于,所述方法包括:S1、管理系统设置需要拦截的信息,存入后台数据库系统,生成风险管理系统数据库;S2、浏览器监控用户上传的信息,提取所述用户上传的信息的特征和关键词得到用户上传信息特征,并与所述风险管理系统数据库中的特征和/或关键词进行匹配得到匹配结果;S3、管理系统根据匹配结果决定是否拦截,并将经常被拦截的用户加入关注列表。2.根据权利要求1所述的一种基于浏览器的网站上传拦截方式,其特征在于,所述管理系统设置需要拦截的信息,存入后台数据库系统,生成风险管理系统数据库,包括:S101、管理系统设置需要拦截的信息特征和关键词,生成文件特征管理目录;所述文件特征管理目录包括关键词和图片特征,所述关键词包括与关键词本身和与关键词类似含义的词语和/或汉语拼音;将所述图片特征根据图片的内容分不同的风险等级;S102、管理系统设置网络域名的白名单,将所述白名单放入网络域名管理目录;S103、管理系统将文件特征管理目录和网络域名管理目录存入数据库系统,得到风险管理系统数据库,并定期更新风险管理系统数据库。3.根据权利要求1所述的一种基于浏览器的网站上传拦截方式,其特征在于,所述浏览器监控用户上传的信息,提取所述用户上传的信息的特征和关键词得到用户上传信息特征,并与所述风险管理系统数据库中的特征和/或关键词进行匹配得到匹配结果,包括:S201、浏览器实时监控用户上传信息并识别用户上传信息类型;所述用户上传信息类型包括网络域名、文字、图片和声音视频文件;S202、管理系统根据用户上传信息类型进行特征提取得到不同类别的信息特征;其中不同类别信息特征包括用户图片特征、用户文字信息和域名信息;管理系统提取声音文件转化为用户文字信息,提取每帧视频文件图片信息和文字得到用户图片特征和用户文字信息,直接提取网络域名得到域名信息;S203、将所述不同类别的信息特征,分别与后台所述风险管理系统数据库中相应类别内的特征进行匹配;其中域名信息直接与所述风险管理系统数据库中的网络域名进行匹配,用户文字信息与风险管理系统数据库中的关键词进行匹配;用户图片特征与风险管理系统数据库中的图片特征进行匹配;S204、利用余弦相似度计算所述用户图片特征与后台所述风险管理系统数据库中的图片特征进行比对,选择相似度最高的值作为最终的余弦相似度;其中,所述用户文字信息与风险管理系统数据库中的关键词进行匹配,步骤包括:S2031、将用户文字信息去除标点符号、乱码、特殊字符和空格,然后按照词性进行切分,得到切分后的词组;S2032、选择用户文字信息中首个切分后的词组作为基准词组与风险管理系统数据库中的关键词进行匹配;S2033、将基准词组和基准词作左右相邻的词组组合起来得到新的基准词组再与风险管理系统中的关键词进行匹配;S2034、重复S2033最多两次;S2035、通过上述步骤,如果用户上传信息没有包含风险管理系统数据库中的关键词,选择接下来一组切分后的词组作为基准词组重新进行步骤S2032、S2033和S2034;直到完成
所有词组的匹配;S2036、通过完成用户上传信息所有词组匹配后,没有发现用户文字信息包含管理系统数据库中的关键词,则将关键词拆分成关键字,并将用户文字信息匹配所述关键字;S2037、如果用户上传信息中包含所有的关键字,则计算用户信息中匹配到的关键字之间的步长,如果关键字之间的步长大于两个字符,则判定用户文字信息中不包含风险管理系统数据库中的关键词;如果关键字之间的步长小于或等于两个字符,则管理系统标记包含关键字的字段并发送提醒给后台终端。4.根据权利要求1、2或3所述的一种基于浏览器的网站上传拦截方式,其特征在于,管理系统根据匹配结果决定是否拦截,并将经常被拦截的用户加入关注列表,包括:S301、如果用户上传域名信息与风险管理系统数据库中的任意一个网络域名相同,则允许上传;如果用户上传域名信息与险管理系统数据库中的任意一个网络域名都不相同,则拦截上传域名信息;S302、如果用户文字信息包含所述风险管理系统数据库中的关键词,则拦截上传;反之则允许上传;S303、如果提取到的用户上传的图片特征与风险管理系统数据库中的图片最终的余弦相似度大于0.75+
△
,则拦截用户上传信息,如果余弦相似度在0.5+
△
到0.75+
△
之间,则管理系统发送给后台终端判定是否拦截,如果后台终端反馈信号为拦截信号,则管理系统将此用户上传的图片特征加入风险管理数据库系统;如果余弦相似度在0.5+
△
以下,同时图片中没有包含文字信息和/或提取到的文字信息不包含所述风险管理系统数据库中的关键词,则允许上传;所述
△
根据图片特征对应的风险等级确定,其中,
△
范围为
‑
0.1到0.1;S304、对于被拦截的用户行为记录,管理系统将发出警报并将告警信息存档,告警信息中包括此次用户登录的IP地址、使用时间以及相关操作行为数据,如果同一用户在预定时间段内大...
【专利技术属性】
技术研发人员:许祯,
申请(专利权)人:数影星球杭州科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。