【技术实现步骤摘要】
一种网络数据监测方法
本专利技术涉及互联网
,具体涉及一种网络数据监测方法。
技术介绍
文本分类是指对文本按照一定的分类体系或者标准进行自动分类标记,文本分类包括了文本的表达、分类器的选择与训练、分类结果的评价与反馈等过程。信息作为一种资源,它的普遍性、共享性、增值性、可处理性和多效用性,使其对于人类具有特别重要的意义。信息安全的实质就是要保护信息系统或信息网络中的信息资源免受各种类型的威胁、干扰和破坏,即保证信息的安全性。根据国际标准化组织的定义,信息安全性的含义主要是指信息的完整性、可用性、保密性和可靠性。信息安全是任何国家、政府、部门、行业都必须十分重视的问题,是一个不容忽视的国家安全战略。对于不同的部门和行业来说,其对信息安全的要求和重点却是有区别的。对于一个企业来说,如果发生未公开信息或者方案遭到泄密对一个企业来说是存在很大的隐患的,因此在信息加密以及信息监控方面需要不断去开发新技术,以应对不同企业的不同需求,保证信息安全。中国专利,公开号:CN104539624A,公开日:2015年4月22日,公开了一种文本中号码信息的安全监测方法及装置,本专利 ...
【技术保护点】
1.一种网络数据监测方法,其特征在于:该方法包括以下几个步骤;步骤1:待识别的文本数据获取并预处理;步骤2:搭建无语义字符库和冷僻字符库以及冷僻字符搭配表,设定冷僻字符以及无字符出现的次数阀值N;步骤3:遍历预处理后的文本,记录冷僻字符出现次数A以及与冷僻字符相邻的无语义字符数B;步骤4:制定警告规则,提示网络监管。
【技术特征摘要】
1.一种网络数据监测方法,其特征在于:该方法包括以下几个步骤;步骤1:待识别的文本数据获取并预处理;步骤2:搭建无语义字符库和冷僻字符库以及冷僻字符搭配表,设定冷僻字符以及无字符出现的次数阀值N;步骤3:遍历预处理后的文本,记录冷僻字符出现次数A以及与冷僻字符相邻的无语义字符数B;步骤4:制定警告规则,提示网络监管。2.根据权利要求1所述的一种网络数据监测方法,其特征在于:所述步骤1包括:步骤11:网络文本数据的获取;步骤12:对获取到的网络文本数据进行分词处理,对文本中的无语义字符和冷僻字符进行提取和分类。3.根据权利要求1所述的一种网络数据监测方法,其特征在于:所述步骤2包括:步骤21:建立无语义字符库和冷僻字符库,搭建冷僻字符搭配表,将与冷僻字相邻的一定字符长度的字符串制定一个字符串集合,以冷僻字作为搜索核心目标进行匹配;步骤22:设定文本中的字符遍历相同字符出现的次数阀值,用以制定警告,提示需要网络监管。4.根据权利要求1所述的一种网络数据监测方法,其特征在于:所述步骤3包括:步骤31:对文本进行特征提取,将冷僻字符和无语义字符进行类别识别;步骤32:分别遍历无语义字符以及冷僻字符,通过与无语义字符库和冷僻字符库的对照,记录无语义字符以及冷僻字符出现的次数。5.根据权利要求1所述的一种网络数据监测方法,其特征在于:所述步骤4包括:步骤41:统计遍历整篇文本的冷僻字符出现次数A和冷僻字符相邻的无语义字符数B,与设定值N进行对比;步骤42:判定:若A>=N,则剔除整篇文档的无语义字符,将剔除无语...
【专利技术属性】
技术研发人员:徐宏,金鑫,胡遨洋,金海松,花志伟,张振威,杨泰,刘书涵,张杰,商杰,吴蓓佳,张超,
申请(专利权)人:国网浙江桐乡市供电有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。