一种数据鉴别分析方法技术

技术编号：27399131 阅读：15 留言：0更新日期：2021-02-21 14:10

本发明专利技术提供了一种基于垃圾邮件数据鉴别分析方法，该方法是基于垃圾邮件和正常邮件的通信行为对比得知，对邮件进行数据的收集，数据的收集是否采集到足够的有代表性的数据关系到最后的识别性能。通过对数据进行预处理，从原始邮件中提取邮件头信息，选取具有垃圾邮件可区分性的行为特征并进行处理。采用数据挖掘的方法对提取出来的行为特征向量集合进行模式挖掘并预测。模式挖掘并预测。模式挖掘并预测。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据鉴别分析方法

[0001]本专利技术涉及一种数据鉴别分析方法，属于互联网数据安全处理领域。

技术介绍

[0002]随着互联网的规模不断扩大以及上网用户的增加，电子邮件因为其方便、快捷、便宜等特点，成为人们的社会生活中越来越重要的一种通信方式，但是，我们的电子邮箱会经常收到一些不认识的人或地址发来的邮件，甚至这些邮件占了所收到邮件的大多数，这些邮件甚至还会带来病毒，是计算机中毒甚至瘫痪。所以垃圾邮件已经成为我们面临的安全问题。
[0003]正常的邮件发送都要遵循标准SMPT协议，按照协议规定的模式发送邮件。STMP协议的工作过程比较简单，易于模拟，同时也存在安全缺陷，通过伪造合法的服务器身份、合法的发件人地址等手段来欺骗邮件服务器。由垃圾邮件和正常邮件的通信鉴别对比得知，正确判别垃圾邮件的关键问题在于对邮件发生过程中的通信信息进行正确的识别。
[0004]反垃圾邮件占据相对较多的系统资源，所以一台平时负荷不大可以完全满足应用的邮件安全产品可能在邮件病毒爆发或垃圾邮件嫉妒泛滥时系统资源被占满这将导致自身防护不好的邮件安全产品甚至可能导致自身崩溃。
[0005]数据鉴别是指程序执行或用户操作过程中体现出的某种规律性，它通常反映了用户的身份和习惯。通过大量的实验指出，无论是程序的执行还是用户的行为，在系统特性上都呈现出紧密的相关性。数据鉴别分析能够在邮件传输代理通信阶段，针对垃圾邮件在传递过程中显示出来的如“发送频率频繁、在短时间内不断地进行发送、动态IP等”明显一系列带有垃圾邮件典型行为特征...

【技术保护点】

【技术特征摘要】
1.一种数据鉴别分析方法，其特征在于：对邮件进行行为采集即从正常邮件和垃圾邮件中收集相关数据信息的过程；进行行为特征数据的预处理，首先进行数据清理即填写空缺的值、识别并删除孤立的点；采用数据挖掘的方法对提取出来的行为特征向量集合进行模式挖掘...

【专利技术属性】
技术研发人员：邬玉良，
申请(专利权)人：中科热备北京云计算技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人