【技术实现步骤摘要】
本专利技术是利用基于最邻近标签传播算法检测图像型垃圾邮件。主要思想是:首先获取图片聚类中心点信息;然后提取所有图片的加速鲁棒性特征描述符信息,进行均值聚类;最后采用基于最邻近的标签传播算法检测图像型垃圾邮件。主要解决了当今的技术对图像型垃圾邮件的检测效率和召回率低等问题,属于数据挖掘和机器学习领域。
技术介绍
电子邮件是人们进行网络交流沟通的重要途径,因此随着电子邮件的流行,产生了垃圾邮件,并呈现了快速增长的趋势。虽然带来了巨大的商业、经济及政治利益,但是企业界和个人家庭的用户都花费了数百万美元来对抗垃圾邮件。由于垃圾邮件的增加,ISPs(互联网服务提供商)不得不花费更多的时间和精力处理日益增长的网络流量。因此,如果垃圾邮件继续增长,那么在不久的将来,ISPs可能会难以管理网络流量。Hrishikesh B.Aradhye等在2005年提出了一种采用基于对象与基于边缘的文本定位方法来挖掘图像中的文本以及颜色特征的思想来对Image Spam (图像型垃圾邮件)进行分类。Giorgio Fumerai等在2006年提出了一种OCR (光学字符识别)技术检测图像型垃 ...
【技术保护点】
一种利用基于最邻近标签传播算法检测图像型垃圾邮件的方法,其特征在于该方法包含的步骤为:步骤1)训练已知类别数据集,获取聚类中心点信息,其中类别分为正常图片和垃圾图片:步骤1.1)输入已知类别数据集中的正常图片和垃圾图片;步骤1.2)提取每幅图片的加速鲁棒性特征描述符信息:步骤1.2.1)获取输入的图片;步骤1.2.2)获取输入图片的积分图片;步骤1.2.3)获取积分图片的像素点;步骤1.2.4)输入图片的第一个像素点;步骤1.2.5)判断图片该像素点是否存在,如果存在,转步骤1.2.6),否则,转步骤1.2.14);步骤1.2.6)计算该像素点的海森矩阵及行列式值;步骤1. ...
【技术特征摘要】
1.一种利用基于最邻近标签传播算法检测图像型垃圾邮件的方法,其特征在于该方法包含的步骤为: 步骤I)训练已知类别数据集,获取聚类中心点信息,其中类别分为正常图片和垃圾图片: 步骤1.1)输入已知类别数据集中的正常图片和垃圾图片; 步骤1.2)提取每幅图片的加速鲁棒性特征描述符信息: 步骤1.2.1)获取输入的图片; 步骤1.2.2)获取输入图片的积分图片; 步骤1.2.3)获取积分图片的像素点; 步骤1.2.4)输入图片的第一个像素点; 步骤1.2.5)判断图片该像素点是否存在,如果存在,转步骤1.2.6),否则,转步骤1.2.14); 步骤1.2.6)计算该像素点的海森矩阵及行列式值; 步骤1.2.7)判断该点是否是极值点,如果是,转步骤1.2.8),否则,转步骤1.2.13); 步骤1.2.8)确认该极值点为加速鲁棒性特征点; 步骤1.2.9)获取该特征点在原始图片中的位置、尺度信息; 步骤1.2.10)获取该特征点在原始图片中的主方向; 步骤1.2.11)根据该特征点的位置、尺度、主方向信息,计算该特征点的加速鲁棒性特征描述符;其中,加速鲁棒性特征描述符采用64维描述向量存储; 步骤1.2.12)输入图片下一个像素点,转步骤1.2.5); 步骤1.2.13)系统自动舍弃该点,转步骤1.2.12); 步骤1.2.14)输出图片的所有加速鲁棒性特征点描述符信息; 步骤1.3)随机初始化聚类中心点,根据均值聚类算法,同时聚类已知类别数据集中所有图片的加速鲁棒性特征描述符: 步骤1.3.1)获取需要聚类的所有加速鲁棒性特征点描述符信息; 步骤1.3.2)获取聚类中心点的个数; 步骤1.3.3)输入第一个加速鲁棒性特征点信息; 步骤1.3.4)判断该加速鲁棒性特征点是否存在,如果存在,转步骤1.3.5),否则,转步骤...
【专利技术属性】
技术研发人员:张卫丰,钱小燕,周国强,张迎周,王子元,周国富,许碧欢,陆柳敏,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。