【技术实现步骤摘要】
一种交易类网站识别方法与系统
[0001]本专利技术涉及网站页面信息分析处理
,从网站快照图片维度分析,归纳交易类网站的共性特征,构建识别模型,达到准确识别交易类网站的效果。
技术介绍
[0002]随着互联网技术的快速发展,人们以网络为媒介构建了一个繁荣的互联网社会。在这个特殊的社会里,各种功能的网站被设计出来,满足诸如公司信息展示,线上购物,交易询价,新闻资讯,视频娱乐等需求,丰富的网站形式,给网民带来了更丰富的体验,但随之而来,各种虚假宣传,非法经营等现象频出。为督促网络经营者落实《电子商务法》和《网络交易管理办法》的相关规定,加强网络交易监管,提高电子商务信用水平,有关部门需对是否存在夸大宣传,合同违法,交易平台是否存在未亮证照等情况进行监管。对交易类网站的准确识别,有助于有关部门对网络交易进行高效的监管。
[0003]由于网站设计和实现方式的多样性,出现了某些网站页面看上去很相似,但直接从页面源码上看,却差异很大;或者由于异步加载等原因,页面源码缺失了很多页面展示的信息。以上原因,导致仅从网页页面中提取 ...
【技术保护点】
【技术特征摘要】
1.一种交易类网站识别方法,其特征在于,所述方法包括:1)分析网站页面特征,归纳交易类网站的共性,整理成对应的识别模型;2)通过模拟访问的方式获得网站的快照图片;3)将网站快照图片灰度化,转换成二维数据矩阵形式;4)将二维数据矩阵基于位置切分成多个子矩阵,对子矩阵进行特征计算;5)根据计算的特征值结合识别模型,得出网站的类别识别结果;6)统计分析识别结果情况,优化识别模型。2.根据权利要求1所述的一种交易类网站识别方法,步骤1所述的分析网站页面,归纳共性,建立识别模型,其特征在于分析交易类网站页面的布局,归纳同类型网站的模块特征,按位置进行划分;分析色彩特征,比较特定位置的颜色差异性;分析局部区域的形状特征,分布特征;并以此建立识别模型。3.根据权利要求1所述的一种交易类网站识别方法,步骤2所述的获取网站快照图片方式,其特征在于通过web自动化工具selenium对目标网站进行模拟访问,获取网站的快照图片和网页加载完整后的页面源代码信息。4.根据权利要求1所述的一种交易类网站识别方法,步骤3所述的网站快照图片灰度化矩阵化,其特征在于先将步骤2获取的网站快照图片转成灰度化图片,再将灰度化图片转换成二维数据矩阵形式,矩阵的元素对应图像的像素,矩阵元素的值就是像素的灰度值。5.根据权利要求1所述的一种交易类网站识别方法,步骤4所述的特征值计算方式,其特征在于对步骤...
【专利技术属性】
技术研发人员:邓荣,王志永,林伟艺,吴建辉,
申请(专利权)人:中检美亚厦门科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。