基于物联网技术的广告信息自动过滤方法技术

技术编号:27935402 阅读:32 留言:0更新日期:2021-04-02 14:15
本发明专利技术公开一种基于物联网技术的广告信息自动过滤方法,属于信息处理技术领域,包括如下步骤:步骤1,构建广告信息规则库,并在使用中不断更新;步骤2,通过网络采集获取物联网信息;步骤3,自步骤2获取的物联网信息提取相关关键词,并将相关关键词与广告信息规则库中的规则相比较,若匹配则判定为广告信息。此种基于物联网技术的广告信息自动过滤方法,可有效过滤广告信息,提高信息处理速度,提高信息的获取效率。

【技术实现步骤摘要】
基于物联网技术的广告信息自动过滤方法
本专利技术属于信息处理
,特别涉及一种基于物联网技术的广告信息自动过滤方法。
技术介绍
物联网(InternetofThings)是新一代信息技术的重要组成部分,也是信息化时代的重要发展阶段。顾名思义,物联网就是物物相连的互联网,这有两层意思:其一,物联网的核心和基础仍然是互联网,是在互联网基础上的延伸和扩展的网络;其二,其用户端延伸和扩展到了任何物品与物品之间,进行信息交换和通信,也就是物物相息。物联网通过智能感知、识别技术与普适计算等通信感知技术,广泛应用于网络的融合中,也因此被称为继计算机、互联网之后世界信息产业发展的第三次浪潮。物联网是互联网的应用拓展,与其说物联网是网络,不如说物联网是业务和应用。因此,应用创新是物联网发展的核心,以用户体验为核心的创新2.0是物联网发展的灵魂。在运用物联网获取信息时,有些商家会在信息中夹杂有广告内容,不仅会占用带宽,影响数据的传输速度,还会拖慢本地的信息处理速度,影响对于目标信息的获取效率,有待改进。
技术实现思路
本专利技术的目的,在于提供一种基于物联网技术的广告信息自动过滤方法,其可有效过滤广告信息,提高信息处理速度,提高信息的获取效率。为了达成上述目的,本专利技术的解决方案是:一种基于物联网技术的广告信息自动过滤方法,包括如下步骤:步骤1,构建广告信息规则库,并在使用中不断更新;步骤2,通过网络采集获取物联网信息;步骤3,自步骤2获取的物联网信息提取相关关键词,并将相关关键词与广告信息规则库中的规则相比较,若匹配则判定为广告信息。上述步骤1中,广告信息规则库中的规则包括Adblock规则库的内容,以及由用户自行设定并添加的自定义规则。上述步骤1中,还对广告信息规则库中的规则建立索引。上述步骤1中,广告信息规则库的规则包含URL值、图片、文字和Flash,对所有规则按照其形式进行等级划分,URL值为第一级规则,图片、文字、Flash为第二级规则,首先对物联网信息提取的URL值与第一级规则进行匹配,若匹配则判定为广告信息;否则将物联网信息提取的图片、文字或Flash与第二级规则进行匹配,若匹配则判定为广告信息。采用哈希匹配关键词算法将物联网信息提取的URL值与第一级规则进行匹配。采用全局匹配的方式将物联网信息提取的图片、文字或Flash与第二级规则进行匹配。上述步骤3中,采用Java或Javascript语言实现匹配过程。上述步骤3中,若为广告信息,则将该信息隐藏,不进行显示。采用上述方案后,本专利技术具有如下改进:(1)本专利技术通过构建广告信息规则库,引入常规资源库,并开放规则库,使用户可以自行设定规则,对广告信息的识别更加灵活,准确性更高;(2)本专利技术将相关关键词按照优先级进行分类,若URL值匹配则直接判定为广告信息,从而提高匹配效率。具体实施方式以下将结合具体实施例,对本专利技术的技术方案及有益效果进行详细说明。本专利技术提供一种基于物联网技术的广告信息自动过滤方法,包括如下步骤:步骤1,构建广告信息规则库,该规则库内包含有常见广告页面的URL值、图片、文字等,并在使用中不断更新;其中,URL(UniformResourceLocator,统一资源定位符),是指WWW的统一资源定位标志,也即网络地址。URL由三部分组成:资源类型、存放资源的主机域名、资源文件名,也可认为由4部分组成:协议、主机、端口、路径,URL的一般语法格式为(带方括号[]的为可选项):protocol://hostname[:port]/path/[;parameters][?query]#fragment所述广告信息规则库中的规则包括Adblock规则库的内容,以及在实际使用过程中,由用户自行设定并添加的自定义规则;AdBlock是chrome浏览器中安装量高达4000万,几乎能够屏蔽整个互联网上的广告的一款广告屏蔽插件,对于普通网站上的广告单元、漂浮广告、视频播放广告、图片广告等,AdBlock都能很好地进行处理;在本实施例中,还对广告信息规则库中的规则建立索引,以缩短后续的匹配时间,提高匹配效率;步骤2,通过网络采集获取物联网信息;步骤3,自步骤2获取的物联网信息提取相关关键词,该相关关键词与规则库的内容相对应,为URL值、图片、文字等,并将相关关键词与相同形式的规则相比较,若匹配则判定为广告信息,将该信息隐藏,不进行显示;在具体匹配时,首先根据规则的形式进行等级划分,URL值为第一级规则,图片、文字、Flash为第二级规则,在提取相关关键词时,也根据规则的等级划分形式,首先提取URL值,采用哈希匹配关键词算法与第一级规则进行匹配,若能够匹配则无需进行第二级规则的匹配,直接判定为广告信息,否则提取物联网信息中的图片、文字、Flash等关键词,与广告信息规则库中的第二级规则进行匹配,在本实施例中,采用全局匹配的匹配方式;哈希算法将任意长度的二进制值映射为较短的固定长度的二进制值,这个小的二进制值称为哈希值。哈希值是一段数据唯一且极其紧凑的数值表示形式。如果散列一段明文而且哪怕只更改该段落的一个字母,随后的哈希都将产生不同的值。要找到散列为同一个值的两个不同的输入,在计算上是不可能的,所以数据的哈希值可以检验数据的完整性。哈希表是根据设定的哈希函数H(key)和处理冲突方法将一组关键字映射到一个有限的地址区间上,并以关键字在地址区间中的象作为记录在表中的存储位置,这种表称为哈希表或散列,所得存储位置称为哈希地址或散列地址。作为线性数据结构与表格和队列等相比,哈希表无疑是查找速度比较快的一种;在所述步骤3中,采用Java或Javascript语言实现匹配过程。以上实施例仅为说明本专利技术的技术思想,不能以此限定本专利技术的保护范围,凡是按照本专利技术提出的技术思想,在技术方案基础上所做的任何改动,均落入本专利技术保护范围之内。本文档来自技高网...

【技术保护点】
1.一种基于物联网技术的广告信息自动过滤方法,其特征在于包括如下步骤:/n步骤1,构建广告信息规则库,并在使用中不断更新;/n步骤2,通过网络采集获取物联网信息;/n步骤3,自步骤2获取的物联网信息提取相关关键词,并将相关关键词与广告信息规则库中的规则相比较,若匹配则判定为广告信息。/n

【技术特征摘要】
1.一种基于物联网技术的广告信息自动过滤方法,其特征在于包括如下步骤:
步骤1,构建广告信息规则库,并在使用中不断更新;
步骤2,通过网络采集获取物联网信息;
步骤3,自步骤2获取的物联网信息提取相关关键词,并将相关关键词与广告信息规则库中的规则相比较,若匹配则判定为广告信息。


2.如权利要求1所述的基于物联网技术的广告信息自动过滤方法,其特征在于:所述步骤1中,广告信息规则库中的规则包括Adblock规则库的内容,以及由用户自行设定并添加的自定义规则。


3.如权利要求1所述的基于物联网技术的广告信息自动过滤方法,其特征在于:所述步骤1中,还对广告信息规则库中的规则建立索引。


4.如权利要求1所述的基于物联网技术的广告信息自动过滤方法,其特征在于:所述步骤1中,广告信息规则库的规则包含URL值、图片、文字和Flash,对所有规则按照其形式进行等级划分,URL值为第一级...

【专利技术属性】
技术研发人员:綦大勇梁媛媛王琦朱霖邓晓露陈华
申请(专利权)人:盐城数智科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1