用于确定垃圾信息的方法及装置制造方法及图纸

技术编号:15696448 阅读:65 留言:0更新日期:2017-06-24 12:09
本发明专利技术提供了一种用于确定垃圾信息的方法及装置,其中,方法包括:接收来自外部的信息,确定信息的信息源及内容;根据信息源判断信息是否为垃圾信息,当信息源判断信息不是垃圾信息时,根据信息的内容判断信息是否为垃圾信息;将通过信息源或信息的内容判断为垃圾信息的信息确定为垃圾信息。本发明专利技术提供的技术方案,能通过信息来源快速识别信息是否为垃圾信息。此外,在保证垃圾短信识别有效性的基础上,避免了在未经用户同意的情况下将短信的内容直接上传到服务器所导致的侵犯用户个人隐私的问题,且经过本地的计算处理后减轻了客户端的上传以及云端服务器的处理压力,提高了识别效率,符合用户需求。

【技术实现步骤摘要】
用于确定垃圾信息的方法及装置
本专利技术涉及网络信息安全
,具体涉及用于确定垃圾信息的方法及装置。
技术介绍
随着移动通信技术的发展、移动设备的普及和短信资费的下降,短信成为移动终端之间进行信息传递的重要方法之一。用户在享受短信通信带来的便捷时,却也遭受到一些广告短信、诈骗短信等垃圾信息的骚扰,这些垃圾信息影响到用户的短信使用体验,给用户的人身、信息、财产安全带来隐患。因此,对垃圾短信的识别和拦截是亟待解决的问题。现有技术中,对垃圾短信的识别往往通过将短信的内容直接上传到服务器,由服务器对该短信的内容进行识别,将识别结果返回给移动终端,如果该短信为垃圾短信,则移动终端对该短信进行拦截或者对用户进行提示。该方案存在的问题是:1、信息的内容往往涉及到用户的个人信息,在未经用户同意的情况下将短信的内容直接上传到服务器侵犯了用户的个人隐私,对用户的信息安全造成了损害。2、移动终端每次接收到短信时,将短信的内容上传给服务器,该过程往往耗费相当的网络流量,且处理速度受到移动终端所处的网络状态的限制,会降低终端设备的使用性能。
技术实现思路
鉴于上述问题,本专利技术提出了一种克服上述问题或者至少部分地解决上述问题的用于确定垃圾信息的方法及装置。根据本专利技术的一个方面,提供了一种用于确定垃圾信息的方法,包括:接收来自外部的信息,确定所述信息的信息源及内容;根据所述信息源及所述信息的内容判断所述信息是否为垃圾信息;将通过所述信息源以及所述信息的内容判断为垃圾信息的所述信息确定为垃圾信息。其中,根据所述信息源及所述信息的内容判断所述信息是否为垃圾信息包括:将所述信息源与本地记录的垃圾信息源数据库中的记录进行比对,当所述信息源为垃圾信息源时,所述信息确定为垃圾信息;或者,将所述信息源传送至云端服务器,并接收所述云端服务器返回的指示信息,当所述指示信息确定所述信息源为垃圾信息源时,所述信息确定为垃圾信息。其中,根据所述信息源及所述信息的内容判断所述信息是否为垃圾信息包括:根据用户的选择,将所述信息的内容直接上传至云端服务器,或者,将所述信息的内容的替代信息上传至云端服务器;接收所述云端服务器返回的识别信息,根据所述识别信息确定所述信息是否为垃圾信息。优选地,将所述信息的内容的替代信息上传至云端服务器包括:计算出所述信息的内容对应的哈希值;将所述信息的内容对应的哈希值上传到云端服务器。优选地,计算出所述信息的内容对应的哈希值包括:对所述信息的内容进行分词处理;对分词后的各个词赋予不同的向量值,汇总计算得到所述信息的内容对应的simhash值。优选地,当所述信息确定为垃圾信息时,本地或所述云端服务器上的垃圾信息源数据库记录所述信息的信息源。优选地,本地记录的垃圾信息源数据库与所述云端服务器上记录的垃圾信息源数据库进行交互更新。根据本专利技术的另一个方面,提供了一种用于确定垃圾信息的装置,包括:接收模块,用于接收来自外部的信息,确定所述信息的信息源及内容;处理模块,用于根据所述信息源及所述信息的内容判断所述信息是否为垃圾信息;判定模块,用于将通过所述信息源以及所述信息的内容判断为垃圾信息的所述信息确定为垃圾信息。优选地,所述处理模块用于将所述信息源与本地记录的垃圾信息源数据库中的记录进行比对,当所述信息源为垃圾信息源时,所述判定模块将所述信息确定为垃圾信息;或者,所述处理模块用于将所述信息源传送至云端服务器,所述接收模块用于接收所述云端服务器返回的指示信息,当所述指示信息确定所述信息源为垃圾信息源时,所述判定模块将所述信息确定为垃圾信息。优选地,根据用户的选择,所述处理模块用于将所述信息的内容直接上传至云端服务器,或者,所述处理模块用于将所述信息的内容的替代信息上传至云端服务器;所述接收模块用于接收所述云端服务器返回的识别信息,所述判定模块用于根据所述识别信息确定所述信息是否为垃圾信息。优选地,所述处理模块用于将所述信息的内容的替代信息上传至云端服务器包括:所述处理模块用于计算出所述信息的内容对应的哈希值;所述处理模块用于将所述信息的内容对应的哈希值上传到云端服务器。优选地,所述处理模块用于计算出所述信息的内容对应的哈希值包括:所述处理模块用于对所述信息的内容进行分词处理;所述处理模块用于对分词后的各个词赋予不同的向量值,汇总计算得到所述信息的内容对应的simhash值。优选地,当所述判定模块确定所述信息为垃圾信息时,本地或所述云端服务器上的垃圾信息源数据库记录所述信息的信息源。优选地,所述接收模块和所述处理模块将本地记录的垃圾信息源数据库与所述云端服务器上记录的垃圾信息源数据库进行交互更新。本专利技术提供的上述方案,能通过信息来源快速识别信息是否为垃圾信息。此外,在保证垃圾短信识别有效性的基础上,避免了在未经用户同意的情况下将短信的内容直接上传到服务器所导致的侵犯用户个人隐私的问题,且经过本地的计算处理后减轻了客户端的上传以及云端服务器的处理压力,提高了识别效率,符合用户需求。本专利技术附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1示出了根据本专利技术一个实施例的一种用于确定垃圾信息的方法的流程图;图2示出了根据本专利技术另一个实施例的用于确定垃圾信息的方法的流程图;图3示出了根据本专利技术一个实施例的一种用于确定垃圾信息的装置的示意图;图4示出了根据本专利技术一个实施例的一种用于确定垃圾信息的云端服务器的示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本专利技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。本
技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本专利技术所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。图1示出了根据本专利技术一个实施例的一种用于确定垃圾信息的方法的流程图。如图1所示,该方法包括:步骤S110,接收来自外部的信息,确定信息的信息源及内容;步骤S120,根据信息源及信息的内容判断信息是否为垃圾信息;步骤S130,将通过信息源及信息的内容判断为垃圾信息的信息确定为垃圾信息。在本文档来自技高网
...
用于确定垃圾信息的方法及装置

【技术保护点】
一种用于确定垃圾信息的方法,其特征在于,包括:接收来自外部的信息,确定所述信息的信息源及内容;根据所述信息源及所述信息的内容判断所述信息是否为垃圾信息;将通过所述信息源以及所述信息的内容判断为垃圾信息的所述信息确定为垃圾信息。

【技术特征摘要】
1.一种用于确定垃圾信息的方法,其特征在于,包括:接收来自外部的信息,确定所述信息的信息源及内容;根据所述信息源及所述信息的内容判断所述信息是否为垃圾信息;将通过所述信息源以及所述信息的内容判断为垃圾信息的所述信息确定为垃圾信息。2.根据权利要求1所述的方法,其特征在于,根据所述信息源及所述信息的内容判断所述信息是否为垃圾信息包括:将所述信息源与本地记录的垃圾信息源数据库中的记录进行比对,当所述信息源为垃圾信息源时,所述信息确定为垃圾信息;或者,将所述信息源传送至云端服务器,并接收所述云端服务器返回的指示信息,当所述指示信息确定所述信息源为垃圾信息源时,所述信息确定为垃圾信息。3.根据权利要求1或2任意之一所述的方法,其特征在于,根据所述信息源及所述信息的内容判断所述信息是否为垃圾信息包括:根据用户的选择,将所述信息的内容直接上传至云端服务器,或者,将所述信息的内容的替代信息上传至云端服务器;接收所述云端服务器返回的识别信息,根据所述识别信息确定所述信息是否为垃圾信息。4.根据权利要求3所述的方法,其特征在于,将所述信息的内容的替代信息上传至云端服务器包括:计算出所述信息的内容对应的哈希值;将所述信息的内容对应的哈希值上传到云端服务器。5.根据权利要求4所述的方法,其特征在于,计算出所述信息的内容对应的哈希值包括:对所述信息的内容进行分词处理;对分词后的各个词赋予不同的向量值,汇总计算得到所述信息的内容对应的simhash值。6.根据权利要求3所述的方法,其特征在于,当所述...

【专利技术属性】
技术研发人员:范国峰常富洋李振博
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1