一种信息处理方法及装置制造方法及图纸

技术编号:14369199 阅读:60 留言:0更新日期:2017-01-09 14:54
本发明专利技术公开了一种信息处理方法,包括:对存储的所有关键词及关键词组合进行预处理,得到新的关键词组合;利用所述新的关键词组合,生成关键词策略树;利用所述关键词策略树,生成对应的关键词策略;根据所述关键词策略,识别拦截的短信是否为垃圾短信。本发明专利技术同时还公开了一种信息处理装置。

【技术实现步骤摘要】

本专利技术涉及通信中的安全领域,尤其涉及一种信息处理方法及装置
技术介绍
随着移动通信服务的不断拓展,垃圾短信的现象随之大量出现,轻则影响手机用户的正常生活,重则会导致个人或公司产生重大的经济损失,因此,治理垃圾短信有着十分重要的意义。目前,短信拦截的方法主要根据关键词策略和流量策略,当监控到的短信内容中包括关键字或关键词时,则对发送该短信的发送端进行相应的放行、拦截或审核等处理。其中,关键词策略中包含垃圾短信中常见的任意关键字或关键词的组合,如“(百家乐)&(注册|进入)&(奖)&(合作|游戏)”;这里,&代表“与”,|代表“或”,所监控的短信内容只要符合该关键字规则,将视为疑似垃圾短信进行人工审核确认。实际应用过程中,通常垃圾短信拦截系统的关键词策略不低于两千条,并且随着新的垃圾短信出现,需要从中提取新的关键字或关键词,关键词策略数量不断增加,以便尽可能多的拦截垃圾短信。这样,现有关键词策略数量过大且存在大量冗余,严重降低了系统的处理性能和短信过滤效率。
技术实现思路
为解决现有存在的技术问题,本专利技术实施例提供一种信息处理方法及装置。本专利技术实施例提供了一种信息处理方法,包括:对存储的所有关键词及关键词组合进行预处理,得到新的关键词组合;利用所述新的关键词组合,生成关键词策略树;利用所述关键词策略树,生成对应的关键词策略;根据所述关键词策略,识别拦截的短信是否为垃圾短信。上述方案中,所述对存储的所有关键词及关键词组合进行预处理,得到新的关键词组合,包括:对所述存储的所有关键词及关键词组合进行只包含与关系的关键词组合的规则变换处理,得到变换后的关键词组合;对所述变换后的关键词组合进行去重复及合并处理,得到所述新的关键词组合。上述方案中,所述利用所述新的关键词组合,生成关键词策略树,包括:将所述新的关键词组合分离成单个关键词;将每个关键词作为一个根节点,遍历生成所述关键词策略树。上述方案中,所述利用所述关键词策略树,生成对应的关键词策略,包括:同一个关键词策略树中,根节点的子节点为叶子节点时,子树以广度优先遍历,且叶子节点之间是或的关系,与父节点之间是与的关系;和/或,同一个关键词策略树中,根节点的子节点不为叶子节点,子树以深度优先遍历,且相同层次的多个叶子节点之间是或的关系,各层节点之间是与的关系;和/或,同一个关键词策略树中,根节点的子节点不为叶子节点,且子树之间相同层次的兄弟节点具有共同的叶子节点时,兄弟节点之间生成或的关系,共同的叶子节点生成或的关系,各层节点之间生成与的关系;和/或,从根节点遍历关键词策略树,根节点的子节点不为叶子节点时,遍历相同路径,子树之间相同层次的兄弟节点拥有相同的子节点集,兄弟节点之间生成或的关系,子节点集合各层节点之间生成与的关系。上述方案中,所述方法还包括:将从新垃圾短信中提取的关键词进行去重复及合并处理,得到所述新垃圾短信对应的关键词组合;利用所述对应的关键词组合,遍历已生成的关键词策略树,当与所述生成的关键词策略树不符合时,生成新的关键词策略树;相应地,利用更新后的关键词策略树,生成新的关键词策略;并根据所述新的关键词策略,识别拦截的短信是否为垃圾短信。上述方案中,所述当与所述生成的关键词策略树不符合时,生成新的关键词策略树,包括:所述对应的关键词组合属于已生成的关键词策略树的根节点,且不符合所述根节点对应的关键词策略树规则时,将所述对应的关键词组合合并到所述根节点对应的关键词策略树中,生成新的关键词策略树;或者,所述对应的关键词组合在已生成的关键词策略树中找不到对应根节点时,根据所述对应的关键词组合,基于多叉树算法,生成新的关键词策略树。本专利技术实施例还提供了一种信息处理装置,包括:预处理单元、策略树生成单元、关键词策略生成单元以及识别单元;其中,所述预处理单元,用于对存储的所有关键词及关键词组合进行预处理,得到新的关键词组合;所述策略树生成单元,用于利用所述新的关键词组合,生成关键词策略树;所述关键词策略生成单元,用于利用所述关键词策略树,生成对应的关键词策略;所述识别单元,用于根据所述关键词策略,识别拦截的短信是否为垃圾短信。上述方案中,所述预处理单元包括:变换模块和去重复及合并处理模块;其中,所述变换模块,用于对所述存储的所有关键词及关键词组合进行只包含与关系的关键词组合的规则变换处理,得到变换后的关键词组合;所述去重复及合并处理模块,用于对所述变换后的关键词组合进行去重复及合并处理,得到所述新的关键词组合。上述方案中,所述策略树生成单元包括分离模块及策略树生成模块;其中,所述分离模块,用于将所述新的关键词组合分离成单个关键词;所述策略树生成模块,用于将每个关键词作为一个根节点,遍历生成所述关键词策略树。上述方案中,所述关键词策略生成单元,具体用于:同一个关键词策略树中,根节点的子节点为叶子节点时,子树以广度优先遍历,且叶子节点之间是或的关系,与父节点之间是与的关系;和/或,同一个关键词策略树中,根节点的子节点不为叶子节点,子树以深度优先遍历,且相同层次的多个叶子节点之间是或的关系,各层节点之间是与的关系;和/或,同一个关键词策略树中,根节点的子节点不为叶子节点,且子树之间相同层次的兄弟节点具有共同的叶子节点时,兄弟节点之间生成或的关系,共同的叶子节点生成或的关系,各层节点之间生成与的关系;和/或,从根节点遍历关键词策略树,根节点的子节点不为叶子节点时,遍历相同路径,子树之间相同层次的兄弟节点拥有相同的子节点集,兄弟节点之间生成或的关系,子节点集合各层节点之间生成与的关系。上述方案中,所述预处理单元,还用于将从新垃圾短信中提取的关键词进行去重复及合并处理,得到所述新垃圾短信对应的关键词组合;所述策略树生成单元,还用于利用所述对应的关键词组合,遍历已生成的关键词策略树,当与所述生成的关键词策略树不符合时,生成新的关键词策略树;相应地,所述关键词策略生成单元,还用于利用更新后的关键词策略树,生成新的关键词策略;所述识别单元,还用于根据所述新的关键词策略,识别拦截的短信是否为垃圾短信。本专利技术实施例提供的信息处理方法及装置,对存储的所有关键词及关键词组合进行预处理,得到新的关键词组合;利用所述新的关键词组合,生成关键词策略树;利用所述关键词策略树,生成对应的关键词策略;根据所述关键词策略,识别拦截的短信是否为垃圾短信,如此,能有效地提升系统的处理性能和短信过滤效率。附图说明在附图(其不一定是按比例绘制的)中,相似的附图标记可在不同的视图中描述相似的部件。具有不同字母后缀的相似附图标记可表示相似部件的不同示例。附图以示例而非限制的方式大体示出了本文中所讨论的各个实施例。图1为本专利技术实施例一信息处理的方法流程示意图;图2为本专利技术实施例二信息处理系统结构示意图;图3为本专利技术实施例二垃圾短信策略优化系统进行策略优化的方法流程示意图;图4为本专利技术实施例二生成的关键词策略树示意图;图5为本专利技术实施例二图4中的关键词策略树经过修改后的关键词策略树示意图;图6为本专利技术实施例二应用实例的关键词策略树示意图;图7为本专利技术实施例三信息处理装置结构示意图。具体实施方式下面结合附图及实施例对本专利技术再作进一本文档来自技高网...
一种信息处理方法及装置

【技术保护点】
一种信息处理方法,其特征在于,所述方法包括:对存储的所有关键词及关键词组合进行预处理,得到新的关键词组合;利用所述新的关键词组合,生成关键词策略树;利用所述关键词策略树,生成对应的关键词策略;根据所述关键词策略,识别拦截的短信是否为垃圾短信。

【技术特征摘要】
1.一种信息处理方法,其特征在于,所述方法包括:对存储的所有关键词及关键词组合进行预处理,得到新的关键词组合;利用所述新的关键词组合,生成关键词策略树;利用所述关键词策略树,生成对应的关键词策略;根据所述关键词策略,识别拦截的短信是否为垃圾短信。2.根据权利要求1所述的方法,其特征在于,对存储的所有关键词及关键词组合进行预处理,得到新的关键词组合,包括:对所述存储的所有关键词及关键词组合进行只包含与关系的关键词组合的规则变换处理,得到变换后的关键词组合;对所述变换后的关键词组合进行去重复及合并处理,得到所述新的关键词组合。3.根据权利要求1所述的方法,其特征在于,利用所述新的关键词组合,生成关键词策略树,包括:将所述新的关键词组合分离成单个关键词;将每个关键词作为一个根节点,遍历生成所述关键词策略树。4.根据权利要求1所述的方法,其特征在于,所述利用所述关键词策略树,生成对应的关键词策略,包括:同一个关键词策略树中,根节点的子节点为叶子节点时,子树以广度优先遍历,且叶子节点之间是或的关系,与父节点之间是与的关系;和/或,同一个关键词策略树中,根节点的子节点不为叶子节点,子树以深度优先遍历,且相同层次的多个叶子节点之间是或的关系,各层节点之间是与的关系;和/或,同一个关键词策略树中,根节点的子节点不为叶子节点,且子树之间相同层次的兄弟节点具有共同的叶子节点时,兄弟节点之间生成或的关系,共同的叶子节点生成或的关系,各层节点之间生成与的关系;和/或,从根节点遍历关键词策略树,根节点的子节点不为叶子节点时,遍历相同路径,子树之间相同层次的兄弟节点拥有相同的子节点集,兄弟节点之间生成或的关系,子节点集合各层节点之间生成与的关系。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:将从新垃圾短信中提取的关键词进行去重复及合并处理,得到所述新垃圾短信对应的关键词组合;利用所述对应的关键词组合,遍历已生成的关键词策略树,当与所述生成的关键词策略树不符合时,生成新的关键词策略树;相应地,利用更新后的关键词策略树,生成新的关键词策略;并根据所述新的关键词策略,识别拦截的短信是否为垃圾短信。6.根据权利要求5所述的方法,其特征在于,所述当与所述生成的关键词策略树不符合时,生成新的关键词策略树,包括:所述对应的关键词组合属于已生成的关键词策略树的根节点,且不符合所述根节点对应的关键词策略树规则时,将所述对应的关键词组合合并到所述根节点对应的关键词策略树中,生成新的关键词策略树;或者,所述对应的关键词组合在已生成的关键词策略树中找不到对应根节点时,根据所述对应的关...

【专利技术属性】
技术研发人员:杜海涛
申请(专利权)人:中国移动通信集团公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1