【技术实现步骤摘要】
本专利技术涉及通信中的安全领域,尤其涉及一种信息处理方法及装置。
技术介绍
随着移动通信服务的不断拓展,垃圾短信的现象随之大量出现,轻则影响手机用户的正常生活,重则会导致个人或公司产生重大的经济损失,因此,治理垃圾短信有着十分重要的意义。目前,短信拦截的方法主要根据关键词策略和流量策略,当监控到的短信内容中包括关键字或关键词时,则对发送该短信的发送端进行相应的放行、拦截或审核等处理。其中,关键词策略中包含垃圾短信中常见的任意关键字或关键词的组合,如“(百家乐)&(注册|进入)&(奖)&(合作|游戏)”;这里,&代表“与”,|代表“或”,所监控的短信内容只要符合该关键字规则,将视为疑似垃圾短信进行人工审核确认。实际应用过程中,通常垃圾短信拦截系统的关键词策略不低于两千条,并且随着新的垃圾短信出现,需要从中提取新的关键字或关键词,关键词策略数量不断增加,以便尽可能多的拦截垃圾短信。这样,现有关键词策略数量过大且存在大量冗余,严重降低了系统的处理性能和短信过滤效率。
技术实现思路
为解决现有存在的技术问题,本专利技术实施例提供一种信息处理方法及装置。本专利技术实施例提供了一种信息处理方法,包括:对存储的所有关键词及关键词组合进行预处理,得到新的关键词组合;利用所述新的关键词组合,生成关键词策略树;利用所述关键词策略树,生成对应的关键词策略;根据所述关键词策略,识别拦截的短信是否为垃圾短信。上述方案中,所述对存储的所有关键词及关键词组合进行预处理,得到新的关键词组合,包括:对所述存储的所有关键词及关键词组合进行只包含与关系的关键词组合 ...
【技术保护点】
一种信息处理方法,其特征在于,所述方法包括:对存储的所有关键词及关键词组合进行预处理,得到新的关键词组合;利用所述新的关键词组合,生成关键词策略树;利用所述关键词策略树,生成对应的关键词策略;根据所述关键词策略,识别拦截的短信是否为垃圾短信。
【技术特征摘要】
1.一种信息处理方法,其特征在于,所述方法包括:对存储的所有关键词及关键词组合进行预处理,得到新的关键词组合;利用所述新的关键词组合,生成关键词策略树;利用所述关键词策略树,生成对应的关键词策略;根据所述关键词策略,识别拦截的短信是否为垃圾短信。2.根据权利要求1所述的方法,其特征在于,对存储的所有关键词及关键词组合进行预处理,得到新的关键词组合,包括:对所述存储的所有关键词及关键词组合进行只包含与关系的关键词组合的规则变换处理,得到变换后的关键词组合;对所述变换后的关键词组合进行去重复及合并处理,得到所述新的关键词组合。3.根据权利要求1所述的方法,其特征在于,利用所述新的关键词组合,生成关键词策略树,包括:将所述新的关键词组合分离成单个关键词;将每个关键词作为一个根节点,遍历生成所述关键词策略树。4.根据权利要求1所述的方法,其特征在于,所述利用所述关键词策略树,生成对应的关键词策略,包括:同一个关键词策略树中,根节点的子节点为叶子节点时,子树以广度优先遍历,且叶子节点之间是或的关系,与父节点之间是与的关系;和/或,同一个关键词策略树中,根节点的子节点不为叶子节点,子树以深度优先遍历,且相同层次的多个叶子节点之间是或的关系,各层节点之间是与的关系;和/或,同一个关键词策略树中,根节点的子节点不为叶子节点,且子树之间相同层次的兄弟节点具有共同的叶子节点时,兄弟节点之间生成或的关系,共同的叶子节点生成或的关系,各层节点之间生成与的关系;和/或,从根节点遍历关键词策略树,根节点的子节点不为叶子节点时,遍历相同路径,子树之间相同层次的兄弟节点拥有相同的子节点集,兄弟节点之间生成或的关系,子节点集合各层节点之间生成与的关系。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:将从新垃圾短信中提取的关键词进行去重复及合并处理,得到所述新垃圾短信对应的关键词组合;利用所述对应的关键词组合,遍历已生成的关键词策略树,当与所述生成的关键词策略树不符合时,生成新的关键词策略树;相应地,利用更新后的关键词策略树,生成新的关键词策略;并根据所述新的关键词策略,识别拦截的短信是否为垃圾短信。6.根据权利要求5所述的方法,其特征在于,所述当与所述生成的关键词策略树不符合时,生成新的关键词策略树,包括:所述对应的关键词组合属于已生成的关键词策略树的根节点,且不符合所述根节点对应的关键词策略树规则时,将所述对应的关键词组合合并到所述根节点对应的关键词策略树中,生成新的关键词策略树;或者,所述对应的关键词组合在已生成的关键词策略树中找不到对应根节点时,根据所述对应的关...
【专利技术属性】
技术研发人员:杜海涛,
申请(专利权)人:中国移动通信集团公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。