垃圾短信的分析方法、装置、设备及存储介质制造方法及图纸

技术编号:45291268 阅读:25 留言:0更新日期:2025-05-16 14:35
本发明专利技术公开了一种垃圾短信的分析方法、装置、设备及存储介质。所述垃圾短信的分析方法,包括:基于短短信的时间先后顺序、接入号码及预设短信长度拼接由至少两个短短信构成的长短信;去除所述长短信中的签名的符号后,对所述长短信进行分词处理;对进行过分词处理后的所述长短信进行垃圾关键词匹配;根据匹配结果,分析所述由至少两个短短信构成的长短信是否为垃圾短信。本申请的技术方案解决了拆分长短信时,恰好拆分了垃圾关键词到两个短短信中,导致无法识别出垃圾关键词的问题,还解决了签名中的文字与短信中的常规文字一起构成垃圾关键词的问题,实现对短信内容中的垃圾短信关键字的有效识别,进而提升了垃圾信息的识别准确度,从而实现对垃圾短信的精准拦截。

【技术实现步骤摘要】

本专利技术涉及大数据的,尤其涉及一种垃圾短信的分析方法、装置、设备及存储介质


技术介绍

1、随着移动互联网技术的迅猛发展,短信作为沟通的重要媒介,其应用程度不断扩大。然而,不法分子利用短信平台和虚拟运营商等手段,大肆传播垃圾短信,严重干扰了用户的正常生活,甚至造成经济损失,垃圾短信包括广告信息和诈骗短信等。特别是原本专为企业服务的“106短信”码号,也被一些代理商滥用,成为了垃圾短信的重要来源之一。垃圾短信发送成本低、传播范围广的特点被黑灰产业利用,成为传播违法诈骗类短信的重要渠道。

2、现有技术中的关键词过滤技术是基于预设的关键词列表对短信内容进行扫描和匹配,一旦发现含有敏感关键词的短信,则进行拦截或标记。但是,由于短信内容超过140个字节(70个字,ucs2编码),会按照每条134个字节被拆分成多条短短信。位于拆分节点前后的词汇,常常会因为拆分而导致垃圾关键词拆解后无法识别,导致基于短信内容的垃圾短信判别时,引起漏判。因此,对于长短信中的垃圾短信无法进行有效识别,使得垃圾短信最终下发至用户手机终端,引起终端用户投诉甚至对终端用户带来不良影本文档来自技高网...

【技术保护点】

1.一种垃圾短信的分析方法,其特征在于,包括:

2.如权利要求1所述的垃圾短信的分析方法,其特征在于,所述基于短短信的时间先后顺序、接入号码及预设短信长度拼接由至少两个短短信构成的长短信,包括:

3.如权利要求1所述的垃圾短信的分析方法,其特征在于,所述基于短短信的时间先后顺序、接入号码及预设短信长度拼接由至少两个短短信构成的长短信,包括:

4.如权利要求1所述的垃圾短信的分析方法,其特征在于,所述对进行过分词处理后的所述长短信进行垃圾关键词匹配,包括:

5.如权利要求4所述的垃圾短信的分析方法,其特征在于,还包括:p>

6.如权利...

【技术特征摘要】

1.一种垃圾短信的分析方法,其特征在于,包括:

2.如权利要求1所述的垃圾短信的分析方法,其特征在于,所述基于短短信的时间先后顺序、接入号码及预设短信长度拼接由至少两个短短信构成的长短信,包括:

3.如权利要求1所述的垃圾短信的分析方法,其特征在于,所述基于短短信的时间先后顺序、接入号码及预设短信长度拼接由至少两个短短信构成的长短信,包括:

4.如权利要求1所述的垃圾短信的分析方法,其特征在于,所述对进行过分词处理后的所述长短信进行垃圾关键词匹配,包括:

【专利技术属性】
技术研发人员:李浩杨昊刘宁
申请(专利权)人:北京神州泰岳软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1