【技术实现步骤摘要】
本专利技术涉及大数据的,尤其涉及一种垃圾短信的分析方法、装置、设备及存储介质。
技术介绍
1、随着移动互联网技术的迅猛发展,短信作为沟通的重要媒介,其应用程度不断扩大。然而,不法分子利用短信平台和虚拟运营商等手段,大肆传播垃圾短信,严重干扰了用户的正常生活,甚至造成经济损失,垃圾短信包括广告信息和诈骗短信等。特别是原本专为企业服务的“106短信”码号,也被一些代理商滥用,成为了垃圾短信的重要来源之一。垃圾短信发送成本低、传播范围广的特点被黑灰产业利用,成为传播违法诈骗类短信的重要渠道。
2、现有技术中的关键词过滤技术是基于预设的关键词列表对短信内容进行扫描和匹配,一旦发现含有敏感关键词的短信,则进行拦截或标记。但是,由于短信内容超过140个字节(70个字,ucs2编码),会按照每条134个字节被拆分成多条短短信。位于拆分节点前后的词汇,常常会因为拆分而导致垃圾关键词拆解后无法识别,导致基于短信内容的垃圾短信判别时,引起漏判。因此,对于长短信中的垃圾短信无法进行有效识别,使得垃圾短信最终下发至用户手机终端,引起终端用户投诉甚至
...【技术保护点】
1.一种垃圾短信的分析方法,其特征在于,包括:
2.如权利要求1所述的垃圾短信的分析方法,其特征在于,所述基于短短信的时间先后顺序、接入号码及预设短信长度拼接由至少两个短短信构成的长短信,包括:
3.如权利要求1所述的垃圾短信的分析方法,其特征在于,所述基于短短信的时间先后顺序、接入号码及预设短信长度拼接由至少两个短短信构成的长短信,包括:
4.如权利要求1所述的垃圾短信的分析方法,其特征在于,所述对进行过分词处理后的所述长短信进行垃圾关键词匹配,包括:
5.如权利要求4所述的垃圾短信的分析方法,其特征在于,还包括:
...【技术特征摘要】
1.一种垃圾短信的分析方法,其特征在于,包括:
2.如权利要求1所述的垃圾短信的分析方法,其特征在于,所述基于短短信的时间先后顺序、接入号码及预设短信长度拼接由至少两个短短信构成的长短信,包括:
3.如权利要求1所述的垃圾短信的分析方法,其特征在于,所述基于短短信的时间先后顺序、接入号码及预设短信长度拼接由至少两个短短信构成的长短信,包括:
4.如权利要求1所述的垃圾短信的分析方法,其特征在于,所述对进行过分词处理后的所述长短信进行垃圾关键词匹配,包括:
【专利技术属性】
技术研发人员:李浩,杨昊,刘宁,
申请(专利权)人:北京神州泰岳软件股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。