短信的分类方法及装置制造方法及图纸

技术编号:23562420 阅读:31 留言:0更新日期:2020-03-25 07:03
本申请公开了一种短信的分类方法及装置。其中,该方法包括:获取短信的发送方与接收方的行为特征以及获取上述短信的文本特征;将上述行为特征和上述文本特征作为组合输入特征,通过深度学习对上述短信的内容属性进行分类。本申请解决了传统的垃圾短信识别方案基于文本分类或关键词拦截的方法进行短信的分类,无法精准的对短信内容进行分类的技术问题。

Classification method and device of short message

【技术实现步骤摘要】
短信的分类方法及装置
本申请涉及计算机
,具体而言,涉及一种短信的分类方法及装置。
技术介绍
垃圾短信是指未经过用户同意向用户发送的用户不愿意接收到的短信,或用户不能根据自己的意愿拒绝接收的短信,垃圾短信泛滥已经严重影响到人们正常生活、运营商形象乃至社会稳定。垃圾短信识别是短信内容安全系统的第一道防线,因此,如何识别并拦截垃圾短信至关重要。但是,在现有技术中,传统的垃圾短信识别方案通常基于文本分类或关键词拦截的方法进行,忽略了短信发送方和接收方的行为特征,从而无法精准的判断垃圾短信的风险概率。例如,使用传统的关键词拦截技术或者文本分类模型,会造成大量的误拦或者大量的漏拦。针对上述传统的垃圾短信识别方案基于文本分类或关键词拦截的方法进行短信的分类,无法精准的对短信内容进行分类的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种短信的分类方法及装置,以至少解决传统的垃圾短信识别方案基于文本分类或关键词拦截的方法进行短信的分类,无法精准的对短信内容进行分类的技术问题。根据本申请实施例的一个方面,提供了一种短信的分类方法,包括:获取短信的发送方与接收方的行为特征以及获取上述短信的文本特征;将上述行为特征和上述文本特征作为组合输入特征,通过深度学习对上述短信的内容属性进行分类。根据本申请实施例的另一方面,还提供了一种短信的分类装置,包括:获取模块,用于获取短信的发送方与接收方的行为特征以及获取上述短信的文本特征;分类模块,用于将上述行为特征和上述文本特征作为组合输入特征,通过深度学习对上述短信的内容属性进行分类。根据本申请实施例的另一方面,还提供了一种存储介质,上述存储介质包括存储的程序,其中,在上述程序运行时控制上述存储介质所在设备执行任意一项上述的短信的分类方法。根据本申请实施例的另一方面,还提供了一种处理器,上述处理器用于运行程序,其中,上述程序运行时执行任意一项上述的短信的分类方法。根据本申请实施例的另一方面,还提供了一种计算机系统,包括:处理器;以及存储器,与上述处理器连接,用于为上述处理器提供处理以下处理步骤的指令:获取短信的发送方与接收方的行为特征以及获取上述短信的文本特征;将上述行为特征和上述文本特征作为组合输入特征,通过深度学习对上述短信的内容属性进行分类。在本申请实施例中,通过获取短信的发送方与接收方的行为特征以及获取上述短信的文本特征;将上述行为特征和上述文本特征作为组合输入特征,通过深度学习对上述短信的内容属性进行分类。容易注意到的是,本申请实施例获取短信的发送方与接收方的行为特征以及获取上述短信的文本特征,依据上述行为特征和文本特征对短信的内容属性进行分类,并且,本申请方案将上述行为特征和上述文本特征联立作为组合输入特征,通过深度学习算法对上述短信的内容属性进行分类,可以有效提高对短信内容进行分类的准确性。由此,本申请实施例达到了提高对短信内容进行分类的准确性的目的,从而实现了提高判断垃圾短信的风险概率的精准性的技术效果,进而解决了传统的垃圾短信识别方案基于文本分类或关键词拦截的方法进行短信的分类,无法精准的对短信内容进行分类的技术问题。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1示出了一种用于实现短信的分类方法的计算机终端(或移动设备)的硬件结构框图;图2是根据本申请实施例的一种短信的分类方法的流程图;图3是根据本申请实施例的一种可选的短信的分类方法的场景示意图;图4是根据本申请实施例的一种可选的短信的分类方法的流程图;图5是根据本申请实施例的一种可选的短信的分类方法的流程图;图6是根据本申请实施例的一种可选的短信的分类方法的流程图;图7是根据本申请实施例的一种短信的分类装置的示意图;以及图8是根据本申请实施例的一种计算机终端的结构框图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:二部图,又称二分图,是图论中的一种特殊模型,其顶点集可分割为两个互不相交的子集,并且图中每条边依附的两个顶点都分属于这两个互不相交的子集,两个子集内的顶点不相邻。随机游走算法,是指给定一个图和一个出发点,随机地选择一个邻居结点,移动到邻居结点上,然后把当前结点作为出发点,重复以上过程。图嵌入算法(node2vec),是指一种针对图结构的节点特征表示学习算法。预设词向量化工具(word2vec),是指一种开源软件,通过大规模语料学习词语的向量表示。卷积神经网络,是一种深度前馈神经网络,其人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。实施例1根据本申请实施例,提供了一种短信的分类方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。本申请实施例1所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现短信的分类方法的计算机终端(或移动设备)的硬件结构框图,如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算本文档来自技高网
...

【技术保护点】
1.一种短信的分类方法,包括:/n获取短信的发送方与接收方的行为特征以及获取所述短信的文本特征;/n将所述行为特征和所述文本特征作为组合输入特征,通过深度学习对所述短信的内容属性进行分类。/n

【技术特征摘要】
1.一种短信的分类方法,包括:
获取短信的发送方与接收方的行为特征以及获取所述短信的文本特征;
将所述行为特征和所述文本特征作为组合输入特征,通过深度学习对所述短信的内容属性进行分类。


2.根据权利要求1所述的方法,其中,获取所述发送方与所述接收方的行为特征包括:
通过二部图数据结构对所述发送方与所述接收方的标识进行建模,得到二部图模型;
基于所述二部图模型,采用图嵌入算法获取所述发送方与所述接收方的行为特征。


3.根据权利要求2所述的方法,其中,通过所述二部图数据结构对所述发送方与所述接收方的标识进行建模,得到所述二部图模型包括:
将所述发送方在发送所述短信时所使用的签名标识设置为所述二部图数据结构中的第一类型节点;
将所述发送方与所述接收方所使用的终端标识设置为所述二部图数据结构中的第二类型节点;
统计所述发送方与所述接收方之间的异常短信占比,其中,所述异常短信占比通过计算第一数值与第二数值的比值得到,所述第一数值表示所述发送方向所述接收方发送过的异常短信的数量,所述第二数值表示所述发送方向所述接收方发送过的全部短信的数量,所述异常短信中包含敏感信息且所述异常短信通过预先标记确定;
按照统计得到的异常短信占比从所述第一类型节点和所述第二类型节点中筛选出待使用节点,并在所述待使用节点中的每一对发送方与接收方之间生成边,得到所述二部图模型,其中,所述边的权重为该对发送方与接收方对应的异常短信占比。


4.根据权利要求3所述的方法,其中,按照统计得到的异常短信占比从所述第一类型节点和所述第二类型节点中筛选出待使用节点包括:
对统计得到的异常短信占比进行降序排列,得到排序结果;
按照预设比例从所述排序结果选取排名靠前的异常短信占比;
根据选取的异常短信占比从所述第一类型节点和所述第二类型节点中筛选出所述待使用节点。


5.根据权利要求3所...

【专利技术属性】
技术研发人员:高喆周笑添孙常龙康杨杨刘晓钟司罗
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1