融合通信的垃圾消息检测方法、系统、设备及存储介质技术方案

技术编号:40097580 阅读:21 留言:0更新日期:2024-01-23 17:10
本发明专利技术提供了融合通信的垃圾消息检测方法、系统、设备及存储介质,其中,方法包括:采集待识别融合通信消息的至少部分内容,建立待测样本,待测样本包括文本元素和/或链接元素;将待测样本分别输入到预先训练好的双向特征检测器进行双向检测,基于与正向特征集合、负向特征集合的双向亲和度的比较结果,分别获得与正向特征的匹配结果和负向特征的匹配结果;当任一文本元素或链接元素为恶意特征,则待识别融合通信消息为垃圾信息。本发明专利技术能够解决常规垃圾消息检测特征空间重叠存在黑洞导致整体检测率低的问题,降低了算力需求,提升对涵盖富文本信息的RCS垃圾消息检测的准确率。

【技术实现步骤摘要】

所属的技术人员能够理解,本专利技术的各个方面可以实现为系统、方法或程序产品。因此,本专利技术的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。图13是本专利技术的融合通信的垃圾消息检测设备的示意图。下面参照图13描述根据本专利技术的这种实施方式的电子设备600。图13所示的电子设备600仅仅是一个示例,不应对本专利技术实施例的功能和使用范围带来任何限制。如图13所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述方法部分中描述的根据本专利技术各种示例性实施方式的步骤。例如,处理单元610可以执行如图1中所示的步骤。存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)6本文档来自技高网...

【技术保护点】

1.一种融合通信的垃圾消息检测方法,其特征在于,包括以下步骤:

2.如权利要求1所述的融合通信的垃圾消息检测方法,其特征在于,所述采集待识别融合通信消息的至少部分内容,建立待测样本,所述待测样本包括文本元素和/或链接元素,包括:

3.如权利要求2所述的融合通信的垃圾消息检测方法,其特征在于,所述根据所述文本元素和链接元素分别建立待测样本集合,包括:

4.如权利要求1所述的融合通信的垃圾消息检测方法,其特征在于,所述采集待识别融合通信消息的至少部分内容,建立待测样本,所述待测样本包括文本元素和/或链接元素之前,还包括:

5.如权利要求4所述的...

【技术特征摘要】

1.一种融合通信的垃圾消息检测方法,其特征在于,包括以下步骤:

2.如权利要求1所述的融合通信的垃圾消息检测方法,其特征在于,所述采集待识别融合通信消息的至少部分内容,建立待测样本,所述待测样本包括文本元素和/或链接元素,包括:

3.如权利要求2所述的融合通信的垃圾消息检测方法,其特征在于,所述根据所述文本元素和链接元素分别建立待测样本集合,包括:

4.如权利要求1所述的融合通信的垃圾消息检测方法,其特征在于,所述采集待识别融合通信消息的至少部分内容,建立待测样本,所述待测样本包括文本元素和/或链接元素之前,还包括:

5.如权利要求4所述的融合通信的垃圾消息检测方法,其特征在于,所述将所述待测样本分别输入到预先训练好的双向特征检测器进行双向检测,基于与正向特征集合、负向特征集合的双向亲和度的比较结果,分别获得与正向特征的匹配结果和负向特征的匹配结果,包括:

6.如权利要求5所述的融合通信的垃圾消息检测方法,其特征在于,所述判断所述文本元素是否命中文本元素负向特征集合中的一个元素,若是,则所述文本元素为恶意特征,若否,根据所述文本元素分别与文本元素正向特征集合、文本元素负向特征集合的海明距离,判断所述文本元素为正向特征或负向特征,包括:

7.如权利要求5所述的融合通信的垃圾消息检测方法,其特征在于,所述判断所述文本元素是否命中文本元素负向特征集合中的一个元素,若是,则所述文本元素为恶意特征,若否,根据所述文本元素分别与文本元素正向特征集合、文本元素负向特征集合的海明距离,判断所述文本元素为正向特征或负向特征,包括:

8.如权利要...

【专利技术属性】
技术研发人员:张昊迪金华敏王帅
申请(专利权)人:中国电信股份有限公司技术创新中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1