System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 融合通信的垃圾消息检测方法、系统、设备及存储介质技术方案_技高网

融合通信的垃圾消息检测方法、系统、设备及存储介质技术方案

技术编号:40097580 阅读:9 留言:0更新日期:2024-01-23 17:10
本发明专利技术提供了融合通信的垃圾消息检测方法、系统、设备及存储介质,其中,方法包括:采集待识别融合通信消息的至少部分内容,建立待测样本,待测样本包括文本元素和/或链接元素;将待测样本分别输入到预先训练好的双向特征检测器进行双向检测,基于与正向特征集合、负向特征集合的双向亲和度的比较结果,分别获得与正向特征的匹配结果和负向特征的匹配结果;当任一文本元素或链接元素为恶意特征,则待识别融合通信消息为垃圾信息。本发明专利技术能够解决常规垃圾消息检测特征空间重叠存在黑洞导致整体检测率低的问题,降低了算力需求,提升对涵盖富文本信息的RCS垃圾消息检测的准确率。

【技术实现步骤摘要】

所属的技术人员能够理解,本专利技术的各个方面可以实现为系统、方法或程序产品。因此,本专利技术的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。图13是本专利技术的融合通信的垃圾消息检测设备的示意图。下面参照图13描述根据本专利技术的这种实施方式的电子设备600。图13所示的电子设备600仅仅是一个示例,不应对本专利技术实施例的功能和使用范围带来任何限制。如图13所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述方法部分中描述的根据本专利技术各种示例性实施方式的步骤。例如,处理单元610可以执行如图1中所示的步骤。存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(rom)6203。存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:处理系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储平台等。本专利技术实施例还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现的融合通信的垃圾消息检测方法的步骤。在一些可能的实施方式中,本专利技术的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述方法部分中描述的根据本专利技术各种示例性实施方式的步骤。如上所示,该实施例本专利技术的融合通信的垃圾消息检测系统能够解决常规垃圾消息检测特征空间重叠存在黑洞导致整体检测率低的问题,降低了算力需求,提升对涵盖富文本信息的rcs垃圾消息检测的准确率。根据本专利技术的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本专利技术的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本专利技术处理的程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。综上,本专利技术的目的在于提供融合通信的垃圾消息检测方法、系统、设备及存储介质,能够解决常规垃圾消息检测特征空间重叠存在黑洞导致整体检测率低的问题,降低了算力需求,提升对涵盖富文本信息的rcs垃圾消息检测的准确率。以上内容是结合具体的优选实施方式对本专利技术所作的进一步详细说明,不能认定本专利技术的具体实施只局限于这些说明。对于本专利技术所属的普通技术人员来说,在不脱离本专利技术构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本专利技术的保护范围。


技术介绍

1、rcs:融合通信,是英文:rich communication suite,也叫融合通讯信,是gsma定义的消息服务,被认为是5g消息的重要组成部分。目前,rcs消息是用于替换sms消息的行业标准通信协议。是一套用于增强通信体验的标准和技术,旨在替代传统的短信(sms)和彩信(mms)服务。rcs提供了更丰富、更交互性的通信功能,使用户能够通过移动网络发送和接收富文本消息、共享高质量图片和视频、进行语音和视频通话以及实时位置共享等。

2、常规垃圾消息检测通常基于双方信任或基于内容的规则,基于双方信任的方法不适用于rcs消息应用的企业-个人渠道;基于内容的规则通常获取整个消息做特征匹配,在gdpr、《数据安全法》、《个人信息保护》等多种涉及数据及隐私保护规范的实施下,此种检测方法的正当性存疑。但在现有的垃圾消息检测方法中,需要获取rcs消息内容,部分专利仅局限于识别仅为rcs消息中的图片,局限性较强,且检测器输入需求过于细节,可能涉及客户隐私数据,需规避。

3、有鉴于此,本专利技术提出了一种融合通信的垃圾消息检测方法、系统、设备及存储介质。

4、需要说明的是,上述
技术介绍
部分公开的信息仅用于加强对本专利技术的本文档来自技高网...

【技术保护点】

1.一种融合通信的垃圾消息检测方法,其特征在于,包括以下步骤:

2.如权利要求1所述的融合通信的垃圾消息检测方法,其特征在于,所述采集待识别融合通信消息的至少部分内容,建立待测样本,所述待测样本包括文本元素和/或链接元素,包括:

3.如权利要求2所述的融合通信的垃圾消息检测方法,其特征在于,所述根据所述文本元素和链接元素分别建立待测样本集合,包括:

4.如权利要求1所述的融合通信的垃圾消息检测方法,其特征在于,所述采集待识别融合通信消息的至少部分内容,建立待测样本,所述待测样本包括文本元素和/或链接元素之前,还包括:

5.如权利要求4所述的融合通信的垃圾消息检测方法,其特征在于,所述将所述待测样本分别输入到预先训练好的双向特征检测器进行双向检测,基于与正向特征集合、负向特征集合的双向亲和度的比较结果,分别获得与正向特征的匹配结果和负向特征的匹配结果,包括:

6.如权利要求5所述的融合通信的垃圾消息检测方法,其特征在于,所述判断所述文本元素是否命中文本元素负向特征集合中的一个元素,若是,则所述文本元素为恶意特征,若否,根据所述文本元素分别与文本元素正向特征集合、文本元素负向特征集合的海明距离,判断所述文本元素为正向特征或负向特征,包括:

7.如权利要求5所述的融合通信的垃圾消息检测方法,其特征在于,所述判断所述文本元素是否命中文本元素负向特征集合中的一个元素,若是,则所述文本元素为恶意特征,若否,根据所述文本元素分别与文本元素正向特征集合、文本元素负向特征集合的海明距离,判断所述文本元素为正向特征或负向特征,包括:

8.如权利要求5所述的融合通信的垃圾消息检测方法,其特征在于,所述判断所述链接元素是否命中链接元素负向特征集合中的一个元素,若是,则所述链接元素为负向特征,若否,根据所述链接元素分别与链接元素正向特征集合、链接元素负向特征集合的海明距离,判断所述链接元素为正向特征或负向特征,包括:

9.如权利要求5所述的融合通信的垃圾消息检测方法,其特征在于,所述判断所述链接元素是否命中链接元素负向特征集合中的一个元素,若是,则所述链接元素为负向特征,若否,根据所述链接元素分别与链接元素正向特征集合、链接元素负向特征集合的海明距离,判断所述链接元素为正向特征或负向特征,包括:

10.如权利要求4所述的融合通信的垃圾消息检测方法,其特征在于,所述将所述待测样本分别输入到预先训练好的双向特征检测器进行双向检测,基于与正向特征集合、负向特征集合的双向亲和度的比较结果,分别获得与正向特征的匹配结果和负向特征的匹配结果,包括:

11.如权利要求1所述的融合通信的垃圾消息检测方法,其特征在于,所述当任一所述文本元素或链接元素为恶意特征,则所述待识别融合通信消息为垃圾信息,包括:

12.如权利要求11所述的融合通信的垃圾消息检测方法,其特征在于,所述将不包含恶意特征的待识别融合通信消息作为安全信息,替换为:

13.一种融合通信的垃圾消息检测系统,其特征在于,包括:

14.一种融合通信的垃圾消息检测设备,其特征在于,包括:

15.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被处理器执行时实现权利要求1至12中任意一项所述融合通信的垃圾消息检测方法的步骤。

...

【技术特征摘要】

1.一种融合通信的垃圾消息检测方法,其特征在于,包括以下步骤:

2.如权利要求1所述的融合通信的垃圾消息检测方法,其特征在于,所述采集待识别融合通信消息的至少部分内容,建立待测样本,所述待测样本包括文本元素和/或链接元素,包括:

3.如权利要求2所述的融合通信的垃圾消息检测方法,其特征在于,所述根据所述文本元素和链接元素分别建立待测样本集合,包括:

4.如权利要求1所述的融合通信的垃圾消息检测方法,其特征在于,所述采集待识别融合通信消息的至少部分内容,建立待测样本,所述待测样本包括文本元素和/或链接元素之前,还包括:

5.如权利要求4所述的融合通信的垃圾消息检测方法,其特征在于,所述将所述待测样本分别输入到预先训练好的双向特征检测器进行双向检测,基于与正向特征集合、负向特征集合的双向亲和度的比较结果,分别获得与正向特征的匹配结果和负向特征的匹配结果,包括:

6.如权利要求5所述的融合通信的垃圾消息检测方法,其特征在于,所述判断所述文本元素是否命中文本元素负向特征集合中的一个元素,若是,则所述文本元素为恶意特征,若否,根据所述文本元素分别与文本元素正向特征集合、文本元素负向特征集合的海明距离,判断所述文本元素为正向特征或负向特征,包括:

7.如权利要求5所述的融合通信的垃圾消息检测方法,其特征在于,所述判断所述文本元素是否命中文本元素负向特征集合中的一个元素,若是,则所述文本元素为恶意特征,若否,根据所述文本元素分别与文本元素正向特征集合、文本元素负向特征集合的海明距离,判断所述文本元素为正向特征或负向特征,包括:

8.如权利要...

【专利技术属性】
技术研发人员:张昊迪金华敏王帅
申请(专利权)人:中国电信股份有限公司技术创新中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1