一种报文检测方法、装置、设备及可读存储介质制造方法及图纸

技术编号:39329281 阅读:10 留言:0更新日期:2023-11-12 16:06
本发明专利技术实施例涉及大数据技术领域,公开了一种报文检测方法、装置、设备及可读存储介质,报文检测方法包括:获取预设敏感词库中的敏感词数据;对所述敏感词数据中的敏感词进行分类处理,建立敏感词报送规则;基于敏感词报送规则对待检测报文进行检测。本申请以现有预设敏感词库为基础,对敏感词进行分类处理,建立敏感词报送规则,并基于敏感词报送规则对待检测报文进行敏感词检测,解决了现有技术中银行的征信系统缺少对征信数据报文的敏感词筛查功能的技术问题,实现了能够快速、精准的对征信数据报文中的敏感词进行筛查的技术效果。数据报文中的敏感词进行筛查的技术效果。数据报文中的敏感词进行筛查的技术效果。

【技术实现步骤摘要】
一种报文检测方法、装置、设备及可读存储介质


[0001]本专利技术实施例涉及大数据
,尤其涉及一种报文检测方法、装置、设备及可读存储介质。

技术介绍

[0002]基于敏感词的风控报送策略是人行报送制度和监管报送制度最基本报送质量要求,这不仅承担着为人行产品过滤基础风险的功能,也为了保障客户征信的健康绿色展示。
[0003]但现有银行的征信系统缺少对征信数据报文的敏感词筛查,无法满足的监管对于征信数据报文筛查的硬性制度要求。

技术实现思路

[0004]本专利技术实施例提供一种报文检测方法、装置、设备及可读存储介质,解决了现有技术中银行的征信系统缺少对征信数据报文的敏感词筛查功能的技术问题。
[0005]第一方面,本申请提供了一种报文检测方法,所述报文检测方法包括:
[0006]获取预设敏感词库中的敏感词数据,其中,所述敏感词数据至少包括敏感词以及对应的预设词性标识,所述预设词性标识为所述敏感词在进入所述预设敏感词库中时依据敏感词检测经验设置的标签;
[0007]对所述敏感词数据中的敏感词进行分类处理,建立敏感词报送规则,其中,分类处理的依据为基于所述预设词性标识判断所述敏感词是否需要被直接过滤或屏蔽的判断结果;
[0008]基于所述敏感词报送规则对待检测报文进行检测。
[0009]第二方面,本申请提供了一种报文检测装置,所述报文检测装置包括:
[0010]数据获取单元,用于获取预设敏感词库中的敏感词数据,其中,所述敏感词数据至少包括敏感词以及对应的预设词性标识,所述预设词性标识为所述敏感词在进入所述预设敏感词库中时依据敏感词检测经验设置的标签;
[0011]规则建立单元,用于对所述敏感词数据中的敏感词进行分类处理,建立敏感词报送规则,其中,分类处理的依据为基于所述预设词性标识判断所述敏感词是否需要被直接过滤或屏蔽的判断结果;
[0012]报文检测单元,用于基于所述敏感词报送规则对待检测报文进行检测。
[0013]第三方面,本申请提供了一种报文检测设备,所述报文检测设备包括:
[0014]至少一个处理器;以及
[0015]与所述至少一个处理器通信连接的存储器;其中,
[0016]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请第一方面所述的报文检测方法。
[0017]第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质存
储有计算机指令,所述计算机指令用于使处理器执行时实现本申请第一方面所述的报文检测方法。
[0018]第五方面,本申请提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序在被处理器执行时实现本申请第一方面所述的报文检测方法。
[0019]本专利技术实施例公开了一种报文检测方法、装置、设备及可读存储介质,报文检测方法包括:获取预设敏感词库中的敏感词数据;对所述敏感词数据中的敏感词进行分类处理,建立敏感词报送规则;基于敏感词报送规则对待检测报文进行检测。本申请以现有预设敏感词库为基础,对敏感词进行分类处理,建立敏感词报送规则,并基于敏感词报送规则对待检测报文进行敏感词检测,解决了现有技术中银行的征信系统缺少对征信数据报文的敏感词筛查功能的技术问题,实现了能够快速、精准的对征信数据报文中的敏感词进行筛查的技术效果。
[0020]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0021]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0022]图1是本专利技术实施例提供的一种报文检测方法的流程图;
[0023]图2是本专利技术实施例提供的一种报文检测装置的结构图;
[0024]图3是本专利技术实施例提供的一种征信系统中的报文检测装置的结构图;
[0025]图4是本专利技术实施例提供的一种报文检测设备的结构示意图。
具体实施方式
[0026]为了使本
的人员更好地理解本专利技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0027]需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“I类”、“II类”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0028]图1是本专利技术实施例提供的一种报文检测方法的流程图,本实施例可适用于任何需要对报文数据进行敏感词检测的场景,该方法可以由报文检测装置来执行,该报文检测
装置可以采用硬件和/或软件的形式实现,并一般可集成于服务器中。本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
[0029]如图1所示,该报文检测方法具体包括如下步骤:
[0030]S101,获取预设敏感词库中的敏感词数据,其中,敏感词数据至少包括敏感词以及对应的预设词性标识,预设词性标识为敏感词在进入预设敏感词库中时依据敏感词检测经验设置的标签。
[0031]具体地,银行系统通常设置有预设敏感词库,为了减少工作量,可以利用现有预设敏感词库中的敏感词数据对待检测报文进行检测。在一个词汇被作为敏感词存入预设敏感词库时,通常需要对该敏感词设置相应的标签,例如,带有辱骂性的词语等会被打上相应的标签,再如,某些词汇在特定的地域由于口语化等原因可能存在不好的含义,因此由于地域差异可能存在含义差别的敏感词也会打上相应的标签。预设词性标识是根据日常对于敏感词进行检测时总结出的经验设置得到的。
[0032]在预设敏感词库中,储存的敏感词中包括有可能存在贬义歧义的词语、辱骂性词语、带有贬义的实时网络用于以及其他可能需要规避的词语。示例性地,“瓜”这词汇在通常情况下表示一种水果,在进入预设敏感词库时,其预设词性标识可以为常用水果的标签,但受到地域差异的影响,在一些地区的口语中“瓜”可能有“傻瓜”等贬义含义,因此其预设词性标识还会有地域性贬义的标签。...

【技术保护点】

【技术特征摘要】
1.一种报文检测方法,其特征在于,所述报文检测方法包括:获取预设敏感词库中的敏感词数据,其中,所述敏感词数据至少包括敏感词以及对应的预设词性标识,所述预设词性标识为所述敏感词在进入所述预设敏感词库中时依据敏感词检测经验设置的标签;对所述敏感词数据中的敏感词进行分类处理,建立敏感词报送规则,其中,分类处理的依据为基于所述预设词性标识判断所述敏感词是否需要被直接过滤或屏蔽的判断结果;基于所述敏感词报送规则对待检测报文进行检测。2.根据权利要求1所述的报文检测方法,其特征在于,对所述敏感词数据中的敏感词进行分类处理,建立敏感词报送规则包括:基于所述敏感词的所述预设词性标识对所述敏感词进行类型划分以及进行等级划分,得到所述敏感词报送规则,其中,进行类型划分的依据为判断所述敏感词是否需要被直接过滤或屏蔽的判断结果,进行等级划分的依据为判断所述敏感词是否需要通过复核流程确定是否被过滤或屏蔽的判断结果。3.根据权利要求2所述的报文检测方法,其特征在于,通过判断所述敏感词是否需要被直接过滤或屏蔽对所述敏感词进行类型划分包括:基于所述敏感词的所述预设词性标识判断所述敏感词是否需要被直接过滤或屏蔽;若需要,则所述敏感词记为正向敏感词;若不需要,则所述敏感词记为反向敏感词。4.根据权利要求2所述的报文检测方法,其特征在于,通过判断所述敏感词是否需要通过复核流程确定是否被过滤或屏蔽对所述敏感词进行等级划分包括:基于所述敏感词的所述预设词性标识判断所述敏感词是否需要进入复核流程;若否,则所述敏感词记为I类敏感词;若是,则所述敏感词记为II类敏感词。5.根据权利要求3所述的报文检测方法,其特征在于,在对所述敏感词进行类型划分之后,建立所述敏感词报送规则还包括:基于所述敏感词的类型划分结果设置所述敏感词的类型映射关系,其中,所述类型映射关系指一个敏感词与其所具有的敏感词类型之间的属性关系。6.根据权利要求1所述的报文检测方法,其特征在于,在建立敏感词报送规则之后,所述报文检测方法还包括:基于所述敏感词报送规则创建敏感词特征库,并将建立所述敏感词报送规则之后的所述敏感词存入所述敏感词特征库中。7.根据权利要求6所述的报文检测方法,其特征在于,基于所述敏感词报送规则对待检测报文进行检测包括:基于所述敏感词特征库中的敏感词对所述待检测报文进行检测。8.根据权利要求7所述的报文检测方法,其特征在于,基于所述敏感词特征库中的敏感词对所述待检测报文进行检测包括:获取并扫描所述待检测报文;基于所述敏感词特征库中的敏感词判断所述待检测报文的文本信息中是否命中相应的敏感词;若未命中,则直接将所述待检测报文执行报文上报流程;
若命中,则基于所述敏感词报送规则判断所述待检测报文中命中的敏感词是否需要被过滤或屏蔽;若不需要,则对所述待检测报文执行报文上报流程;若需要,则对所述待检测报文中命中的敏感词进行过滤或屏蔽后执行报文上报流程。9.一种报文检测装置,其特征在于,所述报文检测装置包括:数据获取单元,用于获取预设敏感词库中的敏感词数据,其中,所述敏感词数据至少包括敏感词以及对应的预设词性标识,所述预设词性标识为所述敏感词在进入所述预设敏感词库...

【专利技术属性】
技术研发人员:郑锦友
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1