System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() API业务自动分类方法、系统和电子设备技术方案_技高网

API业务自动分类方法、系统和电子设备技术方案

技术编号:41287533 阅读:6 留言:0更新日期:2024-05-11 09:36
本申请提供一种API业务自动分类方法、系统、电子设备和可读存储介质,涉及数据安全领域。该技术方案对获取API接口的报文数据进行解析得到解析数据,并将所述解析数据转换为预设结构的目标解析数据;然后对所述目标解析数据进行关键词识别匹配,确定所述目标解析数据中的关键词,并根据预设的权重词库确定各个所述关键词的权重,并将所述关键词的权重中排列在前的N个关键词进行标记,得到标记后的目标关键词,N为大于或等于2的整数;最后将所述目标关键词转换为对应的业务语义,并根据所述业务语义确定所述报文数据对应的API业务类型,可实现对大量API接口的快速精确分类,满足分类效率和质量的需求。

【技术实现步骤摘要】

本申请涉及数据安全领域,具体涉及一种api业务自动分类方法、系统和电子设备。


技术介绍

1、随着互联网技术的迅速发展,各类应用程序接(application programminginterface,api)正在快速增加。api使不同应用程序和服务能够相互通信与交互,在构建数字化服务时发挥着重要作用。然而,对于大规模的api,如何快速识别其业务类别和属性仍存在挑战。目前,api业务类别的识别主要依靠人工读取接口文档来判断,这种方法效率低下,无法满足大规模自动化的需要。


技术实现思路

1、本申请提供了一种api业务自动分类方法、系统和电子设备,能够实现高效的api业务分类。

2、本申请实施例的技术方案如下:

3、第一方面,本申请实施例提供了一种api业务自动分类方法,方法包括:

4、对获取api接口的报文数据进行解析得到解析数据,并将所述解析数据转换为预设结构的目标解析数据;

5、对所述目标解析数据进行关键词识别匹配,确定所述目标解析数据中的关键词,并根据预设的权重词库确定各个所述关键词的权重,并将所述关键词的权重中排列在前的n个关键词进行标记,得到标记后的目标关键词,n为大于或等于2的整数;

6、将所述目标关键词转换为对应的业务语义,并根据所述业务语义确定所述报文数据对应的api业务类型。

7、在上述技术方案中,本申请通过对获取的api接口报文数据进行解析、转换为预设结构的数据后,利用预设的结构的解析数据进行识别,实现自动识别。该技术方案实现了api业务类别的自动分类识别。

8、相比现有的人工判断分类方式,本申请的技术方案可大幅提高api业务类别分类的效率。其中,报文数据的自动解析保证了结构化数据的整齐统一,有利于后续技术处理,转换为预设结构后,可针对性地应用关键词识别等技术手段;关键词的自动识别及权重计算赋予了不同关键词不同重要性,标记出主要关键词,降低后续匹配的难度;标记后的目标关键词再通过匹配转换为标准业务语义,可减少歧义,提高匹配准确性,实现了自动、高效、准确的api业务类别分类。

9、在本申请的一些实施例中,所述对获取api接口的报文数据进行解析得到解析数据,包括:

10、使用预设的网络抓包工具捕获到api接口的请求报文;

11、对所述请求报文进行解析得到解析数据。

12、在上述技术方案中,采用预设网络抓包工具捕获api接口报文,可动态获取接口实际运行时的原始请求报文,包含业务参数等对分类作用关键的信息,可反映接口的实际业务属性。获得原始报文之后,对报文进行解析,通过预设报文提取规则定位关键信息,并转换成结构化格式的数据。进行报文解析预处理可过滤冗余信息,输出对自动分类输入要求的数据格式。由于报文解析规范化了关键信息的表达,有利于对应用自动化技术的处理。该报文抓取和解析技术手段,可获得大量真实接口的业务报文作为样本,并通过解析输出规范化的数据结构,为后续的关键词识别及业务匹配技术的应用提供了有效输入,以实际报文为基础,支持后续技术自动判定报文类别,实现报文到类别的准确映射,提高了分类的准确率。

13、在本申请的一些实施例中,所述对所述目标解析数据进行关键词识别匹配,确定所述目标解析数据中的关键词之前,还包括:根据预设词库构建ac自动机。

14、在上述技术方案中,先根据预设业务词库构建ac自动机,将词汇转换为状态转移机,再对解析后的数据进行ac自动机匹配。构建ac自动机可大幅减少后续匹配查询中的不必要比对,通过转移路径直接锁定匹配词项,实现对海量数据的高效关键词查找。相比遍历查询,应用ac自动机可快速锁定目标解析数据中的关键词,从而极大缩短匹配时间,提高了关键词识别的效率。而高效的关键词识别可为后续确定词权重及转换业务语义提供有效输入,保证整体分类流程的快速响应。构建ac自动机实现快速匹配的步骤,通过缩短匹配时间减少了时间消耗,有效提升了关键词识别和进一步的分类分析处理的效率,增强了整体方案的实时性。

15、在本申请的一些实施例中,所述对所述目标解析数据进行关键词识别匹配,确定所述目标解析数据中的关键词,包括:

16、通过所述ac自动机对所述目标解析数据中的关键词进行提取,确定所述目标解析数据中的关键词。

17、在上述技术方案中,采用ac自动机对解析后的数据进行关键词提取。ac自动机可通过状态转移路径直接匹配取得关键词,无需逐词遍历和查询,可实现对大规模解析数据的高效关键词识别。应用ac自动机快速提取关键词,可跳过复杂的数据处理和不必要的字符串比对,直接输出目标解析数据中的关键信息。这样可缩短匹配时间,加快获得关键词的速度。而关键词的快速高效确定,可为后续的词权重分析及业务语义转换提供有效输入,降低整体分类时间,保证分类响应的实时性。可以看出,利用ac自动机实现关键词快速提取,通过加速匹配获取关键信息,有效优化了关键词识别流程,提升了整个分类方案的时间效率。

18、在本申请的一些实施例中,所述将所述目标关键词转换为对应的业务语义,包括:

19、利用预设的业务词典对所述目标关键词进行匹配,得到所述目标关键词对应的业务语义。

20、在上述技术方案中,采用业务词典匹配的方式将目标关键词转换为业务语义。运用预定义的业务词典,可以直接根据词典中的映射关系,将抽象的关键词匹配到具体的业务含义上。这样可以跳过依靠主观经验进行的业务判断,直接获得与目标关键词对应的标准业务语义,实现从目标关键词到业务语义的自动转换。得到明确的业务语义,可为后续判断报文类别提供按业务角度的判断依据。可以看出,应用业务词典进行目标关键词自动转换,通过直接匹配词典实现从目标关键词到标准业务语义的高效映射,规范了业务语义的表达,避免了主观猜测,增强了报文分类的业务符合度。

21、在本申请的一些实施例中,在所述利用预设的业务词典对所述目标关键词进行匹配,得到所述目标关键词对应的业务语义之前,还包括:根据api业务场景选择所述预设的业务词典。

22、在上述技术方案中,在进行目标关键词转换前,先根据api报文的业务场景选择对应领域的业务词典。因为不同业务场景所涉及的业务语义各不相同,针对不同领域构建独立的业务词典,可以确保词典涵盖该场景下的完整业务语义。应用与报文场景匹配的业务词典进行转换,可以最大限度减少引入不相关语义的误差可能,保证关键词可完全映射到正确的业务语义空间,提高转换的准确性。可以看出,场景导向选择业务词典进行关键词转换,通过构建独立的语义空间避免混淆,增强了关键词到业务语义转换的正确性,为后续的报文分类提供了清晰、准确的业务判断依据。

23、在本申请的一些实施例中,在所述根据所述业务语义确定所述报文数据对应的api业务类型之后,还包括:将所述业务语义以及所述报文数据对应的api业务类型存储在clickhouse库中,并使用预设的clickhouse的监控工具跟踪clickh本文档来自技高网...

【技术保护点】

1.一种API业务自动分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对获取API接口的报文数据进行解析得到解析数据,包括:

3.根据权利要求1所述的方法,其特征在于,所述对所述目标解析数据进行关键词识别匹配,确定所述目标解析数据中的关键词之前,还包括:根据预设词库构建AC自动机。

4.根据权利要求3所述的方法,其特征在于,所述对所述目标解析数据进行关键词识别匹配,确定所述目标解析数据中的关键词,包括:

5.根据权利要求1所述的方法,其特征在于,所述将所述目标关键词转换为对应的业务语义,包括:

6.根据权利要求5所述的一种API业务自动分类方法,其特征在于,在所述利用预设的业务词典对所述目标关键词进行匹配,得到所述目标关键词对应的业务语义之前,还包括:根据API业务场景选择所述预设的业务词典。

7.根据权利要求1所述的方法,其特征在于,在所述根据所述业务语义确定所述报文数据对应的API业务类型之后,还包括:将所述业务语义以及所述报文数据对应的API业务类型存储在ClickHouse库中,并使用预设的ClickHouse的监控工具跟踪ClickHouse库的存储过程。

8.一种API业务自动分类系统,其特征在于,所述系统包括:

9.一种电子设备,其特征在于,包括处理器(501)、存储器(505)、用户接口(503)、通信总线(502)及网络接口(504),所述处理器(501)、所述存储器(505)、所述用户接口(503)、及所述网络接口(504)分别与所述通信总线(502)连接,所述存储器(505)用于存储指令,所述用户接口(503)和网络接口(504)用于给其他设备通信,所述处理器(501)用于执行所述存储器(505)中存储的指令,以使所电子设备(500)执行如权利要求1-7任意一项所述的方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有指令,当所述指令被执行时,执行如权利要求1-7任意一项所述的方法。

...

【技术特征摘要】

1.一种api业务自动分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对获取api接口的报文数据进行解析得到解析数据,包括:

3.根据权利要求1所述的方法,其特征在于,所述对所述目标解析数据进行关键词识别匹配,确定所述目标解析数据中的关键词之前,还包括:根据预设词库构建ac自动机。

4.根据权利要求3所述的方法,其特征在于,所述对所述目标解析数据进行关键词识别匹配,确定所述目标解析数据中的关键词,包括:

5.根据权利要求1所述的方法,其特征在于,所述将所述目标关键词转换为对应的业务语义,包括:

6.根据权利要求5所述的一种api业务自动分类方法,其特征在于,在所述利用预设的业务词典对所述目标关键词进行匹配,得到所述目标关键词对应的业务语义之前,还包括:根据api业务场景选择所述预设的业务词典。

7.根据权利要求1所述的方法,其特征在于,在所述根据所述业务语义确定所述报文数据对应的ap...

【专利技术属性】
技术研发人员:刘浩然
申请(专利权)人:北京安胜华信科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1