【技术实现步骤摘要】
基于图挖掘的接口分析方法、装置及相关设备
[0001]本专利技术涉及数据分析领域,尤其涉及一种基于图挖掘的接口分析方法、装置、计算机设备及存储介质。
技术介绍
[0002]现有公司对网站服务性能优化及错误排查中需要对接口进行分析,其中,接口是指软件系统不同组成部分衔接的约定。现有方式对接口进行分析主要是采用正则表达式。分析过程为先获取所有的网络地址,即URL(Uniform Resource Identifier,统一资源定位符),再采用正则表达式方案是对所有URL中的接口使用正则表达式进行归一化处理,例如:URL1:https://api.example.com/v1/users/1;URL2:https://api.example.com/v1/users/2,归一化后得到的接口为https://api.example.com/v1/users,最后对得到的接口进行相应的分析,从而实现对网站服务性能优化及错误排查。
[0003]但上述方法需要人工参与,找出可归一化的接口,然后通过归一化的正则表达式来表示这个接口, ...
【技术保护点】
【技术特征摘要】
1.一种基于图挖掘的接口分析方法,其特征在于,包括:获取统一资源定位符数据集合,其中,所述统一资源定位符数据集合包括至少一条统一资源定位符数据;按照预设的选取方式,从所述统一资源定位符数据集合中选取出一条统一资源定位符数据作为待处理数据;对所述待处理数据进行链接分隔符识别,得到链接分隔符;采用所述链接分割符,对所述待处理符数据进行分割处理,将所述链接分割符之前的数据作为接口数据,并从所述统一资源定位符数据集合中移除所述待处理数据;将所述接口数据加入接口集合中,并返回所述按照预设的选取方式,从所述统一资源定位符数据集合中选取出一条统一资源定位符数据作为待处理数据的步骤继续执行,直到所有所述统一资源定位符数据选取完毕;基于树模型,对所述接口集合中所有接口数据进行分析,得到接口树模型;根据所述接口树模型,对应用接口进行分析,得到分析结果。2.根据权利要求1所述的方法,其特征在于,所述获取统一资源定位符数据集合,其中,所述统一资源定位符数据集合包括至少一个统一资源定位符数据之前,所述方法还包括:获取网站日志数据;基于预设的预处理方式,对所有所述网络日志数据进行数据预处理,并将通过预处理的网络日志数据加入到网络日志数据集合中;按照预设的选取顺序,从所述网站日志数据集合中选取出一条网站日志数据作为目标网站日志数据;基于预设的切分方式,对所述目标网站日志数据进行切分,得到切分数据集合,其中,所述切分数据集合中包括至少一条切分数据;基于所述切分数据集合,确认所述目标网络日志数据对应的统一资源定位符数据;将所述统一资源定位符数据加入统一资源定位符数据集合,并返回所述按照预设的选取顺序,从所述网站日志数据集合中选取出一条网站日志数据作为目标网站日志数据的步骤继续执行,直到所有所述网络日志数据选取完毕。3.根据权利要求2所述的方法,其特征在于,所述基于预设的预处理方式,对所有所述网络日志数据进行数据预处理,并将通过预处理的网络日志数据加入到网络日志数据集合中的步骤包括:对所有所述网络日志数据进行异常识别,得到每一条所述网络日志数据对应的识别结果;当所述识别结果为异常,则将所述识别结果对应的网络日志数据删除;当所述识别结果为正常,则将所述识别结果对应的网络日志数据加入到网络日志数据集合中。4.根据权利要求1所述的方法,其特征在于,所述基于树模型,对所述接口集合中所有接口数据进行分析,得到接口树模型的步骤包括:从所述接口集合中选取出一条接口数据作为初始接口数据;基于预设的节点识别方式,对所述初始接口数据进行节点识别,得到所述初始接口数据对应的所有初始节点;
基于树模型和所有所述初始节点,得到初始树模型;按照预设的选取顺序,从所述接口集合中选取出一条接口数据作为待识别数据;对所述待识别数据进行节点识别,得到所述待识别数据对应的所有待识别节点;将所述待识别节点加入所述初始树模型中,得到中间树模型;将所述中间树模型作为初始树模型,并返回所述按照预设的选取顺序,从所述接口集合中选取出一条接口数据作为待识别数据的步骤继续执行,直到所有所述接口数据选取完毕;对所述初始树模型进行归一化处理,得到接口树模型。5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述接口树模型,对应用接口进行分析,得到分析结果的步骤包括:对所述接口树模型进...
【专利技术属性】
技术研发人员:毕裕,
申请(专利权)人:深圳永安在线科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。