代码相似函数检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36729662 阅读:25 留言:0更新日期:2023-03-04 09:55
本公开实施例提供一种代码相似函数检测方法、装置、电子设备及存储介质,该方法通过解析待检测代码,得到抽象语法树;通过遍历抽象语法树,得到抽象语法树中至少两个子树,子树用于表征待检测代码中的函数体;根据各子树的节点,确定至少两个相似子树,并将至少两个相似子树对应的函数体,确定为相似函数,其中,各相似子树的对应节点的类型相同,由于将待检测代码转换为了抽象语法树,并基于对抽象语法树的静态分析,确定了节点的类型相同的相似子树,从而保证相似子树对应的函数体所实现的功能相同,进而根据相似子树所对应的函数体确定对应的相似函数,实现了对功能相同的相似函数的检测,提高了代码重复度检测的精确性。提高了代码重复度检测的精确性。提高了代码重复度检测的精确性。

【技术实现步骤摘要】
代码相似函数检测方法、装置、电子设备及存储介质


[0001]本公开实施例涉及计算机
,尤其涉及一种代码相似函数检测方法、装置、电子设备及存储介质。

技术介绍

[0002]目前,在前端项目质量检测过程中,代码的重复度是一项很重要的指标,随着项目的不断开发迭代和功能累加,重复代码会逐渐出现,而过高的代码重复度,会导致项目的稳定性降低,提高项目维护成本。
[0003]现有技术中,对代码的重复度检测,通常是通过开源的代码检测功能库,对代码进行完全克隆检测,但这种方案只能检测出代码中完全一致的函数,而无法对功能相同,但参数、函数名不同的相似函数进行检测,导致代码的重复率检测准确性低的问题。

技术实现思路

[0004]本公开实施例提供一种代码相似函数检测方法、装置、电子设备及存储介质,以克服无法对相似函数进行检测的问题。
[0005]第一方面,本公开实施例提供一种代码相似函数检测方法,包括:
[0006]解析待检测代码,得到抽象语法树;通过遍历所述抽象语法树,得到所述抽象语法树中至少两个子树,所述子树用于表征所本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种代码相似函数检测方法,其特征在于,所述方法包括:解析待检测代码,得到抽象语法树;通过遍历所述抽象语法树,得到所述抽象语法树中至少两个子树,所述子树用于表征所述待检测代码中的函数体;根据各所述子树的节点,确定至少两个相似子树,并将所述至少两个相似子树对应的函数体,确定为相似函数,其中,各所述相似子树的对应节点的类型相同。2.根据权利要求1所述的方法,其特征在于,通过遍历所述抽象语法树,得到所述抽象语法树中至少两个子树,包括:基于预设算法,对所述抽象语法树进行遍历,获得至少两个节点;根据各所述节点的节点信息,确定至少两个子树。3.根据权利要求2所述的方法,其特征在于,所述节点信息中包括节点类型;根据各所述节点的节点信息,确定至少两个子树,包括:根据各所述节点的节点信息,确定各所述节点的节点类型;根据各所述节点的节点类型,确定至少两个子树。4.根据权利要求2所述的方法,其特征在于,所述预设算法包括深度优先遍历算法,基于预设算法,对所述抽象语法树进行遍历,获得至少两个节点,包括:基于深度优先遍历算法,对所述抽象语法树进行前序遍历,获得至少两个节点。5.根据权利要求1所述的方法,其特征在于,根据各所述子树的节点,确定至少两个相似子树,包括:获取各所述子树的至少两个节点的节点类型;根据各所述子树的至少两个节点的节点类型,确定子树类型;将所述子树类型相同的子树,确定为相似子树。6.根据权利要求5所述的方法,其特征在于,根据各所述子树的至少两个节点的节点类型,确定子树类型,包括:对各所述子树中的至少两个节点的节点类型进行哈希计算,生成与各所述子树分别对应的类型哈希值;根据各所述子树对应的类型哈希值,确定子树类型。7.根据权利要求5所述的方法,其特征在于,所述方法还包括:获取各所述子树中预设长度的节点,生成目标节点;对各所述子树中的至少两个节点的节点类型进行哈希计算,生成与各所述子树分别对应的类型哈希值,包括:对各所述子树中的目标节点的节点类型进行哈希计算,生成与各所述子树分别对应的类型哈...

【专利技术属性】
技术研发人员:刘江虹
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1