【技术实现步骤摘要】
代码相似函数检测方法、装置、电子设备及存储介质
[0001]本公开实施例涉及计算机
,尤其涉及一种代码相似函数检测方法、装置、电子设备及存储介质。
技术介绍
[0002]目前,在前端项目质量检测过程中,代码的重复度是一项很重要的指标,随着项目的不断开发迭代和功能累加,重复代码会逐渐出现,而过高的代码重复度,会导致项目的稳定性降低,提高项目维护成本。
[0003]现有技术中,对代码的重复度检测,通常是通过开源的代码检测功能库,对代码进行完全克隆检测,但这种方案只能检测出代码中完全一致的函数,而无法对功能相同,但参数、函数名不同的相似函数进行检测,导致代码的重复率检测准确性低的问题。
技术实现思路
[0004]本公开实施例提供一种代码相似函数检测方法、装置、电子设备及存储介质,以克服无法对相似函数进行检测的问题。
[0005]第一方面,本公开实施例提供一种代码相似函数检测方法,包括:
[0006]解析待检测代码,得到抽象语法树;通过遍历所述抽象语法树,得到所述抽象语法树中至少两个子树 ...
【技术保护点】
【技术特征摘要】
1.一种代码相似函数检测方法,其特征在于,所述方法包括:解析待检测代码,得到抽象语法树;通过遍历所述抽象语法树,得到所述抽象语法树中至少两个子树,所述子树用于表征所述待检测代码中的函数体;根据各所述子树的节点,确定至少两个相似子树,并将所述至少两个相似子树对应的函数体,确定为相似函数,其中,各所述相似子树的对应节点的类型相同。2.根据权利要求1所述的方法,其特征在于,通过遍历所述抽象语法树,得到所述抽象语法树中至少两个子树,包括:基于预设算法,对所述抽象语法树进行遍历,获得至少两个节点;根据各所述节点的节点信息,确定至少两个子树。3.根据权利要求2所述的方法,其特征在于,所述节点信息中包括节点类型;根据各所述节点的节点信息,确定至少两个子树,包括:根据各所述节点的节点信息,确定各所述节点的节点类型;根据各所述节点的节点类型,确定至少两个子树。4.根据权利要求2所述的方法,其特征在于,所述预设算法包括深度优先遍历算法,基于预设算法,对所述抽象语法树进行遍历,获得至少两个节点,包括:基于深度优先遍历算法,对所述抽象语法树进行前序遍历,获得至少两个节点。5.根据权利要求1所述的方法,其特征在于,根据各所述子树的节点,确定至少两个相似子树,包括:获取各所述子树的至少两个节点的节点类型;根据各所述子树的至少两个节点的节点类型,确定子树类型;将所述子树类型相同的子树,确定为相似子树。6.根据权利要求5所述的方法,其特征在于,根据各所述子树的至少两个节点的节点类型,确定子树类型,包括:对各所述子树中的至少两个节点的节点类型进行哈希计算,生成与各所述子树分别对应的类型哈希值;根据各所述子树对应的类型哈希值,确定子树类型。7.根据权利要求5所述的方法,其特征在于,所述方法还包括:获取各所述子树中预设长度的节点,生成目标节点;对各所述子树中的至少两个节点的节点类型进行哈希计算,生成与各所述子树分别对应的类型哈希值,包括:对各所述子树中的目标节点的节点类型进行哈希计算,生成与各所述子树分别对应的类型哈...
【专利技术属性】
技术研发人员:刘江虹,
申请(专利权)人:北京有竹居网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。