【技术实现步骤摘要】
一种抽象语法树中节点的向量化表示方法及装置
本申请涉及计算机
,具体而言,涉及一种抽象语法树中节点的向量化表示方法及装置。
技术介绍
抽象语法树(AST)或语法树是用编程语言编写的源代码数据的抽象语法结构的树表示,树的每个节点表示在源代码数据中出现的构造。现有的抽象语法树中节点的向量化表示方法,通常直接对抽象语法树中节点的子节点进行编码,得到抽象语法树中节点的向量化表示。在实践中发现,现有的向量化表示方法仅使用其子节点而丢弃了兄弟节点和孙节点,从而导致节点信息丢失。可见,现有的抽象语法树中节点的向量化表示方法,无法准确地对抽象语法树中节点进行向量化表示。
技术实现思路
本申请实施例的目的在于提供一种抽象语法树中节点的向量化表示方法及装置,能够全面覆盖抽象语法树中所有节点,进而准确地对抽象语法树中节点进行向量化表示。本申请实施例第一方面提供了一种抽象语法树中节点的向量化表示方法,包括:获取待处理的抽象语法树;对所述抽象语法树进行广度优先遍历,得到第一序列,以及对所述抽象语法树进 ...
【技术保护点】
1.一种抽象语法树中节点的向量化表示方法,其特征在于,包括:/n获取待处理的抽象语法树;/n对所述抽象语法树进行广度优先遍历,得到第一序列,以及对所述抽象语法树进行深度优先遍历,得到第二序列;/n根据所述第一序列和所述第二序列,生成待处理编码序列;/n通过预先构建的向量化处理模型对所述待处理编码序列进行处理,得到所述抽象语法树中节点的向量化表示结果。/n
【技术特征摘要】
1.一种抽象语法树中节点的向量化表示方法,其特征在于,包括:
获取待处理的抽象语法树;
对所述抽象语法树进行广度优先遍历,得到第一序列,以及对所述抽象语法树进行深度优先遍历,得到第二序列;
根据所述第一序列和所述第二序列,生成待处理编码序列;
通过预先构建的向量化处理模型对所述待处理编码序列进行处理,得到所述抽象语法树中节点的向量化表示结果。
2.根据权利要求1所述的抽象语法树中节点的向量化表示方法,其特征在于,所述获取待处理的抽象语法树,包括:
获取待处理的源代码数据;
对所述源代码数据进行解析处理,得到所待处理的抽象语法树。
3.根据权利要求1所述的抽象语法树中节点的向量化表示方法,其特征在于,所述根据所述第一序列和所述第二序列,生成待处理编码序列,包括:
对所述第一序列和所述第二序列进行连接处理,得到连接序列;
对所述连接序列进行编码处理,得到待处理编码序列。
4.根据权利要求1所述的抽象语法树中节点的向量化表示方法,其特征在于,在所述通过预先构建的向量化处理模型对所述待处理编码序列进行处理,得到所述抽象语法树中节点的向量化表示结果之前,所述方法发还包括:
构建原始处理模型;
获取用于训练所述原始处理模型的训练数据和预设模型参数;
通过所述预设模型参数对所述原始处理模型进行调整,得到初始模型;
通过所述训练数据对所述初始模型进行训练,得到向量化处理模型。
5.根据权利要求4所述的抽象语法树中节点的向量化表示方法,其特征在于,所述预设模型参数至少包括所述待处理编码序列的编码维度值和预设代价函数;
通过所述预设模型参数对所述原始处理模型进行调整,得到初始模型,包括:
将所述原始...
【专利技术属性】
技术研发人员:董叶豪,刘盈,
申请(专利权)人:北京天融信网络安全技术有限公司,北京天融信科技有限公司,北京天融信软件有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。