一种基于词法分析技术的代码注释率统计方法技术

技术编号：33637612 阅读：20 留言：0更新日期：2022-06-02 01:52

本发明专利技术提供了一种基于词法分析技术的代码注释率统计方法，包括加载源代码，基于词法分析工具对源代码进行解析，获得词法符号列表；每个词法符号包含的信息有：词法类型、词法文本内容，以及所在行号、列号信息；其中，词法类型包括关键字、块注释、行注释、字符串、括号、加减运算符；遍历词法符号列表，如果该词法符号的词法类型是块注释或者行注释，则进行下一步分析；本发明专利技术在词法分析阶段借助词法符号信息分析代码注释率，不需要经过语法分析阶段，即不需生成抽象语法树以及遍历语法树，相对于基于抽象语法树的分析方法能提升分析速度，节省内存空间。省内存空间。省内存空间。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于词法分析技术的代码注释率统计方法

[0001]本专利技术涉及代码分析领域，具体是一种基于词法分析技术的代码注释率统计方法。

技术介绍

[0002]代码注释率统计的意义：
[0003]代码注释率是衡量代码工程可维护性的重要指标之一，代码注释可以帮助开发人员回顾历史代码，还可以帮助其他维护人员理解代码含义，进而节省项目代码的维护成本。在很多优秀的开源项目中，核心模块的注释代码往往比程序代码还要多。
[0004]现有代码注释率统计方法：
[0005]1、基于文本匹配：匹配以//开头的代码行，/**/注释代码块匹配等；
[0006]2、基于抽象语法树结合排除法统计：抽象语法树中仅包含有效代码节点信息，不包含注释代码以及空行、空格等信息。在分析语法树时，可以统计出有效代码行数。另外基于文本分析可以得到文件的总代码行、空代码行，然后可根据公式计算得到：
[0007]注释行＝总代码行
‑
空行
‑
有效代码行；
[0008]以上方法的优缺点：
[0009]方法1：基于文本匹配，方式简单、速度快，但是统计不够准确，对于行中间或者末尾的注释无法准确处理，因为缺乏代码符号的位置信息进行辅助分析；
[0010]方法2：较方法1准确性有所提升，但是需要处理抽象语法树，内存开销较大以及效率相对低一些，并且针对行中间的注释代码以及文件头注释不能准确区分统计。

技术实现思路

[0011]本专利技术的目的在于提供一种基于词法分析技...

【技术保护点】

【技术特征摘要】
1.一种基于词法分析技术的代码注释率统计方法，其特征在于，包括以下步骤：步骤一、加载源代码，基于词法分析工具对源代码进行解析，获得词法符号列表；每个词法符号包含的信息有：词法类型、词法文本内容，以及所在行号、列号信息；其中，词法类型包括关键字、块注释、行注释、字符串、括号、加减运算符；步骤二、遍历词法符号列表，如果该词法符号的词法类型是块注释或者行注释，则进行下一步分析；步骤三、如果该词法符号的前一个词法符号不是常规代码符号，则表示该词...

【专利技术属性】
技术研发人员：何军，
申请(专利权)人：北京简单一点科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人