软件项目源代码中文查找方法、系统及介质技术方案

技术编号：32822968 阅读：18 留言：0更新日期：2022-03-26 20:21

本发明专利技术实施例公开了软件项目源代码中文查找方法、系统及介质，其中方法包括：选择查找范围；若查找范围是在文件中查找，则获取文件名、文件编码格式及输出结果目录；若查找范围是在文件夹中查找，则获取文件夹、文件类型后缀名、文件编码格式及输出结果目录；打开源码目录的指定文件；根据所述文件名或文件夹读取源代码文件，通过预设的注释内容正则表达式和中文字符串正则表达式，排除注释内容并提取中文字符串；将所述中文字符串写入所述指定excel文件中。本发明专利技术实施例能够提高开发效率，缩短开发周期。缩短开发周期。缩短开发周期。

全部详细技术资料下载

【技术实现步骤摘要】
软件项目源代码中文查找方法、系统及介质

[0001]本专利技术涉及计算机领域，特别涉及一种软件项目源代码中文查找方法、系统及介质。

技术介绍

[0002]在某些应用场景下，比如公司要将软件产品推向国际市场，而软件产品在开发阶段没有考虑应对多种语言版本，这时就需要对软件产品进行国际化改造，将项目源代码文件中代码里(不包括注释)的所有中文字符串用常量替换，以应对不同的语言版本切换，这时我们就需要提取项目中源代码的中文字符串，同时排除源代码中注释里的中文，用户只需要指定项目文件夹根目录，运行软件即可将源代码的中文字符串提取到excel文件中，通过对excel文件进行分析，把重复出现的字符串进行统一替换，也可以自己编写工具进行自动化替换，如此则能大大提高工作效率，降低人工成本。
[0003]目前市面上软件项目里源代码的中文查找方法：
[0004]一种是编程工具IDE自带的字符串查找插件，需要输入指定的中文字符串才能查找，如Eclipse的搜索功能，在不知道字符串内容的情况下是无法查找的。该方法需要知道中文字符具体内容，而我们事先并不知到项目中有哪些中文，因此无法满足需求。
[0005]第二种是人工查找方法，也是最原始的方法，即开发人员一个个文件一行行代码去查找，需要耗费大量的人力和时间，效率低，成本高，项目工期长，无法满足敏捷开发的需求。
[0006]第三种是采用第三方中文查找软件(如云月中文查找器)，但这些软件都是无差别查找，它们会把项目中的所有中文都查找出来，包括注释里的中文和源代码里的中

【技术保护点】

【技术特征摘要】
1.一种软件项目源代码中文查找方法，其特征在于，包括以下步骤：选择查找范围，所述查找范围包括在文件中查找和在文件夹中查找；若查找范围是在文件中查找，则获取文件名、文件编码格式及输出结果目录；若查找范围是在文件夹中查找，则获取文件夹、文件类型后缀名、文件编码格式及输出结果目录；打开输出结果目录的指定文件；根据所述文件名或文件夹读取源代码文件，通过预设的注释内容正则表达式和中文字符串正则表达式，排除注释内容并提取中文字符串；将所述中文字符串写入所述指定文件中。2.根据权利要求1所述的软件项目源代码中文查找方法，其特征在于，根据文件夹读取源代码文件包括：循环读取所述文件夹下的文件，将文件内容加载到内存中。3.根据权利要求1所述的软件项目源代码中文查找方法，其特征在于，根据文件夹读取源代码文件包括：确定所述文件夹包括子文件夹，递归读取所述子文件夹中的文件，将文件内容加载到内存中。4.根据权利要求1所述的软件项目源代码中文查找方法，其特征在于，所述注释内容正则表达式为："/\*{1,2}[\s\S]*？\*/|//[\s\S]*？\n|#[\s\S]*？\n"。5.根据权利要求1所述的软件项目源代码中文查找方法，其特征在于，用于匹配中文字符串的所述中文字符串正则表达式为："[\u4e00
‑
\u9fa5]+"。6.根据权利要求1所述的软件项目源代码中文查找方法，其特征...

【专利技术属性】
技术研发人员：杨春平，张科，沈贤沛，匡楚盛，张帆，
申请(专利权)人：珠海许继电气有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人