一种泄露代码检索方法、装置及计算机可读存储介质制造方法及图纸

技术编号:36537866 阅读:14 留言:0更新日期:2023-02-01 16:27
本申请涉及一种泄露代码检索处理方法、装置及计算机可读存储介质。所述方法包括:当接收到对应于泄露代码关键词的检索指令时,爬取对应于泄露代码关键词的项目信息;根据检索请求类型,构建对应于检索请求类型的检索语句;将检索语句在项目信息中进行检索,得到对应于检索语句的检索结果;通过本申请方案的实施,根据检索请求类型构建检索语句,并在对应于泄露代码关键词的项目信息进行检索,从检索结果中获到泄露代码的位置信息,从而有效地提高泄露代码检索的效率。露代码检索的效率。露代码检索的效率。

【技术实现步骤摘要】
一种泄露代码检索方法、装置及计算机可读存储介质


[0001]本申请涉及信息安全
,尤其涉及一种泄露代码检索方法、装置及计算机可读存储介质。

技术介绍

[0002]目前在监测和检测泄露代码时,如在对GitHub平台上的泄露代码进行检测时,现有的相关技术通常采用调用GitHub平台的API接口的方式,通过接口的检索功能实现与关键词相关的开源项目和项目代码的检索。
[0003]这种方式会受到GitHub平台API接口的限制和影响,例如在搜索代码时,GitHub的API接口频率限制很大(认证后只有30次/分钟),无法满足快速搜索;在实际搜索时,某些项目关键词的搜索结果项可能会超过100条,而API在设置per_page参数后至多支持展现100条结果项,无法完全展示搜索结果;并且由于接口功能的限制,只能检测接口提供的与关键词相关项目信息,无法提供关键词所在项目的上下文代码片段;无法进行并行检索,从而大大降低了关键词检索的效率。

技术实现思路

[0004]本申请实施例提供了一种泄露代码检索方法、装置及计算机可读存储介质,至少能够解决相关技术在通过关键词进行泄露代码检索时效率较低且不能并行检索的问题。
[0005]本申请实施例第一方面提供了一种泄露代码检索方法,包括:
[0006]当接收到对应于泄露代码关键词的检索指令时,爬取对应于所述泄露代码关键词的项目信息;
[0007]根据检索请求类型,构建对应于所述检索请求类型的检索语句;其中,所述检索请求类型包括:敏感路径检索请求、敏感代码关键词检索请求、敏感文件名检索请求;
[0008]将所述检索语句在所述项目信息中进行检索,得到对应于所述检索语句的检索结果;其中,所述检索结果为对应于所述泄露代码关键词的位置信息。
[0009]本申请实施例第二方面提供了一种泄露代码检索装置,包括:
[0010]爬取模块,用于当接收到泄露代码关键词的检索指令时,爬取对应于所述泄露代码关键词的项目信息;
[0011]构建模块,用于根据检索请求类型,构建对应于所述检索请求类型的检索语句;其中,所述检索请求类型包括:敏感路径检索请求、敏感代码关键词检索请求、敏感文件名检索请求;
[0012]检索模块,用于将所述检索语句在所述项目信息中进行检索,获得对应于所述检索语句的检索结果;其中,所述检索结果为对应于所述泄露代码关键词的位置信息。
[0013]本申请实施例第三方面提供了一种电子装置,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现上述本申请实施例第一方面提供的泄露代码检索方法中的各步骤。
[0014]本申请实施例第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,实现上述本申请实施例第一方面提供的泄露代码检索方法中的各步骤。
[0015]由上可见,根据本申请方案所提供的泄露代码检索方法、装置及计算机可读存储介质,当接收到对应于泄露代码关键词的检索指令时,爬取对应于泄露代码关键词的项目信息;根据检索请求类型,构建对应于检索请求类型的检索语句;其中,检索请求类型包括:敏感路径检索请求、敏感代码关键词检索请求、敏感文件名检索请求;将检索语句在项目信息中进行检索,得到对应于检索语句的检索结果;其中,检索结果为对应于泄露代码关键词的位置信息。通过本申请方案的实施,根据检索请求类型构建检索语句,并在对应于泄露代码关键词的项目信息进行检索,从检索结果中获到泄露代码的位置信息,从而有效地提高泄露代码检索的效率。
附图说明
[0016]图1为本申请第一实施例提供的泄露代码检索方法的基本流程示意图;
[0017]图2为本申请第二实施例提供的泄露代码检索方法的细化流程示意图;
[0018]图3为本申请第三实施例提供的一种泄露代码检索装置的模块示意图;
[0019]图4为本申请第四实施例提供的电子装置的结构示意图。
具体实施方式
[0020]为了使本申请的专利技术目的、技术方案及优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而非全部实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0021]为了解决相关技术在检索泄露代码时采用API接口方式受到限制且不能并行检索的问题,本申请第一实施例提供了一种泄露代码检索方法,该方法是GitHub平台上实施的,如图1为本实施例提供的泄露代码检索方法的基本流程图,该泄露代码检索方法包括以下步骤:
[0022]步骤101、当接收到对应于泄露代码关键词的检索指令时,爬取对应于泄露代码关键词的项目信息。
[0023]具体的,在本实施例中,根据用户输入的与泄露代码有关的关键词,对所有与该关键词相关的项目进行爬取,得到对应于该关键词的项目信息,例如项目名称、项目项目创建人信息等。
[0024]在本实施例一些实施方式中,在爬取对应于泄露代码关键词的项目信息的步骤之前,还包括:获取账户名和账户口令,根据爬虫技术对账户名和账户口令进行身份认证;当身份认证通过时,执行爬取对应于泄露代码关键词的项目信息的步骤。
[0025]具体的,在本实施例中,在进行爬取对应于泄露代码的项目信息之前还会进行身份认证,通过从预先配置好的文件例如Config文件中获取登录GitHub平台的账户名和账户口令,通过爬虫技术请求进行身份认证,在认证通过时,执行爬取对应于泄露代码关键词的
项目信息的步骤。
[0026]在本实施例另一些实施方式中,在爬取对应于泄露代码关键词的项目信息的步骤之后,还包括:将爬取得到的项目信息进行去重;基于去重得到的项目信息生成项目列表的步骤。
[0027]具体的,在本实施例中,根据对应于泄露代码的关键词进行爬取得到的相关项目信息可能会存在重复的情况,因此可将爬取得到的项目信息进行去重处理,并根据去重处理后的项目信息生成项目列表total_project_list。
[0028]步骤102、根据检索请求类型,构建对应于检索请求类型的检索语句。
[0029]具体的,本实施例中检索请求类型包括敏感路径检索请求、敏感代码关键词检索请求、敏感文件名检索请求。在实际检索时,需要对检索结果中的多项信息再进行处理,以获得更多细致的信息,因此可通过不同类型的检索请求再构建对应的检索语句以获取更精确的信息。
[0030]在本实施例一些实施方式中,根据检索请求类型,构建对应于检索请求类型的检索语句的步骤,包括:获取预设的存储文件;其中,存储文件用于存储对应于检索请求类型的检索词;检索词包括:敏感路径名、敏感代码关键词、敏感文件名;根据检索请求类型,读取对应于检索请求类型的存储文件中的检索词;将检索词与检索语法进行拼接,构建对应于检索请求类型的检索语句;其中,检本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种泄露代码检索方法,其特征在于,包括:当接收到对应于泄露代码关键词的检索指令时,爬取对应于所述泄露代码关键词的项目信息;根据检索请求类型,构建对应于所述检索请求类型的检索语句;其中,所述检索请求类型包括:敏感路径检索请求、敏感代码关键词检索请求、敏感文件名检索请求;将所述检索语句在所述项目信息中进行检索,得到对应于所述检索语句的检索结果;其中,所述检索结果为对应于所述泄露代码关键词的位置信息。2.根据权利要求1所述的泄露代码检索方法,其特征在于,所述爬取对应于所述泄露代码关键词的项目信息的步骤之后,还包括:将爬取得到的所述项目信息进行去重;基于去重得到的所述项目信息生成项目列表;所述将所述检索语句在所述项目信息中进行检索的步骤,包括:将所述检索语句在所述项目列表内的项目信息中进行检索。3.根据权利要求1所述的泄露代码检索方法,其特征在于,所述根据检索请求类型,构建对应于所述检索请求类型的检索语句的步骤,包括:获取预设的存储文件;其中,所述存储文件用于存储对应于所述检索请求类型的检索词;所述检索词包括:敏感路径名、敏感代码关键词、敏感文件名;根据所述检索请求类型,读取对应于所述检索请求类型的存储文件中的检索词;将所述检索词与检索语法进行拼接,构建对应于所述检索请求类型的检索语句;其中,所述检索语法包括:公开的检索语法、未公开的检索语法。4.根据权利要求3所述的泄露代码检索方法,其特征在于,所述将所述检索词与检索语法进行拼接,构建对应于所述检索请求类型的检索语句的步骤,包括:将所述敏感路径名与所述公开的检索语法进行拼接,构建敏感路径检索语句;将所述敏感代码关键词与所述未公开的检索语法进行拼接,构建敏感代码关键词检索语句;将所述敏感文件名与所述公开的检索语法进行拼接,构建敏感文件名检索语句。5.根据权利要求4所述的泄露代码检索方法,其特征在于,所述将所述检索语句在所述项目信息中进行检索,得到对应于所述检索语句的检索结果的步骤,包括:将所述敏感路径检索语句在所述项目信息中进行检索,得到对应于所述敏感路径检索语...

【专利技术属性】
技术研发人员:裴伟伟万振华
申请(专利权)人:深圳开源互联网安全技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1