程序代码的搜索处理方法、装置、设备及存储介质制造方法及图纸

技术编号:22022292 阅读:55 留言:0更新日期:2019-09-04 01:17
本发明专利技术实施例公开了一种程序代码的搜索处理方法、装置、设备及存储介质。其中,该方法包括:获取与用户的代码搜索条件匹配的搜索结果数据,所述搜索结果数据中包括多个代码文件;在所述搜索结果数据中,对重复的代码文件进行筛除处理;将筛除处理后的所述搜索结果数据,反馈给所述用户。本发明专利技术实施例可以在代码搜索引擎的搜索结果中识别重复代码文件,可以从识别出的众多重复代码文件中,选择一个代码文件进行展现,不展示其他重复的代码文件,提升了代码搜索引擎的代码搜索结果质量,节省了用户使用代码搜索引擎的成本,提高了用户使用代码搜索引擎使用效率。

Search Processing Method, Device, Equipment and Storage Medium of Program Code

【技术实现步骤摘要】
程序代码的搜索处理方法、装置、设备及存储介质
本专利技术实施例涉及互联网技术,尤其涉及一种程序代码的搜索处理方法、装置、设备及存储介质。
技术介绍
随着互联网的兴起,通用搜索引擎为大家所熟知,能够提供各类的相关信息。而基于满足软件开发人员的需求,出现了代码搜索引擎。代码搜索引擎能够根据软件开发人员的代码搜索请求,提供相关代码文件供软件开发人员参考、复用或者直接使用。在软件开发过程中,代码搜索引擎可以一定程度上大大提高软件的开发质量和效率。专利技术人在实现本专利技术的过程中,发现网络中的代码,例如,企业内网中的代码以及开源社区中的代码,都会存在大量的重复代码。而且重复代码的存在形式也是多种多样的。例如:存放路径或者文件名称不同,但是内容相同,内容不完全相同但是大部分内容一致,或者代码中的局部内容发送了重叠等等。因为代码搜索引擎呈现的结果条目是有限的,重复代码的出现,降低了代码搜索结果质量,影响了用户体验。而且搜索重复代码会浪费计算资源,降低代码搜索引擎的性能。
技术实现思路
本专利技术实施例提供一种程序代码的搜索处理方法、装置、设备及存储介质,以实现优化现有的程序代码搜索方法,提高搜索结果本文档来自技高网...

【技术保护点】
1.一种程序代码的搜索处理方法,其特征在于,包括:获取与用户的代码搜索条件匹配的搜索结果数据,所述搜索结果数据中包括多个代码文件;在所述搜索结果数据中,对重复的代码文件进行筛除处理;将筛除处理后的所述搜索结果数据,反馈给所述用户。

【技术特征摘要】
1.一种程序代码的搜索处理方法,其特征在于,包括:获取与用户的代码搜索条件匹配的搜索结果数据,所述搜索结果数据中包括多个代码文件;在所述搜索结果数据中,对重复的代码文件进行筛除处理;将筛除处理后的所述搜索结果数据,反馈给所述用户。2.根据权利要求1所述的方法,其特征在于,获取与用户的代码搜索条件匹配的搜索结果数据,所述搜索结果数据中包括多个代码文件,包括:获取用户通过代码搜索引擎输入的代码搜索条件;根据所述代码搜索条件,在根据至少一个代码库的代码文件所建立的索引库中进行搜索,获取与所述代码搜索条件匹配的搜索结果数据。3.根据权利要求1所述的方法,其特征在于,在所述搜索结果数据中,对重复的代码文件进行筛除处理,包括:比较所述搜索结果数据中任意两个代码文件的文件信息摘要,如果存在文件信息摘要相同的至少两个重复代码文件,则在所述重复代码文件中选择目标代码文件;筛除所述重复代码文件中,除去所述目标代码文件之外的其他代码文件。4.根据权利要求1所述的方法,其特征在于,在所述搜索结果数据中,对重复的代码文件进行筛除处理,包括:比较所述搜索结果数据中任意两个代码文件在至少一个信息维度上的相似度;如果存在满足相似度计算条件的至少两个重复代码文件,则在所述重复代码文件中选择目标代码文件;筛除所述重复代码文件中,除去所述目标代码文件之外的其他代码文件。5.根据权利要求4所述的方法,其特征在于,所述信息维度包括:代码文件存储路径、代码文件内容以及代码片段摘要中的一个或者多个。6.根据权利要求4所述的方法,其特征在于,在所述重复代码文件中选择目标代码文件,包括:获取用于存储各所述重复代码文件的目标代码库,并根据至少一项重要度因子对各所述目标代码库进行重要度排序;根据对所述目标代码库的重要度排序结果,在所述重复代码文件中选择所述目标代码文件。7.根据权利要求6所述的方法,其特征在于,所述重要度因子包括:代码库的被依赖次数、代码库的重要性标签以及代码库是否开放用户写权限...

【专利技术属性】
技术研发人员:刘志伟于澔白伟李涛
申请(专利权)人:百度时代网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1