The present application discloses an index generation method, a device, a search engine test system, and a readable storage medium for a search engine test. The method comprises the following steps: obtaining a list of uniform resource locators; obtaining the list of identification codes of the data according to the list of the uniform resource locators; and generating customized indexes according to the list of identification codes of the data. The method can guarantee the test instruction of search engine and provide the condition for system testing when the index size is greatly reduced.
【技术实现步骤摘要】
用于测试的索引生成方法、装置、系统及可读存储介质
本专利技术涉及互联网
,具体而言,涉及一种用于搜索引擎测试的索引生成方法、装置、搜索引擎测试系统及可读存储介质。
技术介绍
随着电商平台系统中商品数量的日益增长,对搜索引擎的要求越来越高,需要开发新的搜索引擎或不断完善现有搜索引擎的功能,以适应平台中商品数量的不断增长。在新的搜索引擎或搜索引擎的新功能上线之前,需要对其进行测试,如冒烟测试、回归测试及系统测试等。在现有的搜索引擎测试过程中,通常采用全量索引。全量索引包含了电商平台中所有商品数据,在测试时,将其全部加载到测试服务器的内存中。但该做法有如下缺陷:第一,测试服务器启动加载索引的时间过长,无法保证冒烟测试和回归测试的速度;第二,由于服务器启动时间过长,无法进行需要频繁重启搜索服务器的系统测试;第三,由于全量索引过大,对测试服务器的内存配置要求高。在所述
技术介绍
部分公开的上述信息仅用于加强对本专利技术的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
有鉴于此,本专利技术提供一种用于搜索引擎测试的索引生成方法、装置、搜 ...
【技术保护点】
一种用于搜索引擎测试的索引生成方法,其特征在于,包括:获取统一资源定位符列表;根据所述统一资源定位符列表,获得数据的标识码列表;以及根据所述数据的标识码列表,生成定制化索引。
【技术特征摘要】
1.一种用于搜索引擎测试的索引生成方法,其特征在于,包括:获取统一资源定位符列表;根据所述统一资源定位符列表,获得数据的标识码列表;以及根据所述数据的标识码列表,生成定制化索引。2.根据权利要求1所述的方法,其特征在于,获取统一资源定位符列表包括:提取搜索频率最高的若干搜索词;以及从所述若干搜索词中获取所述统一资源定位符列表。3.根据权利要求1所述的方法,其特征在于,获取统一资源定位符列表包括:根据搜索引擎测试需求,获取所述统一资源定位符列表。4.根据权利要求1所述的方法,其特征在于,所述数据包括商品数据数据,根据所述数据的标识码列表,生成定制化索引包括:获取所述数据的标识码列表中各商品数据的信息;根据所述各商品数据的信息中的分类,获取所述各商品数据的标签字段;以及根据所述各商品数据的信息及标签字段,生成所述定制化索引。5.根据权利要求4所述的方法,其特征在于,根据所述各商品数据的信息及标签字段,生成所述定制化索引包括:根据所述数据的标识码列表中各商品数据的标识码,将所述数据的标识码列表中所有商品数据划分为多个哈希分片,每个哈希分片包含所述数据的标识码列表中部分商品数据的标识码;将所述多个哈希分片分配到多个服务器中;在所述多个服务器中,分别根据所分配的哈希分片中的商品数据的信息及标签字段,生成多个部分索引;以及将所述多个部分索引中的商品数据进行排...
【专利技术属性】
技术研发人员:赵晶晶,李友科,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。