一种在云搜索平台中构建索引和进行搜索的方法和装置制造方法及图纸

技术编号:18445031 阅读:25 留言:0更新日期:2018-07-14 10:25
本说明书实施例公开了一种在云搜索平台中构建索引和进行搜索的方法和装置,其中所述云搜索平台包括用于多个租户的搜索实例,所述搜索实例为多个租户各自分配有租户标识,所述构建索引的方法包括以下步骤:获取租户文档,所述租户文档的内容中包括租户标识字段行,所述租户标识字段行示出所述租户文档所属租户的租户标识;通过所述租户标识获取所述租户的租户词典;根据所述租户词典对所述租户文档进行分词,从而获取与所述租户文档对应的已分词文档;以及在所述搜索实例中,根据所述字段定义表和所述已分词文档对所述租户文档建立索引,其中包括,根据所述字段定义表中的对所述租户标识字段的描述,建立所述租户标识字段与所述租户文档的索引关系。

A method and device for indexing and searching in cloud search platform

A method and device for constructing index and searching in a cloud search platform is disclosed in this specification embodiment, in which the cloud search platform includes a search instance for multiple tenants. The search instance assigns a tenant identity to a plurality of tenants, and the method of constructing the index includes the following steps: obtaining a tenant The contents of the tenant's document include the tenant identity field line, which shows the tenant identity of the tenant's tenant; the tenant's dictionary is obtained by the tenant identity, and the tenant's document is divided according to the tenant's dictionary to obtain the tenant and the tenant. A document corresponding to a document; and in the search instance, an index is established for the tenant document based on the field definition table and the stated word document, including the description of the tenant identification field in the table according to the field, and the establishment of the rented identity field and the tenant document. Lead the relationship.

【技术实现步骤摘要】
一种在云搜索平台中构建索引和进行搜索的方法和装置
本专利技术涉及云搜索平台领域,更具体地,涉及一种在云搜索平台中构建索引和进行搜索的方法和装置。
技术介绍
在云搜索平台中,对外售卖搜索功能。其中将每个购买服务的用户称为租户。租户的数量在万级别。不同租户有不同的词典定制需求,不同的租户可能要求根据不同的词典构建索引。传统的多租户云搜索服务的实现方案是:将每个租户的搜索作为一个单独的实例来管理,比如100个租户就100个实例。每个实例的schema(字段定义表)结构相同,但有其各自对应的分词词典以及配置。因此,需要一种在云搜索平台中构建索引和进行搜索的更有效的方案。
技术实现思路
本说明书实施例旨在提供一种在云搜索平台中构建索引和进行搜索的更有效的方案,以解决现有技术中的不足。为实现上述目的,本说明书一个方面提供一种在云搜索平台中构建索引的方法,所述云搜索平台包括用于多个租户的搜索实例,所述搜索实例包括适用于所述多个租户中每个租户的统一的字段定义表,所述搜索实例为多个租户各自分配有租户标识,所述租户标识用于唯一标识对应租户,所述字段定义表中包括对租户标识字段的描述,所述租户标识字段与所述租户标识关联,所述方法由所述云搜索平台执行并包括以下步骤:获取租户文档,所述租户文档的内容中包括租户标识字段行,所述租户标识字段行示出所述租户文档所属租户的租户标识;通过所述租户标识获取所述租户的租户词典;根据所述租户词典对所述租户文档进行分词,从而获取与所述租户文档对应的已分词文档;以及在所述搜索实例中,根据所述字段定义表和所述已分词文档对所述租户文档建立索引,其中包括,根据所述字段定义表中的对所述租户标识字段的描述,建立所述租户标识字段与所述租户文档的索引关系。在一个实施例中,在上述在云搜索平台中构建索引的方法中,所述云搜索平台还包括词典单元,所述词典单元与所述搜索实例分离,并且所述词典单元中包括所述多个租户的各自的租户词典,所述方法还包括,在获取租户文档之后,将所述租户文档发送给所述词典单元。在一个实施例中,在上述在云搜索平台中构建索引的方法中,根据所述租户词典对所述租户文档进行分词,从而获取与所述租户文档对应的已分词文档包括:在所述词典单元中,根据所述租户词典对所述租户文档进行分词,以生成与所述租户文档对应的已分词文档;以及从所述词典单元接收所述已分词文档。在一个实施例中,上述在云搜索平台中构建索引的方法还包括,在根据所述租户词典对所述租户文档进行分词,从而获取与所述租户文档对应的已分词文档之后,将所述租户文档及其对应的所述已分词文档发送给所述搜索实例。在一个实施例中,在上述在云搜索平台中构建索引的方法中,所述云搜索平台还包括统一的服务接口,所述服务接口与所述多个租户的租户平台连接,以及,其中获取租户文档包括,通过所述服务接口从所述租户平台接收租户原始文档,根据所述租户平台获取所述租户标识,以及在所述租户原始文档的内容中增加所述租户标识字段行,从而获取所述租户文档。在一个实施例中,在上述在云搜索平台中构建索引的方法中,所述云搜索平台还包括统一的服务接口,所述服务接口与所述多个租户的租户平台连接,以及,离线进行所述方法,并且所述方法还包括,在获取租户文档之前,通过所述服务接口从所述租户平台接收租户原始文档,并根据所述租户平台获取所述租户标识,在所述租户原始文档的内容中增加所述租户标识字段行,从而生成所述租户文档,并将所述租户文档存储在所述云搜索平台中。在一个实施例中,在上述在云搜索平台中构建索引的方法中,所述云搜索平台还包括统一的服务接口,所述服务接口与所述多个租户的租户平台连接,并且所述方法还包括:在获取租户文档之前,通过所述服务接口从所述租户平台接收租户词典,根据所述租户平台获取所述租户标识,并将所述租户词典与所述租户标识关联地存储在所述词典单元中。本说明书另一方面提供一种在云搜索平台中构建索引的装置,所述云搜索平台包括用于多个租户的搜索实例,所述搜索实例包括适用于所述多个租户中每个租户的统一的字段定义表,所述搜索实例为多个租户各自分配有租户标识,所述租户标识用于唯一标识对应租户,所述字段定义表中包括对租户标识字段的描述,所述租户标识字段与所述租户标识关联,所述装置由所述云搜索平台实施并包括以下单元:第一获取单元,配置为,获取租户文档,所述租户文档的内容中包括租户标识字段行,所述租户标识字段行示出所述租户文档所属租户的租户标识;第二获取单元,配置为,通过所述租户标识获取所述租户的租户词典;分词单元,配置为,根据所述租户词典对所述租户文档进行分词,从而获取与所述租户文档对应的已分词文档;以及建立单元,配置为,在所述搜索实例中,根据所述字段定义表和所述已分词文档对所述租户文档建立索引,其中包括,根据所述字段定义表中的对所述租户标识字段的描述,建立所述租户标识字段与所述租户文档的索引关系。本说明书另一方面提供一种在云搜索平台中进行搜索的方法,所述云搜索平台包括用于多个租户的搜索实例,所述搜索实例包括适用于所述多个租户的统一的字段定义表,所述搜索实例为多个租户各自分配有租户标识,所述租户标识用于唯一标识对应租户,所述字段定义表中包括对租户标识字段的描述,所述租户标识字段与所述租户标识关联,所述云搜索平台还包括统一的服务接口,所述服务接口与所述多个租户的租户平台连接,所述方法由所述云搜索平台执行并包括以下步骤:从租户平台接收搜索语句;从所述租户平台获取租户的租户标识;通过所述租户标识获取所述租户的租户词典;根据所述租户词典对所述搜索语句进行分词,从而获取与所述搜索语句对应的已分词语句;在所述搜索实例中对所述租户标识字段和所述已分词语句进行检索,以在所述租户的租户文档中对所述已分词语句进行检索;根据所述租户标识定位所述租户平台;以及根据所述字段定义表向所述租户平台返回检索结果。在一个实施例中,在上述在云搜索平台中进行搜索的方法中,所述云搜索平台还包括词典单元,所述词典单元与所述搜索实例分离,并且所述词典单元中包括所述多个租户的各自的租户词典,所述方法还包括,在根据所述租户平台获取租户的租户标识之后,将所述搜索语句和租户标识发送给所述词典单元。在一个实施例中,在上述在云搜索平台中进行搜索的方法中,根据所述租户词典对所述搜索语句进行分词,从而获取与所述搜索语句对应的已分词语句包括:在所述词典单元中,通过所述租户词典对所述搜索语句进行分词,以生成已分词语句;以及从所述词典单元接收所述已分词语句。在一个实施例中,上述在云搜索平台中进行搜索的方法还包括,在根据所述租户词典对所述搜索语句进行分词,从而获取与所述搜索语句对应的已分词语句之后,将所述已分词语句和所述租户标识发送给所述搜索实例。本说明书另一方面提供一种在云搜索平台中进行搜索的装置,所述云搜索平台包括用于多个租户的搜索实例,所述搜索实例包括适用于所述多个租户中每个租户的统一的字段定义表,所述搜索实例为多个租户各自分配有租户标识,所述租户标识用于唯一标识对应租户,所述字段定义表中包括对租户标识字段的描述,所述租户标识字段与所述租户标识关联,所述云搜索平台还包括统一的服务接口,所述服务接口与所述多个租户的租户平台连接,所述装置由所述云搜索平台实施并包括以下单元:第一接收单元,本文档来自技高网...

【技术保护点】
1.一种在云搜索平台中构建索引的方法,所述云搜索平台包括用于多个租户的搜索实例,所述搜索实例包括适用于所述多个租户的统一的字段定义表,所述搜索实例为多个租户各自分配有租户标识,所述租户标识用于唯一标识对应租户,所述字段定义表中包括对租户标识字段的描述,所述租户标识字段与所述租户标识关联,所述方法由所述云搜索平台执行并包括以下步骤:获取租户文档,所述租户文档的内容中包括租户标识字段行,所述租户标识字段行示出所述租户文档所属租户的租户标识;通过所述租户标识获取所述租户的租户词典;根据所述租户词典对所述租户文档进行分词,从而获取与所述租户文档对应的已分词文档;以及在所述搜索实例中,根据所述字段定义表和所述已分词文档对所述租户文档建立索引,其中包括,根据所述字段定义表中的对所述租户标识字段的描述,建立所述租户标识字段与所述租户文档的索引关系。

【技术特征摘要】
1.一种在云搜索平台中构建索引的方法,所述云搜索平台包括用于多个租户的搜索实例,所述搜索实例包括适用于所述多个租户的统一的字段定义表,所述搜索实例为多个租户各自分配有租户标识,所述租户标识用于唯一标识对应租户,所述字段定义表中包括对租户标识字段的描述,所述租户标识字段与所述租户标识关联,所述方法由所述云搜索平台执行并包括以下步骤:获取租户文档,所述租户文档的内容中包括租户标识字段行,所述租户标识字段行示出所述租户文档所属租户的租户标识;通过所述租户标识获取所述租户的租户词典;根据所述租户词典对所述租户文档进行分词,从而获取与所述租户文档对应的已分词文档;以及在所述搜索实例中,根据所述字段定义表和所述已分词文档对所述租户文档建立索引,其中包括,根据所述字段定义表中的对所述租户标识字段的描述,建立所述租户标识字段与所述租户文档的索引关系。2.根据权利要求1所述的在云搜索平台中构建索引的方法,其中所述云搜索平台还包括词典单元,所述词典单元与所述搜索实例分离,并且所述词典单元中包括所述多个租户的各自的租户词典,所述方法还包括,在获取租户文档之后,将所述租户文档发送给所述词典单元。3.根据权利要求2所述的在云搜索平台中构建索引的方法,其中,根据所述租户词典对所述租户文档进行分词,从而获取与所述租户文档对应的已分词文档包括:在所述词典单元中,根据所述租户词典对所述租户文档进行分词,以生成与所述租户文档对应的已分词文档;以及从所述词典单元接收所述已分词文档。4.根据权利要求2所述的在云搜索平台中构建索引的方法,还包括,在根据所述租户词典对所述租户文档进行分词,从而获取与所述租户文档对应的已分词文档之后,将所述租户文档及其对应的所述已分词文档发送给所述搜索实例。5.根据权利要求1-4中任一项所述的在云搜索平台中构建索引的方法,其中,所述云搜索平台还包括统一的服务接口,所述服务接口与所述多个租户的租户平台连接,以及,其中获取租户文档包括,通过所述服务接口从所述租户平台接收租户原始文档,根据所述租户平台获取所述租户标识,以及在所述租户原始文档的内容中增加所述租户标识字段行,从而获取所述租户文档。6.根据权利要求1-4中任一项所述的在云搜索平台中构建索引的方法,其中,所述云搜索平台还包括统一的服务接口,所述服务接口与所述多个租户的租户平台连接,以及,离线进行所述方法,并且所述方法还包括,在获取租户文档之前,通过所述服务接口从所述租户平台接收租户原始文档,并根据所述租户平台获取所述租户标识,在所述租户原始文档的内容中增加所述租户标识字段行,从而生成所述租户文档,并将所述租户文档存储在所述云搜索平台中。7.根据权利要求2-4中任一项所述的在云搜索平台中构建索引的方法,其中,所述云搜索平台还包括统一的服务接口,所述服务接口与所述多个租户的租户平台连接,并且所述方法还包括:在获取租户文档之前,通过所述服务接口从所述租户平台接收租户词典,根据所述租户平台获取所述租户标识,并将所述租户词典与所述租户标识关联地存储在所述词典单元中。8.一种在云搜索平台中构建索引的装置,所述云搜索平台包括用于多个租户的搜索实例,所述搜索实例包括适用于所述多个租户的统一的字段定义表,所述搜索实例为多个租户各自分配有租户标识,所述租户标识用于唯一标识对应租户,所述字段定义表中包括对租户标识字段的描述,所述租户标识字段与所述租户标识关联,所述装置由所述云搜索平台实施并包括以下单元:第一获取单元,配置为,获取租户文档,所述租户文档的内容中包括租户标识字段行,所述租户标识字段行示出所述租户文档所属租户的租户标识;第二获取单元,配置为,通过所述租户标识获取所述租户的租户词典;分词单元,配置为,根据所述租户词典对所述租户文档进行分词,从而获取与所述租户文档对应的已分词文档;以及建立单元,配置为,在所述搜索实例中,根据所述字段定义表和所述已分词文档对所述租户文档建立索引,其中包括,根据所述字段定义表中的对所述租户标识字段的描述,建立所述租户标识字段与所述租户文档的索引关系。9.根据权利要求8所述的在云搜索平台中构建索引的装置,其中所述云搜索平台还包括词典单元,所述词典单元与所述搜索实例分离,并且所述词典单元中包括所述多个租户的各自的租户词典,所述装置还包括,第一发送单元,配置为,在获取租户文档之后,将所述租户文档发送给所述词典单元。10.根据权利要求9所述的在云搜索平台中构建索引的装置,其中,根据所述租户词典对所述租户文档进行分词,从而获取与所述租户文档对应的已分词文档包括:在所述词典单元中,根据所述租户词典对所述租户文档进行分词,以生成与所述租户文档对应的已分词文档;以及从所述词典单元接收所述已分词文档。11.根据权利要求9所述的在云搜索平台中构建索引的装置,还包括,第二发送单元,配置为,在根据所述租户词典对所述租户文档进行分词,从而获取与所述租户文档对应的已分词文档之后,将所述租户文档及其对应的所述已分词文档发送给所述搜索实例。12.根据权利要求8-11中任一项所述的在云搜索平台中构建索引的装置,其中,所述云搜索平台还包括统一的服务接口,所述...

【专利技术属性】
技术研发人员:葛俊
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1