【技术实现步骤摘要】
搜索方法、装置、分布式搜索系统、介质及程序产品
[0001]本申请涉及搜索
,尤其涉及一种搜索方法、装置、分布式搜索系统、介质及程序产品。
技术介绍
[0002]搜索引擎是一种根据用户的终端设备发送的关键词,利用特定策略从预先获取的倒排索引文件(也称为索引文件)中搜索出关键词对应的搜索结果,并将该搜索结果返回给用户的终端设备的一种检索技术。搜索引擎在为用户提供搜索服务之前,通常需要预先根据原始数据文件创建索引文件,并将索引文件进行存储。
[0003]现有技术中,在根据原始数据文件创建索引文件之后,通常需要将索引文件预先存储在磁盘中,在收到用户的终端系统发送的包含关键词的搜索请求时,根据该搜索请求遍历磁盘中全部的索引文件,获取搜索结果并返回给用户的终端设备。
[0004]然而,当磁盘中的索引文件丢失时,则无法根据搜索请求获取完整的搜索结果,导致获取的搜索结果不准确。
技术实现思路
[0005]本申请提供一种搜索方法、装置、分布式搜索系统、介质及程序产品,以解决现有技术中当磁盘中的索引文件丢 ...
【技术保护点】
【技术特征摘要】
1.一种搜索方法,其特征在于,应用于分布式搜索系统中的搜索引擎节点,所述分布式搜索系统还包括多个搜索节点,所述方法包括:根据获取的用户的终端设备发送的搜索请求,预设拆分程度以及预设过滤字符,对所述搜索请求中的待搜索语句进行拆分和过滤处理,获取至少一个目标关键词;将所述至少一个目标关键词发送给所述多个搜索节点中的任一搜索节点,每个搜索节点中存在多个索引文件和除所述搜索节点外的至少一个搜索节点中的多个索引文件对应的多个索引文件副本,每个搜索节点中的索引文件不同,索引文件副本在对应的索引文件所在的搜索节点无法正常工作时处于工作状态;接收所述任一个搜索节点返回的多个搜索结果,搜索结果包括相关性分数,所述相关性分数用于表示所述搜索结果与所述至少一个目标关键词的相关程度;根据相关性分数由高到低的顺序对所述多个搜索结果进行排序,将排序后的搜索结果确定为目标搜索结果;将所述目标搜索结果发送给所述用户的终端设备。2.根据权利要求1所述的方法,其特征在于,所述根据获取的用户的终端设备发送的搜索请求,预设拆分程度以及预设过滤字符,对所述搜索请求中的待搜索语句进行拆分和过滤处理,获取至少一个目标关键词之前,所述方法还包括:获取存储在搜索引擎数据库中的多个原始文件,提取所述多个原始文件中的文本数据,获取所述多个原始文件对应的多个索引文件;针对任一索引文件,生成所述任一索引文件对应的索引文件副本;将所述多个索引文件存储于所述多个搜索节点中;针对任一索引文件副本,将所述索引文件副本存储于除所述索引文件副本对应的索引文件,所在的搜索节点外的至少一个搜索节点中。3.根据权利要求1所述的方法,其特征在于,所述根据获取的用户的终端设备发送的搜索请求,预设拆分程度以及预设过滤字符,对所述搜索请求中的待搜索语句进行拆分和过滤处理,获取至少一个目标关键词,包括:根据所述预设拆分程度,对所述待搜索语句进行拆分处理,获取多个第一关键词;根据所述预设过滤字符,对所述多个关键词进行过滤处理,从所述多个第一关键词中获取多个第二关键词;在第二关键词为预设的错别词时,根据搜索引擎数据库中存储的错别词与关键词的映射关系,获取所述第二关键词对应的目标关键词;在第二关键词为预设的非错别词时,则将所述第二关键词确定为目标关键词。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:接收所述多个搜索节点发送的心跳信息,所述心跳信息用于表示搜索节点处于正常工作状态;若在预设时长内未获取到任一搜索节点的心跳信息,则对所述任一搜索节点中的多个索引文件对应的多个索引文件副本所在的,至少一个搜索节点发送状态设置指令,所述状态设置指令用于指示所述至少一个搜索节点将所述多个索引文件副本的状态设置为工作状态。5.根据权利要求1
‑
4任一项所述的方法,其特征在于,所述获取至少一个目标关键词之
后,所述方法还包括:在所述至少一个目标关键词中的任一个目标关键词未被记录在搜索引擎热词库时,将所述目标关键词记录在所述搜索引擎热词库中,并将所述目标关键词对应的搜索次数确定为1;在所述至少一个目标关键词中的任一个目标关键词已被记录在所述搜索引擎热词库时,将所述目标关键词的搜索次数加1;根据所述搜索引擎热词库中每个目标关键词对应的搜索次数,确定每个目标关键词的搜索热度。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:将所述搜索引擎热词库中每个目标关键词按照搜索热度从高到低的顺序进行排列,获取排序结果;根据预设关键词个数以及所述排序结果,获取至少一个目标推荐关键词;将所述至少一个目标推荐关键词发送至所述用户的终端设备。7.根据权利要求5所述的方法,其特征在于,所述根据所述搜索引擎热词库中每个目标关键词对应的搜索次数,确定每个目标关键词的搜索热度,包括:根据所述搜索引擎热词库中每个目标关键词对应的搜索次数以及预先获取的搜索次数与搜索热度的映射关系,确定每个目标关键词的搜索热度。8.一种搜索方法,其特征在于,应用于分布式搜索系统中的搜索节点,所述分布式搜索系统还包括搜索引擎节点,所述方法包括:接收所述搜索引擎节点发送的至少一个目标关键词;将所述至少一个目标关键词发送给除所述搜...
【专利技术属性】
技术研发人员:张岱彬,黄航旗,王豪,田卉,尹泓钦,胡汝坤,郭鹏,李若,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。