搜索方法、装置、计算机设备、存储介质及搜索系统制造方法及图纸

技术编号:18783810 阅读:38 留言:0更新日期:2018-08-29 06:58
本申请涉及一种搜索方法、装置、计算机设备、存储介质及搜索系统,所述搜索方法包括:获取搜索词;根据所述搜索词确定对应的搜索关键词根据所述搜索关键词进行搜索,根据预存的搜索关键词与文本标识的对应关系,得到与所述搜索关键词对应的文本标识;根据所述文本标识通过互联网获取对应的长文本数据,并返回所述长文本数据。通过根据预存的搜索关键词与文本标识的对应关系进行搜索避免了将长文本数据进行本地存储所带来的硬件成本较高的技术问题。

【技术实现步骤摘要】
搜索方法、装置、计算机设备、存储介质及搜索系统
本申请涉及互联网
,特别是涉及一种搜索方法、装置、计算机设备、存储介质及搜索系统。
技术介绍
随着互联网行业的高速发展,网络上的信息数据呈现爆炸式的增长,之前的搜索引擎架构已不能满足搜索服务的需求。在这一环境下,出现了ElasticSearch(简称为ES)搜索服务器。ES搜索服务器构建在开源社区的索引库Lucence上,具有支持多用户租用、高可用、可水平扩展等特点,且具有自动容错和自动伸缩的机制。在传统技术中,首先,通过抓取网页获取长文本数据;然后,ES架构将获取的长文本数据存储在服务器本地;最后,通过进行一系列的分析、过滤并建立对应的索引,以便后续的查询和搜索。当长文本数据更新后,对应的索引也需要及时更新以确保数据的准确性。然而,ES架构需要按照索引对获取的长文本数据在服务器本地进行存储,则随着数据量的快速增涨,存储的数据越多,硬件成本越高。
技术实现思路
基于此,有必要针对上述传统技术中存在的硬件成本高的技术问题,提供一种搜索方法、装置、计算机设备、存储介质及搜索系统。一种搜索方法,所述方法包括:获取搜索词;根据所述搜索词确定对本文档来自技高网...

【技术保护点】
1.一种搜索方法,其特征在于,所述方法包括:获取搜索词;根据所述搜索词确定对应的搜索关键词;根据所述搜索关键词进行搜索,根据预存的搜索关键词与文本标识的对应关系,得到与所述搜索关键词对应的文本标识;根据所述文本标识获取对应的长文本数据;返回所述长文本数据。

【技术特征摘要】
1.一种搜索方法,其特征在于,所述方法包括:获取搜索词;根据所述搜索词确定对应的搜索关键词;根据所述搜索关键词进行搜索,根据预存的搜索关键词与文本标识的对应关系,得到与所述搜索关键词对应的文本标识;根据所述文本标识获取对应的长文本数据;返回所述长文本数据。2.根据权利要求1所述的搜索方法,其特征在于,在所述根据所述搜索词确定对应的搜索关键词之前,所述方法还包括:生成所述搜索关键词。3.根据权利要求2所述的搜索方法,其特征在于,所述生成所述搜索关键词包括:获取网络信息,从所述网络信息中提取长文本数据;对所述长文本数据进行分割,得到对应的分词;从所述分词中提取所述搜索关键词。4.根据权利要求3所述的搜索方法,其特征在于,所述从所述分词中提取搜索关键词,包括:从所述分词中提取符合预设类型的分词作为搜索关键词。5.根据权利要求3所述的搜索方法,其特征在于,所述长文本数据设有对应的文本标识;在从所述分词中提取搜索关键词之后,还包括:建立所述搜索关键词与所述长文本数据的文本标识的对应关系。6.根据权利要求3所述的搜索方法,其特征在于,所述获取网络信息,从所述网络信息中提取长文本数据,还包括:获取网络信息,对所述网络信息进行加密,从加密后的网络信息中提取长文本数据;所述对所述长文本数据进行分割,得到对应的分词,包括:对加密后的长文本数据进行分割,得到对应的分词。7.一种搜索装置,其特征在...

【专利技术属性】
技术研发人员:刘龙辉
申请(专利权)人:苏州朗动网络科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1