文本搜索方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33285215 阅读:21 留言:0更新日期:2022-04-30 23:50
本发明专利技术的实施例提供了一种文本搜索方法、装置、电子设备及存储介质,涉及检索技术领域。首先,根据多个单词数据、索引库和预设搜索信息,筛选出包含预设搜索信息的所有文本,得到至少一个第一文本;然后,对至少一个第一文本进行排序,得到至少一个第二文本;并根据第二文本的类别和内容,生成每个第二文本对应的标签信息;最后,将每个第二文本对应的标识和标签信息作为搜索结果,并进行显示。该方法根据筛选出的文本的类别和内容生成相应的标签信息,并将文本及标签信息作为搜索结果进行显示,从而节省了存储空间,进而能够在不具备大型设备的情况下,实现文本搜索。实现文本搜索。实现文本搜索。

【技术实现步骤摘要】
文本搜索方法、装置、电子设备及存储介质


[0001]本专利技术涉及检索
,具体而言,涉及一种文本搜索方法、装置、电子设备及存储介质。

技术介绍

[0002]目前各行各业都需要处理大量信息,很多项目中也需要进行信息的储存、分类与搜索,搜索引擎在面对大批量信息时就尤为重要。
[0003]由于信息量巨大,搜索出的结果也是数以万计,尤其是在对搜索结果进行显示时,不仅显示的文本数量多,文本的内容也需要占用存储空间。因此,现有的搜索引擎往往对设备的要求较高,只适用于大型企业或项目,对于个人或者不具备大型设备时,需要更微型化的搜索技术。

技术实现思路

[0004]本专利技术的目的包括,例如,提供了一种文本搜索方法、装置、电子设备及存储介质,其能够根据筛选出的文本的类别和内容生成相应的标签信息,并将文本及标签信息作为搜索结果进行显示,从而节省了存储空间,并且提升了用户体验。
[0005]为了实现上述目的,本专利技术实施例采用的技术方案如下:
[0006]第一方面,本专利技术实施例提供了一种文本搜索方法,应用于电子设本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本搜索方法,其特征在于,应用于电子设备,所述电子设备预先存储有多个文本,每个所述文本均有对应的标识;所述方法包括:根据多个单词数据、索引库和预设搜索信息,获取至少一个第一文本,其中,所述单词数据是对所述多个文本进行划分得到的,所述索引库用于表征每个所述单词数据与每个所述单词数据对应的至少一个所述文本的映射关系,每个所述第一文本均包括所述预设搜索信息;根据预设打分机制,对所述至少一个第一文本进行排序,得到至少一个第二文本;生成每个所述第二文本对应的标签信息,其中,所述标签信息用于表征所述第二文本的类别和内容;将每个所述第二文本对应的标识和每个所述第二文本对应的所述标签信息作为搜索结果,并进行显示。2.根据权利要求1所述的方法,其特征在于,在所述根据多个单词数据、索引库和预设搜索信息,获取至少一个第一文本的步骤之前,所述方法还包括:利用预设分词工具,对所述多个文本进行划分,得到多个所述单词数据,其中,每个所述单词数据均有对应的至少一个所述文本;为所述多个单词数据建立所述索引库。3.根据权利要求1所述的方法,其特征在于,所述根据预设打分机制,对所述至少一个第一文本进行排序,得到至少一个第二文本的步骤,包括:根据所述预设打分机制,分别对每个所述第一文本进行打分,得到每个所述第一文本对应的得分,其中,所述得分表征所述预设搜索信息在所述第一文本中出现的频次;按照所述得分从大到小的顺序,对所述至少一个第一文本进行排序,得到所述至少一个第二文本。4.根据权利要求1所述的方法,其特征在于,所述生成每个所述第二文本对应的标签信息的步骤,包括:根据预设分类器,对所述至少一个第二文本进行分类,生成每个所述第二文本对应的分类信息,其中,所述分类信息用于表征所述第二文本的类别;生成每个所述第二文本对应的摘要信息,得到每个所述第二文本对应的所述标签信息,其中,所述标签信息包括所述分类信息和所述摘要信息,所述摘要信息用于表征所述第二文本的内容。5.根据权利要求4所述的方法,其特征在于,所述生成每个第二文本对应的摘要信息的步骤,包括:将所述至少一个第二文本中的任意一个第二文本作为目标第二文本;根据文本排序算法,对所述目标第二...

【专利技术属性】
技术研发人员:陈君
申请(专利权)人:北京像素软件科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1