一种搜索方法、装置、电子设备及计算机储存介质制造方法及图纸

技术编号:33632191 阅读:15 留言:0更新日期:2022-06-02 01:37
本申请实施例公开了一种搜索方法、装置、电子设备及计算机储存介质,所述搜索方法包括:在接收到搜索词后,根据所述搜索词从数据库中查询得到包含所述搜索词中至少部分字符的预存文件;根据各个所述预存文件中包含所述搜索词的字符的数量进行第一次排序;对各个预存文件中包含所述搜索词的字符进行去重处理,分别计算去重处理后所述搜索词的字符数量与各个预存文件中包含所述搜索词的字符数量的比值,在所述第一次排序的基础上根据各个比值的大小对各个预存文件进行第二次排序;获取各个所述预存文件的层级信息,在第二次排序的基础上根据各个所述层级信息分别对应的权重对各个所述预存文件进行第三次排序,以得到搜索结果。结果。结果。

【技术实现步骤摘要】
一种搜索方法、装置、电子设备及计算机储存介质


[0001]本专利技术涉及信息处理
,特别是涉及一种搜索方法、装置、电子设备及计算机储存介质。

技术介绍

[0002]现有技术中,如实用评分算法、相似度算法等,这些排序算法能快速地帮助我们在海量数据中获得和我们检索的关键词相关性非常高的目标内容。这些算法也会有对应的不足,例如,预存文档自身标记层级信息,各个层级信息从高到低具有等级区分,其中,层级信息较低预存文件中所含的文本内容比层级信息较高的预存文件所含的文本内容更多,层级信息较低预存文件中可能会包含更多重复的关键词字符,此时,通过搜索词搜索预存文件时,层级信息较低预存文件可能会优先展示出来,这样搜索结果并非是较佳的搜索结果。

技术实现思路

[0003]专利技术实施例所要解决的技术问题在于,提供一种搜索方法、装置、电子设备及计算机储存介质,可以优先排列层级信息较高的搜索结果。
[0004]第一方面,本申请实施例提供一种搜索方法,所述搜索方法包括:
[0005]在接收到搜索词后,根据所述搜索词从数据库中查询得到包含所述搜索词中至少部分字符的预存文件;
[0006]当查询得到的所述预存文件的数量为多个时,获取各个所述预存文件中包含所述搜索词的字符的数量,根据各个所述预存文件中包含所述搜索词的字符的数量进行第一次排序;
[0007]对各个预存文件中包含所述搜索词的字符进行去重处理,分别计算去重处理后所述搜索词的字符数量与各个预存文件中包含所述搜索词的字符数量的比值,在所述第一次排序的基础上根据各个比值的大小对各个预存文件进行第二次排序;
[0008]获取各个所述预存文件的层级信息,在第二次排序的基础上根据各个所述层级信息分别对应的权重对各个所述预存文件进行第三次排序,以得到搜索结果。
[0009]根据第一方面,在一种可能的实现方式中,所述根据各个所述预存文件中包含所述搜索词的字符的数量进行第一次排序,包括:
[0010]比较各个所述预存文件包含所述搜索词的字符的数量;
[0011]使各个所述预存文件按照包含所述搜索词的字符的数量从多到少进行排序。
[0012]根据第一方面,在一种可能的实现方式中,所述在所述第一次排序的基础上根据各个所述比值的大小对各个预存文件进行第二次排序,包括:
[0013]比较各个比值的大小;
[0014]使各个所述预存文件根据其对应的比值从小到大进行排序。
[0015]根据第一方面,在一种可能的实现方式中,在接收到搜索词之前,所述数据库预先储存有多个预存文件;
[0016]每个预存文件标记有层级信息,每个层级信息分别对应不同权重。
[0017]根据第一方面,在一种可能的实现方式中,在第二次排序的基础上根据各个所述层级信息分别对应的权重对各个所述预存文件进行第三次排序,包括:
[0018]比较各个预存文件中标记的层级信息所对应的权重大小;
[0019]根据各个所述权重从大到小对各个预存文件进行排序。
[0020]根据第一方面,在一种可能的实现方式中,在接收到搜索词之前,还包括:
[0021]通过数据库保存多个规范搜索词;
[0022]当接收到搜索词时,解析所述搜索词,根据所述搜索词的字形或内容含义呈现至少一个与所述搜索词相关联的规范搜索词供用户选择。
[0023]根据第一方面,在一种可能的实现方式中,在接收到搜索词后,且在根据所述搜索词从数据库中查询得到包含所述搜索词中至少部分字符的预存文件之前,还包括:
[0024]分析所述搜索词的所属领域;
[0025]搜索所属领域与所述搜索词的所属领域相同的预存文件。
[0026]第二方面,本申请实施例提供一种搜索装置,包括至少一个处理器和至少一个储存器,所述储存器被配置为储存有计算机指令,所述处理器被配置为执行所述计算机指令以实现如下步骤:
[0027]在接收到搜索词后,根据所述搜索词从数据库中查询得到包含所述搜索词中至少部分字符的预存文件;
[0028]当查询得到的所述预存文件的数量为多个时,获取各个所述预存文件中包含所述搜索词的字符的数量,根据各个所述预存文件中包含所述搜索词的字符的数量进行第一次排序;
[0029]对各个预存文件中包含所述搜索词的字符进行去重处理,分别计算去重处理后所述搜索词的字符数量与各个预存文件中包含所述搜索词的字符数量的比值,在所述第一次排序的基础上根据各个比值的大小对各个预存文件进行第二次排序;
[0030]获取各个所述预存文件的层级信息,在第二次排序的基础上根据各个所述层级信息分别对应的权重对各个所述预存文件进行第三次排序,以得到搜索结果。
[0031]第三方面,本申请实施例提供一种电子设备,所述电子设备包括储存器和处理器,所述储存器用于储存计算机指令,所述处理器用于调用所述计算机指令以执行如上所述的方法。
[0032]第四方面,本申请实施例提供一种计算机储存介质,所述计算机储存介质存储有计算机指令,所述计算机指令被处理器执行时实现如上所述的方法。
[0033]在本申请提供的实施例中,在接收到搜索词后,对根据所述搜索词搜索到的预存文件进行三轮排序,以优先排列层级信息较高的预存文件,使搜索得到的多个预存文件排列顺序更加合理。
附图说明
[0034]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他
的附图。
[0035]图1是本申请实施例提供的搜索方法的一种流程示意图;
[0036]图2是本申请实施例提供的搜索方法的另一种流程示意图。
具体实施方式
[0037]下面结合本申请实施例中的附图对本申请的实施例进行描述。
[0038]本申请的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选的还包括没有列出的步骤或单元,或可选的还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0039]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0040]现有技术中,如实用评分算法、相似度算法等,这些排序算法能快速地帮助我们在海量数据中获得和我们检索的关键词相关性非常高的目标内容。这些算法也会有对应的不足,例如,预存文档自身标记层级信息,各个层级信息从高到低具有等级区分,其中,层级信息较低预存本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种搜索方法,其特征在于,包括:在接收到搜索词后,根据所述搜索词从数据库中查询得到包含所述搜索词中至少部分字符的预存文件;当查询得到的所述预存文件的数量为多个时,获取各个所述预存文件中包含所述搜索词的字符的数量,根据各个所述预存文件中包含所述搜索词的字符的数量进行第一次排序;对各个预存文件中包含所述搜索词的字符进行去重处理,分别计算去重处理后所述搜索词的字符数量与各个预存文件中包含所述搜索词的字符数量的比值,在所述第一次排序的基础上根据各个比值的大小对各个预存文件进行第二次排序;获取各个所述预存文件的层级信息,在第二次排序的基础上根据各个所述层级信息分别对应的权重对各个所述预存文件进行第三次排序,以得到搜索结果。2.如权利要求1所述的搜索方法,其特征在于:所述根据各个所述预存文件中包含所述搜索词的字符的数量进行第一次排序,包括:比较各个所述预存文件包含所述搜索词的字符的数量;使各个所述预存文件按照包含所述搜索词的字符的数量从多到少进行排序。3.如权利要求2所述的搜索方法,其特征在于:所述在所述第一次排序的基础上根据各个所述比值的大小对各个预存文件进行第二次排序,包括:比较各个比值的大小;使各个所述预存文件根据其对应的比值从小到大进行排序。4.如权利要求3所述的搜索方法,其特征在于:在接收到搜索词之前,所述数据库预先储存有多个预存文件;每个预存文件标记有层级信息,每个层级信息分别对应不同权重。5.如权利要求4所述的搜索方法,其特征在于:在第二次排序的基础上根据各个所述层级信息分别对应的权重对各个所述预存文件进行第三次排序,包括:比较各个预存文件中标记的层级信息所对应的权重大小;根据各个所述权重从大到小对各个预存文件进行排序。6.如权利要求1

5任一项所述的搜索方法,其特征在于:在接收到搜索词之前,...

【专利技术属性】
技术研发人员:王春生唐红梅刘兵
申请(专利权)人:深圳希施玛数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1