文件的搜索方法、装置、电子设备和介质制造方法及图纸

技术编号:37463744 阅读:25 留言:0更新日期:2023-05-06 09:37
本公开提供了一种文件的搜索方法、装置、电子设备和介质,涉及计算机技术领域,具体涉及信息搜索、文件搜索、智能网盘和云计算等技术领域。具体实现方案为:确定目标文件夹中候选文件的候选文件标识,并对候选文件标识进行分词确定候选分词结果;确定候选分词结果与候选文件之间的关联关系,并根据关联关系确定候选分词结果关联的候选文件的候选文件数量;根据候选文件数量从候选分词结果中确定文件搜索词,并将文件搜索词进行展示,供用户根据文件搜索词在目标文件夹中进行文件搜索。本公开能够缩短用户在目标文件夹中进行文件搜索所需的时间,并且同时还可以保证文件搜索的召回率。率。率。

【技术实现步骤摘要】
文件的搜索方法、装置、电子设备和介质


[0001]本公开涉及计算机
,具体涉及信息搜索、文件搜索、智能网盘和云计算等
,特别涉及一种文件的搜索方法、装置、电子设备和介质。

技术介绍

[0002]随着数字信息时代的到来,越来越多的数据以文件的形式存储在电子设备的文件夹中,并且通常情况下同一个文件夹下存储有大量的文件。
[0003]当用户想要在目标文件夹中搜索文件时,通常需要用户在目标文件夹中进行手动搜索,或者,需要用户自主输入搜索词来进行搜索。

技术实现思路

[0004]本公开提供了一种用于缩短文件搜索所需的时间,且保证文件搜索的召回率的文件的搜索方法、装置、电子设备和介质。
[0005]根据本公开的一方面,提供了一种文件的搜索方法,包括:
[0006]确定目标文件夹中候选文件的候选文件标识,并对所述候选文件标识进行分词确定候选分词结果;
[0007]确定所述候选分词结果与所述候选文件之间的关联关系,并根据所述关联关系确定所述候选分词结果关联的候选文件的候选文件数量;
[0008]根据所述候选文件数量从所述候选分词结果中确定文件搜索词,并将所述文件搜索词进行展示,供用户根据所述文件搜索词在所述目标文件夹中进行文件搜索。
[0009]根据本公开的另一方面,提供了一种文件的搜索装置,包括:
[0010]分词模块,用于确定目标文件夹中候选文件的候选文件标识,并对所述候选文件标识进行分词确定候选分词结果;
[0011]文件数量确定模块,用于确定所述候选分词结果与所述候选文件之间的关联关系,并根据所述关联关系确定所述候选分词结果关联的候选文件的候选文件数量;
[0012]文件搜索词展示模块,用于根据所述候选文件数量从所述候选分词结果中确定文件搜索词,并将所述文件搜索词进行展示,供用户根据所述文件搜索词在所述目标文件夹中进行文件搜索。
[0013]根据本公开的另一方面,提供了一种电子设备,包括:
[0014]至少一个处理器;以及
[0015]与至少一个处理器通信连接的存储器;其中,
[0016]存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开中任一项的方法。
[0017]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开中任一项的方法。
[0018]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,计算机程
序在被处理器执行本公开中任一项的方法。
[0019]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0020]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0021]图1A是根据本公开实施例公开的一些文件的搜索方法的流程图;
[0022]图1B是根据本公开实施例公开的一些文件搜索的界面示意图;
[0023]图1C是根据本公开实施例公开的另一些文件搜索的界面示意图;
[0024]图2是根据本公开实施例公开的另一些文件的搜索方法的流程图;
[0025]图3是根据本公开实施例公开的另一些文件的搜索方法的流程图;
[0026]图4A是根据本公开实施例公开的另一些文件的搜索方法的流程图;
[0027]图4B是根据本公开实施例公开的一些搜索词展示的流程示意图;
[0028]图5是根据本公开实施例公开的一些文件的搜索装置的结构示意图;
[0029]图6是用来实现本公开实施例公开的文件的搜索方法的电子设备的框图。
具体实施方式
[0030]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0031]当用户想要在目标文件夹中搜索文件时,通常需要用户在目标文件夹中进行手动搜索,或者,需要用户自主输入搜索词来进行搜索。
[0032]然而,手动搜索方式通常需要用户在目标文件夹中进行多次翻页,才能找到想要搜索的文件,搜索过程非常繁琐,需要较长的搜索时间;而自主输入搜索词的方式虽然在一定程度上能够缩短搜索时间,但是其依赖用户对目标文件夹中的文件分布能够有大致的认知,若用户首次访问目标文件夹进行文件搜索,用户输入的搜索词很可能是无效搜索词,从而导致文件搜索的召回率较低。
[0033]针对上述问题,现有技术也有一些改进方案,例如根据数据库中结构化信息对目标文件夹中的文件进行分类过滤,以方便用户快速浏览。但是这种方案需要积累大量的结构化数据,数据准备周期较长且实现的成本较高。
[0034]图1A是根据本公开实施例公开的一些文件的搜索方法的流程图,本实施例可以适用于辅助用户在目标文件夹中进行文件搜索的情况。本实施例方法可以由本公开实施例公开的文件的搜索装置来执行,所述装置可采用软件和/或硬件实现,并可集成在任意的具有计算能力的电子设备上。
[0035]如图1A所示,本实施例公开的文件的搜索方法可以包括:
[0036]S101、确定目标文件夹中候选文件的候选文件标识,并对候选文件标识进行分词确定候选分词结果。
[0037]其中,目标文件夹表示存储有候选文件的文件夹,其可以是终端设备系统中的文
件夹,例如智能手机、智能平板或者个人电脑等终端设备系统中的文件夹,还可以是云端设备系统中的文件夹,例如网盘、云盘或者云服务器等云端设备系统中的文件夹。
[0038]候选文件标识表示候选文件具有唯一性的身份标识文本,例如,候选文件标识可以是候选文件的文件名等。
[0039]在一种实施方式中,确定各候选文件夹中存储的候选文件的文件数量,并将各候选文件夹对应的文件数量与文件数量阈值进行比对,进而将对应的文件数量大于文件数量阈值的候选文件夹作为目标文件夹。例如,假设文件数量阈值为10,则将存储的候选文件的文件数量大于10的候选文件夹,作为目标文件夹。其中,文件数量阈值可以根据候选文件夹所属设备单屏最多可展示的最大文件数量进行动态调整,可以理解的是,文件数量阈值与最大文件数量成正比,即当最大文件数量越大时,则调高文件数量阈值,相应的,当最大文件数量越小时,则调低文件数量阈值。通过根据最大文件数量对文件数量阈值进行动态调整,提高了目标文件夹确定的准确性,避免通过单一固定的文件数量阈值确定目标文件夹,存在确定不合理以及准确性较低的问题。
[0040]确定目标文件夹中存储的各候选文件的候选文件标识,并采用分词算法对各候选文件标识进行分词,包括但不限于最大匹配分词算法、最短路径分词算法或本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文件的搜索方法,包括:确定目标文件夹中候选文件的候选文件标识,并对所述候选文件标识进行分词确定候选分词结果;确定所述候选分词结果与所述候选文件之间的关联关系,并根据所述关联关系确定所述候选分词结果关联的候选文件的候选文件数量;根据所述候选文件数量从所述候选分词结果中确定文件搜索词,并将所述文件搜索词进行展示,供用户根据所述文件搜索词在所述目标文件夹中进行文件搜索。2.根据权利要求1所述的方法,其中,所述将所述文件搜索词进行展示,包括:将与所述文件搜索词关联的候选文件作为辅助文件,并根据所述辅助文件的辅助文件数量,确定所述文件搜索词的第一展示优先级;按照所述第一展示优先级对所述文件搜索词进行顺序展示。3.根据权利要求2所述的方法,其中,所述将所述文件搜索词进行展示,包括:确定在历史时刻中所述文件搜索词被用户选择的次数,并根据所述被用户选择的次数确定所述文件搜索词的第二展示优先级;按照所述第二展示优先级对所述文件搜索词进行顺序展示。4.根据权利要求3所述的方法,其中,所述将所述文件搜索词进行展示,包括:确定所述文件搜索词的词语类型,并根据所述词语类型确定所述文件搜索词的第三展示优先级;按照所述第三展示优先级对所述文件搜索词进行顺序展示;其中,第一类文件搜索词的第三展示优先级,高于第二类文件搜索词的第三展示优先级,所述第一类文件搜索词的词语类型为命名实体,所述第二类文件搜索词的词语类型为非命名实体。5.根据权利要求4所述的方法,其中,所述将所述文件搜索词进行展示,包括:对所述辅助文件数量、所述被用户选择的次数、以及所述词语类型进行加权求和,并根据加权求和结果确定所述文件搜索词的第四展示优先级;按照所述第四展示优先级对所述文件搜索词进行顺序展示。6.根据权利要求1所述的方法,其中,所述根据所述候选文件数量从所述候选分词结果中确定文件搜索词,包括:将所述候选文件数量大于第一数量阈值,且小于第二数量阈值的候选分词结果作为所述文件搜索词。7.根据权利要求1所述的方法,所述对所述候选文件标识进行分词确定候选分词结果之后,还包括:将词语类型为非命名实体的候选分词结果,作为待优化分词结果;将词语内容为停用词的所述待优化分词结果进行剔除。8.根据权利要求1所述的方法,所述对所述候选文件标识进行分词确定候选分词结果之后,还包括:将字符数量小于第三数量阈值,和/或词语内容为数字文本的所述候选分词结果进行剔除。9.一种文件的搜索装置,包括:
分词模块,用于确定目标文件夹中候选文件的候选文件标识,并对所述候选文件标识进行分词确定候选分词结果;文件数量确定模块,用于确定所述候选分词结果与所述候选文件之间的关联关系,并根据所述关联关系确定所述候选分词结果关联的候选文件的候选文件数量;文件搜索词展示模块,用于根...

【专利技术属性】
技术研发人员:姜涛石东升
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1