文字搜索方法、装置以及终端设备制造方法及图纸

技术编号:8489831 阅读:140 留言:0更新日期:2013-03-28 11:43
本发明专利技术公开了一种文字搜索方法,包括以下步骤:接收用户输入的搜索词;根据搜索词对目标文档进行搜索以生成搜索结果集合,其中,搜索结果集合包括多个搜索结果,每个搜索结果包括搜索词所在目标文档中的位置信息;针对搜索结果集合中的每个搜索结果中的位置信息分别生成多个结果上下文子集合,其中,每个上下文子集合与搜索结果集合中的一个搜索结果对应;以及根据上下文子集合对搜索结果进行筛选,并将筛选之后的搜索结果提供给所述用户。该方法解决了在文字搜索过程中既考虑要搜索的内容,又考虑上下文信息的技术问题,本方法提高了用户文字搜索的有效性、适时性,且具有快捷性和易用性。本发明专利技术还公开了一种文字搜索装置、以及终端设备。

【技术实现步骤摘要】

本专利技术涉及信息搜索
,特别涉及一种文字搜索方法与装置以及终端设备。
技术介绍
目前,在文字搜索处理过程中,只要输入要搜索的内容,例如词语“AB”,则通篇查找与“AB”相匹配的内容。有时候,尽管文件中出现了“AB”,但是这个“AB”并非是用户确实想要查找的结果,因此,用户必需一一检验其是否为用户想要查找的目标,搜索和查找确定过程繁琐,且效率低。
技术实现思路
本专利技术的目的旨在至少解决所述技术缺陷之一。为此,本专利技术的第一个目的在于提出一种文字搜索方法,该方法提高了用户进行文字搜索的高效性、且具有快捷性和易用性。本专利技术的第二个目的在于提出一种文字搜索装置。本专利技术的第三个目的在于提出一种终端设备。为了实现上述目的,本专利技术第一方面的实施例提供一种文字搜索方法,包括以下步骤接收用户输入的搜索词;根据所述搜索词对目标文档进行搜索以生成搜索结果集合,其中,所述搜索结果集合包括多个搜索结果,每个所述搜索结果包括所述搜索词所在所述目标文档中的位置信息;针对所述搜索结果集合中的每个所述搜索结果中的位置信息分别生成多个结果上下文子集合,其中,每个所述上下文子集合与所述搜索结果集合中的一个搜索结果对应;以及根据所述上下文子集合对所述搜索结果进行筛选,并将筛选之后的搜索结果提供给所述用户。根据本专利技术实施例的文字搜索方法,用户根据搜索词对目标文档进行搜索以生成搜索结果集合,通过筛选将针对搜索结果集合中的每个搜索结果中的位置信息分别生成多个结果上下文子集合提供给用户。该文字搜索方法提高了用户进行文字搜索的高效性、且具有快捷性和易用性。在本专利技术的一个实施例中,所述根据上下文子集合对所述搜索结果进行筛选进一步包括获得所述用户在所述搜索结果集合中所确定的搜索结果,并将所述搜索结果作为标准搜索结果,以及将所述搜索结果对应上下文子集合作为标准上下文子集合;计算其他上下文子集合与所述标准上下文子集合之间的相似度;以及如果所述相似度大于预设阈值,则将对应的上下文集合的搜索结果删除。由此,提高了文字搜索的准确性。在本专利技术的一个实施例中,所述针对所述搜索结果集合中的每个所述搜索结果中的位置信息分别生成多个结果上下文子集合进一步包括根据每个所述搜索结果的位置信息获得每个所述搜索结果的上下文信息;以及根据每个所述搜索结果的上下文信息生成每个所述搜索结果的上下文子集合。由此,提高了文字搜索的高效性与易用性。在本专利技术的一个实施例中,根据每个所述搜索结果的位置信息获得每个所述搜索结果的位置信息;以及根据每个所述搜索结果的上下文信息和位置信息生成每个所述搜索结果的上下文子集合。由此,提高了文字搜索方法的可选择性,且具有高效性与易用性。在本专利技术的一个实施例中,根据每个所述搜索结果的位置信息获得每个所述搜索结果的标点符号信息;以及根据每个所述搜索结果的上下文信息和标点符号信息生成每个所述搜索结果的上下文子集合。由此,提高了文字搜索方法的可选择性,且具有高效性与易用性。本专利技术第二方面的实施例提出一种文字搜索装置,包括接收模块,接收用户输入的搜索词;搜索模块,根据搜索词对目标文档进行搜索;生成模块,用于生成搜索结果集合,且针对所述搜索结果集合的每个搜索结果中的位置信息分别生成多个结果上下文子集合,其中,所述搜索结果集合包括多个搜索结果,每个所述搜索结果包括所述搜索词所在所述目标文档中的位置信息,以及每个所述上下文子集合与所述搜索结果集合中的一个搜索结果对应;筛选模块,根据所述上下文子集合对所述搜索结果进行筛选;发送模块,用于经过所述筛选模块筛选之后的所述搜索结果提供给所述用户。根据本专利技术实施例的文字搜索装置,用户根据通过接收模块接收到的搜索词对目标文档通过搜索模块进行搜索以通过生成模块生成搜索结果集合,通过筛选模块筛选将针对搜索结果集合中的每个搜索结果中的位置信息分别生成多个结果上下文子集合通过发送模块提供给用户。该文字搜索装置提高了用户进行文字搜索的高效性、且具有快捷性和易用性。在本专利技术的一个实施例中,所述筛选模块包括获取单元,获得所述用户在所述搜索结果集合中所确定的搜索结果,并将所述搜索结果作为标准搜索结果,以及将所述搜索结果对应上下文子集合作为标准上下文子集合;计算单元,用于计算其他上下文子集合与所述标准上下文子集合之间的相似度;判断单元,用于判断如果所述相似度大于预设阈值,则将对应的上下文集合的搜索结果删除。由此,提高了文字搜索的准确性。在本专利技术的一个实施例中,所述生成模块用于根据每个所述搜索结果的位置信息获得每个所述搜索结果的上下文信息,以及根据每个所述搜索结果的上下文信息生成每个所述搜索结果的上下文子集合。由此,提高了文字搜索的高效性与易用性。在本专利技术的一个实施例中,所述生成模块还用于根据每个所述搜索结果的位置信息获得每个所述搜索结果的位置信息,以及根据每个所述搜索结果的上下文信息和位置信息生成每个所述搜索结果的上下文子集合。由此,提高了文字搜索方法的可选择性,且具有高效性与易用性。在本专利技术的一个实施例中,所述生成模块还用于根据每个所述搜索结果的位置信息获得每个所述搜索结果的标点符号信息,以及根据每个所述搜索结果的上下文信息和标点符号信息生成每个所述搜索结果的上下文子集合。由此,提高了文字搜索方法的可选择性,且具有高效性与易用性。本专利技术第三方面的实施例提出一种终端设备,包括上述实施例提供的文字搜索装置。根据本专利技术实施例的终端设备,用户根据搜索词对目标文档进行搜索以生成搜索结果集合,通过筛选将针对搜索结果集合中的每个搜索结果中的位置信息分别生成多个结果上下文子集合提供给用户。该终端设备提高了用户进行文字搜索的高效性、且具有快捷性和易用性。在本专利技术的一个实施例中,所述终端设备为手机、个人电脑PC或平板电脑。由此,提高了终端设备的多样性。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术所述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中图1为根据本专利技术一个实施例的文字搜索方法的流程图;图2为根据本专利技术实施例的文字搜索装置的示意图;图3为根据本专利技术实施例的筛选模块的示意图;以及图4为根据本专利技术实施例的终端设备的示意图。具体实施例方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本专利技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。在本专利技术的描述中,需要说明的是,除非另有规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解所述术语的具体含义。如图1所示,本专利技术实施例的文字搜索方法的流程图,包括如下步骤步骤S101,接本文档来自技高网...

【技术保护点】
一种文字搜索方法,其特征在于,包括以下步骤:接收用户输入的搜索词;根据所述搜索词对目标文档进行搜索以生成搜索结果集合,其中,所述搜索结果集合包括多个搜索结果,每个所述搜索结果包括所述搜索词所在所述目标文档中的位置信息;针对所述搜索结果集合中的每个所述搜索结果中的位置信息分别生成多个结果上下文子集合,其中,每个所述上下文子集合与所述搜索结果集合中的一个搜索结果对应;以及根据所述上下文子集合对所述搜索结果进行筛选,并将筛选之后的搜索结果提供给所述用户。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘娟
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1