一种网络信息的搜索方法、装置和系统制造方法及图纸

技术编号:9034071 阅读:128 留言:0更新日期:2013-08-15 00:54
本发明专利技术公开了一种网络信息的搜索方法、装置和系统。本发明专利技术实施例提供的网络信息的搜索方法包括:在接收到来自请求端的搜索关键数据时,利用预设的映射规则匹配与该搜索关键数据对应的触发项,该触发项是对网络中使用的搜索关键数据进行提取得到的;利用匹配出的触发项查询触发文件,获知搜索关键数据对应的搜索结果所在的数据源,该触发文件是由触发项和相关联的数据源位置信息生成的;从所获知的数据源获取搜索结果,将该搜索结果返回至请求端,该搜索结果由预先对包括触发项的网络信息进行收集和整合而生成。

【技术实现步骤摘要】
一种网络信息的搜索方法、装置和系统
本专利技术涉及互联网
,特别涉及一种网络信息的搜索方法、装置和系统。
技术介绍
随着互联网技术的普及,互联网已是目前用户获取信息的主要来源之一。互联网中存储有海量的网络数据,用户可以通过搜索引擎从互联网中获取所需的网络信息。现有技术提供的信息搜索方案中,用户可以在搜索引擎提供的入口中输入查询词,搜索引擎根据该查询词在网络中抓取信息,并将搜索结果通过网页返回至用户。然而,现有技术提供的信息搜索方案至少存在如下缺陷:现有方案在获取搜索结果时,依赖于搜索引擎在网络中的实时抓取,然而搜索引擎这种实时抓取操作的能力十分有限,每次实时抓取到的信息量较少、内容也不完备,用户需要点击返回的网页中的相关链接,反复执行搜索操作,纵向层层访问页面,查找需要的搜索结果。例如,如果用户访问一个视频,搜索结果页只会出现相关视频,缺少相关的细节信息,用户如果需要查询,还需要进一步的访问其他的网页或是进行进一步其他的操作等,从而导致搜索时间过长、搜素结果精准性较差,且由于需要处理大量访问请求,导致搜素引擎的数据抓取压力也较大、数据提供方的数据处理负担较重。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的网络信息的搜索方法、装置和系统。依据本专利技术的一个方面,本专利技术实施例提供了一种网络信息的搜索方法,包括:在接收到来自请求端的搜索关键数据时,利用预设的映射规则匹配与该搜索关键数据对应的触发项,该触发项是对网络中使用的搜索关键数据进行提取得到的;利用匹配出的触发项查询触发文件,获知搜索关键数据对应的搜索结果所在的数据源,该触发文件是由触发项和相关联的数据源位置信息生成的;从所获知的数据源获取搜索结果,将该搜索结果返回至请求端,该搜索结果由预先对包括触发项的网络信息进行收集和整合而生成。其中,上述利用预设的映射规则匹配与该搜索关键数据对应的触发项包括:利用预设的自然语言处理分析规则匹配与搜索关键数据对应的触发项;和/或,利用预设的正则表达式规则匹配与搜索关键数据对应的触发项。其中,上述触发项是对网络中使用的搜索关键数据进行提取得到的包括:根据搜索关键数据的使用频率和/或关注度等级从搜索关键数据中提取触发项,其中,搜索关键数据的使用频率和/或关注度等级越高,该搜索关键数据中的至少部分数据被选取为触发项的概率越大。其中,上述搜索结果由预先对包括触发项的网络信息进行收集和整合而生成包括:利用网络爬虫在网络中进行抓取,收集包括触发项的网络信息,去除收集到的网络信息中的相同数据,并采用归一化方式将相同含义的多项数据合并为一项数据;和/或,从合作方提供的数据接口获取包括触发项的网络信息,去除获取到的网络信息中的相同数据,并采用归一化方式将相同含义的多项数据合并为一项数据。其中,上述触发文件是由触发项和相关联的数据源位置信息生成的包括:为每个触发项配置一个或多个类型属性;将每个触发项在所属的每种类型属性下与相应的数据源位置信息的关联,生成触发文件。其中,上述利用预设的映射规则匹配与该搜索关键数据对应的触发项包括:利用预设的映射规则匹配与该搜索关键数据对应的触发项和该触发项的类型属性;上述利用匹配出的触发项查询触发文件,获知搜索关键数据对应的搜索结果所在的数据源包括:利用匹配出的触发项和该触发项的类型属性查询触发文件,获知搜索关键数据对应的搜索结果所在的一个或多个数据源。其中,数据源位置信息为数据源的统一资源定位符URL,和/或,数据源位置信息由触发项在所属类型属性下的MD5值生成。其中,上述利用预设的映射规则匹配与该搜索关键数据对应的触发项包括:利用预设的映射规则匹配与该搜索关键数据对应的触发项和该触发项的类型属性;上述从所获知的数据源获取搜索结果,将该搜索结果返回至请求端包括:从所获知的数据源获取匹配出的触发项对应的搜索结果,并根据匹配出的触发项的类型属性设置获取到的搜索结果中的各数据部分的展示状态和展示等级,将搜索结果以及搜索结果中各数据部分的展示状态和展示等级返回至请求端。其中,上述根据匹配出的触发项的类型属性设置获取到的搜索结果中的各数据部分的展示状态和展示等级包括:将匹配出的触发项的类型属性对应的数据部分的展示状态设置为显示、展示等级设置为第一等级;将未匹配出的触发项的类型属性对应的数据部分的展示状态设置为隐藏或收起、展示等级设置为第二等级;其中,第一等级高于第二等级。其中,上述从所获知的数据源获取搜索结果,将该搜索结果返回至请求端包括:当获知的至少一个数据源中不存在对应的搜索结果时,从数据来源服务器中实时抓取包括触发项的网络信息,将该网络信息作为相应触发项对应的搜索结果记录在数据源中,并将该搜索结果返回至请求端。其中,上述方法还包括:在接收到来自请求端的搜索关键数据时,根据该搜索关键数据在网络中实时进行网页信息的抓取,得到抓取结果;将抓取结果作为搜索结果的补充信息,与搜索结果合并后返回至请求端。根据本专利技术的另一方面,本专利技术实施例提供了一种网络信息的搜索装置,包括:通信接口,适于接收来自请求端的搜索关键数据,以及,将获取到的搜索结果返回至请求端;匹配器,适于利用预设的映射规则匹配与该搜索关键数据对应的触发项,该触发项是对网络中使用的搜索关键数据进行提取得到的;触发器,适于利用匹配出的触发项查询触发文件,获知搜索关键数据对应的搜索结果所在的数据源,该触发文件是由触发项和相关联的数据源位置信息生成的;获取器,适于从所获知的数据源获取搜索结果,该搜索结果由预先对包括触发项的网络信息进行收集和整合而生成。其中,匹配器,适于利用预设的自然语言处理分析规则匹配与搜索关键数据对应的触发项,和/或,利用预设的正则表达式规则匹配与搜索关键数据对应的触发项;其中,上述触发项是根据搜索关键数据的使用频率和/或关注度等级从搜索关键数据中提取得到的,上述搜索关键数据的使用频率和/或关注度等级越高,该搜索关键数据中的至少部分数据被选取为触发项的概率越大。其中,每个触发项配置有一个或多个类型属性,触发文件由将每个触发项在所属的每种类型属性下与相应的数据源位置信息关联而生成,匹配器,适于利用预设的映射规则匹配与该搜索关键数据对应的触发项和该触发项的类型属性;触发器,适于利用匹配出的触发项和该触发项的类型属性查询触发文件,获知搜索关键数据对应的搜索结果所在的一个或多个数据源。其中,数据源位置信息为数据源的统一资源定位符URL,和/或,数据源位置信息由触发项在所属类型属性下的MD5值生成。其中,每个触发项配置有一个或多个类型属性,触发文件由将每个触发项在所属的每种类型属性下与相应的数据源位置信息关联而生成,匹配器,适于利用预设的映射规则匹配与该搜索关键数据对应的触发项和该触发项的类型属性;触发器,适于从所获知的数据源获取匹配出的触发项对应的搜索结果,并根据匹配出的触发项的类型属性设置获取到的搜索结果中的各数据部分的展示状态和展示等级;通信接口,适于根据搜索结果的展示状态和展示等级将搜索结果返回至请求端。其中,触发器,还适于将匹配出的触发项的类型属性对应的数据部分的展示状态设置为显示、展示等级设置为第一等级;将未匹配出的触发项的类型属性对应的数据部分的展示状态设置为隐藏或收起、展示等级设置本文档来自技高网...
一种网络信息的搜索方法、装置和系统

【技术保护点】
一种网络信息的搜索方法,包括:在接收到来自请求端的搜索关键数据时,利用预设的映射规则匹配与该搜索关键数据对应的触发项,所述触发项是对网络中使用的搜索关键数据进行提取得到的;利用匹配出的触发项查询触发文件,获知所述搜索关键数据对应的搜索结果所在的数据源,所述触发文件是由触发项和相关联的数据源位置信息生成的;从所获知的数据源获取搜索结果,将该搜索结果返回至请求端,所述搜索结果由预先对包括所述触发项的网络信息进行收集和整合而生成。

【技术特征摘要】
1.一种网络信息的搜索方法,包括:在接收到来自请求端的搜索关键数据时,利用预设的映射规则匹配与该搜索关键数据对应的触发项,所述触发项是对网络中使用的搜索关键数据进行提取得到的;利用匹配出的触发项查询触发文件,根据触发文件中关联的数据源位置信息获知所述搜索关键数据对应的搜索结果所在的数据源,所述触发文件是由触发项和相关联的数据源位置信息生成的,则所述触发文件中仅包括触发项和相关联的数据源位置信息,或者,每个触发项配置有一个或多个类型属性,所述触发文件由将每个触发项在所属的每种类型属性下与相应的数据源位置信息关联而生成,则所述触发文件中包括触发项、触发项的类型属性和相关联的数据源位置信息;其中,所述数据源位置信息为在网络信息的搜索系统中唯一性标识数据源的信息;从所获知的数据源获取搜索结果,将该搜索结果返回至请求端,所述搜索结果由预先对包括所述触发项的网络信息进行收集和整合而生成,且在生成后被存储到相应的数据源中。2.根据权利要求1所述的方法,其中,所述搜索结果由预先对包括所述触发项的网络信息进行收集和整合而生成包括:利用网络爬虫在网络中进行抓取,收集包括触发项的网络信息,去除收集到的网络信息中的相同数据,并采用归一化方式将相同含义的多项数据合并为一项数据;和/或从合作方提供的数据接口获取包括触发项的网络信息,去除获取到的网络信息中的相同数据,并采用归一化方式将相同含义的多项数据合并为一项数据。3.根据权利要求1所述的方法,其中,所述利用预设的映射规则匹配与该搜索关键数据对应的触发项包括:利用预设的映射规则匹配与该搜索关键数据对应的触发项和该触发项的类型属性;所述利用匹配出的触发项查询触发文件,获知所述搜索关键数据对应的搜索结果所在的数据源包括:利用匹配出的触发项和该触发项的类型属性查询触发文件,获知所述搜索关键数据对应的搜索结果所在的一个或多个数据源。4.根据权利要求1所述的方法,其中,所述数据源位置信息为数据源的统一资源定位符URL,和/或,所述数据源位置信息由触发项在所属类型属性下的MD5值生成。5.根据权利要求1所述的方法,其中,所述利用预设的映射规则匹配与该搜索关键数据对应的触发项包括:利用预设的映射规则匹配与该搜索关键数据对应的触发项和该触发项的类型属性;所述从所获知的数据源获取搜索结果,将该搜索结果返回至请求端包括:从所获知的数据源获取匹配出的触发项对应的搜索结果,并根据匹配出的触发项的类型属性设置获取到的搜索结果中的各数据部分的展示状态和展示等级,将所述搜索结果以及搜索结果中各数据部分的展示状态和展示等级返回至请求端。6.根据权利要求5所述的方法,其中,所述根据匹配出的触发项的类型属性设置获取到的搜索结果中的各数据部分的展示状态和展示等级包括:将匹配出的触发项的类型属性对应的数据部分的展示状态设置为显示、展示等级设置为第一等级;将未匹配出的触发项的类型属性对应的数据部分的展示状态设置为隐藏或收起、展示等级设置为第二等级;其中,所述第一等级高于所述第二等级。7.根据权利要求1所述的方法,其中,所述利用预设的映射规则匹配与该搜索关键数据对应的触发项包括:利用预设的自然语言处理分析规则匹配与搜索关键数据对应的触发项,和/或,利用预设的正则表达式规则匹配与搜索关键数据对应的触发项。8.根据权利要求1所述的方法,其中,所述触发项是对网络中使用的搜索关键数据进行提取得到的包括:根据搜索关键数据的使用频率和/或关注度等级从搜索关键数据中提取触发项,其中,搜索关键数据的使用频率和/或关注度等级越高,该搜索关键数据中的至少部分数据被选取为触发项的概率越大。9.根据权利要求1所述的方法,其中,所述从所获知的数据源获取搜索结果,将该搜索结果返回至请求端包括:当获知的至少一个数据源中不存在对应的搜索结果时,从数据来源服务器中实时抓取包括所述触发项的网络信息,将该网络信息作为相应触发项对应的搜索结果记录在数据源中,并将该搜索结果返回至请求端。10.根据权利要求1所述的方法,其中,所述方法还包括:在接收到来自请求端的搜索关键数据时,根据该搜索关键数据在网络中实时进行网页信息的抓取,得到抓取结果;将所述抓取结果作为所述搜索结果的补充信息,与所述搜索结果合并后返回至请求端。11.一种网络信息的搜索装置,包括:通信接口,适于接收来自请求端的搜索关键数据,以及,将获取到的搜索结果返回至请求端;匹配器,适于利用预设的映射规则匹配与该搜索关键数据对应的触发项,所述触发项是对网络中使用的搜索关键数据进行提取得到的;触发器,适于利用匹配出的触发项查询触发文件,根据触发文件中关联的数据源位置信息获知所述搜索关键数据对应的搜索结果所在的数据源,所述触发文件是由触发项和相关联的数据源位置信息生成的,则所述触发文件中仅包括触发项和相关联的数据源位置信息,或者,每个触发项配置有一个或多个类型属性,所述触发文件由将每个触发项在所属的每种类型属性下与相应的数据源位置信息关联而生成,则所述触发文件中包括触发项、触发项的类型属性和相关联的数据源位置信息;其中,所述数据源位置信息为在网络信息的搜索系统中唯一性标识数据源的信息;获取器,适于从所获知的数据源获取搜索结果,所述搜索结果由预先对包括所述触发项的网络信息进行收集和整合而生成,且在生成后被存储到相应的数据源中。12.根据权利要求11所述的装置,其中,所述匹配器,适于利用预设的自然语言处理分析规则匹配与搜索关键数据对应的...

【专利技术属性】
技术研发人员:李天华
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1