一种内容检索的方法及装置制造方法及图纸

技术编号:5154235 阅读:186 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种内容检索的方法,用于实现对信息的内容检索,提高信息检索的效率和准确度。所述方法包括:获得用户输入的关键词所对应的结构标签;获得当前网页中嵌入的发布用户标识符ID;在该发布用户ID对应的发布信息的范围内检索该结构标签下与所述输入的关键词匹配的信息。本发明专利技术还公开了用于实现所述方法的装置。

【技术实现步骤摘要】

本专利技术涉及计算机及通信领域,特别是涉及一种内容检索的方法及装置
技术介绍
计算机和互联网技术已被广泛应用,资源共享是其主要特点。如何从巨大的信息 资源中搜索到自身需要的信息,是用户普遍关心的问题。互联网中数千万网站都需要站内信息的检索,但因为技术所限,目前大多数网站 都只能提供简单的全文关键字匹配检索,根据用户输入的关键字来搜索信息。然而对于日 益膨胀的网页海量信息来说,通过关键字进行的全文搜索,在搜索速度和搜索结果方面都 已不能满足用户的需要。因此,业内技术人员提出了结构化搜索的解决方案。目前的结构化搜索信息数据库结构或者是预先设计好的,或者可由用户自行添加 但不据通用性,造成的结果就是当检索范围是整个网络,范围较大时,可能会检索出很多 无用的信息,而有用的信息可能需经过较长时间才能从检索到的信息中筛选出来,检索效 率较低,无法适应信息的多样化发展和各类用户的需要。并且,用户在使用各类不同网站 时,必须熟悉各种不同的分类体系才能较快检索到所需信息。现有技术已提出摘要结构化搜索来代替原有的分类搜索,可提高搜索的准确度, 但目前的内容检索范围较大,有待进一步改进。
技术实现思路
本专利技术实施例提供一种内容检索的方法,用于实现对信息的内容检索,提高信息 检索的效率和准确度。一种内容检索的方法,包括以下步骤获得用户输入的关键词所对应的结构标签;获得当前网页中嵌入的发布用户标识符ID ;在该发布用户ID对应的发布信息的范围内检索该结构标签下与所述输入的关键 词匹配的信息。一种内容检索的装置,包括获取模块,用于获得用户输入的关键词所对应的结构标签;执行模块,用于获得当前网页中嵌入的发布用户ID ;搜索模块,用于在该发布用户ID对应的发布信息的范围内检索该结构标签下与 所述输入的关键词匹配的信息。本专利技术实施例获得用户输入的关键词所对应的结构标签;获得当前网页中嵌入的 发布用户标识符ID ;在该发布用户ID对应的发布信息的范围内检索该结构标签下与所述 输入的关键词匹配的信息。从而实现了在规定范围内通过结构化内容检索信息,有针对性 地进行检索,使检索过程更加快捷,提高了信息检索的效率和准确度。附图说明图1为本专利技术实施例中单层内容结构的示意图;图2A和图2B为本专利技术实施例中多层次内容结构的示意图;图3为本专利技术实施例中内容检索装置的主要结构图;图4A为本专利技术实施例中内容检索装置的详细结构图;图4B为本专利技术实施例中带有安装模块的内容检索装置的详细结构图;图5为本专利技术实施例中内容检索的主要方法流程图;图6为本专利技术实施例中内容检索的详细方法流程图;图7为本专利技术实施例中将发布用户ID嵌入发布的网页中时内容检索的详细方法 流程图;图8为本专利技术实施例中将发布用户ID嵌入点击检索按钮的事件中时内容检索的 详细方法流程图。具体实施例方式本专利技术实施例获得用户输入的关键词所对应的结构标签;获得当前网页中嵌入的 发布用户标识符ID ;在该发布用户ID对应的发布信息的范围内检索该结构标签下与所述 输入的关键词匹配的信息。从而实现了在规定范围内通过结构化内容检索信息,有针对性 地进行检索,使检索过程更加快捷准确,提高了信息检索的效率和准确度。本专利技术实施例中包括指向存储文件的路径(包括链接)的结构均属于内容结构。 内容结构中的结构从划分角度讲包括分类项和结构项,从内容上讲包括结构标签和结构内 容(即用户输入的关键词)。内容结构如图1所示,一个分类项和一个结构项可定位到一个 结构单元,分类项和结构项的标示词即为结构标签,结构标签下的“ 0”用于用户输入关键 词。分类项和结构项构成了一层二维的内容结构。一个分类项下可以有多个结构项。分类 项的标示词,即结构标签如新闻、公告、知识、产品、服务、黄页、人际交往、论坛、点播和下载 等。新闻分类项下的结构项的标示词,即结构标签如主体、行为、时间等。内容结构还可以 分层,每个结构标签都对应上一层的一个结构标签,上一层的一个结构标签可以对应下一 层的多个结构标签。整个内容结构类似一种树状结构,每个节点(即子内容结构)都由一 组分类项和结构项组成。上一层的一个结构标签可以对应下一层的一个子内容结构中的多 个结构标签,参见图2A所示,也可以对应下一层的多个子内容结构中的结构标签,参见图 2B所示。内容结构的初始状态是所有的子内容结构包括相同的结构标签,下一层的子内容 结构继承上一层的子内容结构。参见图3,本专利技术实施例中用于内容检索的装置包括获取模块101、执行模块102 及搜索模块103。其中,该装置可以位于客户端侧。获取模块101用于获得用户输入的关键词所对应的结构标签。获取模块101具体 用于获得点击网页中标识的事件时向用户输出内容结构,并通过内容结构获得用户输入的 关键词所对应的结构标签,其中,所述标识为网页中嵌入的链接到内容结构的标识。用户访 问网页,并点击网页中的标识,其中,所述标识为网页中嵌入的链接到内容结构的标识,相 当于触发点击标识的事件,获取模块101通过该事件向用户输出内容结构,根据用户输入 的关键词获取所述输入的关键词所对应的结构标签。或者用户访问网页,该网页中直接为4用户提供内容结构,而无需用户再点击链接到内容结构的标识,获取模块101直接根据用 户在内容结构中输入的关键词获取所述输入的关键词所对应的结构标签。执行模块102用于获得当前网页中嵌入的发布用户ID。在发布网页时,可以将发 布该网页的发布用户ID嵌入该网页中,发布用户ID即发布该网页的发布方的ID。获得发 布用户ID的方式可以是当用户进入网页时获得所述网页中嵌入的发布用户ID,网页都可 以有标识,网页标识与发布该网页的发布用户ID有对应关系,可以通过网页标识与发布该 网页的发布用户ID的该对应关系获得发布用户ID ;或者,当用户点击检索按钮时获得所述 网页中嵌入的发布用户ID,用户点击检索按钮,相当于触发点击检索按钮的事件,执行模块 102通过该事件获得该事件中嵌入的发布用户ID ;或者,当用户点击链接到内容结构的标 识时获得所述网页中嵌入的发布用户ID,用户点击链接到内容结构的标识,相当于触发点 击链接到内容结构的标识的事件,执行模块102通过该事件获得该事件中嵌入的发布用户 ID。其中,可以预先将发布用户ID嵌入到点击检索按钮或点击链接到内容结构的标识的事 件中,当触发该事件时,执行模块102通过该事件获得发布用户ID。通过该发布用户ID,使 搜索模块103检索的范围限定在该发布用户ID所对应的发布的网页中的相关信息。其中, 获得发布用户ID的方式可以是查询的方式。搜索模块103用于根据用户输入的关键词在该关键词所对应的结构标签的范围 内搜索信息。搜索模块103具体用于根据输入的关键词所对应的结构标签的范围内及执行 模块102获得的发布用户ID所对应的发布用户ID发布的网页范围内搜索与输入的关键词 相匹配的信息。参见图4A,所述装置还包括发布模块104和处理模块105。发布模块104用于发布网页。发布模块104具体用于根据关键词在该关键词所对 应的结构标签的范围内发布信息。发布模块104具体用于根据关键词在该关键词所对应的 结构标签的范围内发布信息,发布的信息可以构成网页。其中,发布的信息可以存放在数据 库中,该数据本文档来自技高网...

【技术保护点】
一种内容检索的方法,其特征在于,包括以下步骤:获得用户输入的关键词所对应的结构标签;获得当前网页中嵌入的发布用户标识符ID;在该发布用户ID对应的发布信息的范围内检索该结构标签下与所述输入的关键词匹配的信息。

【技术特征摘要】
一种内容检索的方法,其特征在于,包括以下步骤获得用户输入的关键词所对应的结构标签;获得当前网页中嵌入的发布用户标识符ID;在该发布用户ID对应的发布信息的范围内检索该结构标签下与所述输入的关键词匹配的信息。2.如权利要求1所述的方法,其特征在于,获得用户输入的关键词所对应的结构标签 的步骤包括获得点击标识的事件时向用户输出内容结构,并通过内容结构获得用户输入 的关键词所对应的结构标签;其中,所述标识为网页中嵌入的链接到内容结构的标识。3.如权利要求1所述的方法,其特征在于,所述当前网页中嵌入的发布用户ID为在发 布网页时嵌入到当前网页中。4.如权利要求1或3所述的方法,其特征在于,获得当前网页中嵌入的发布用户ID 的步骤包括当用户进入网页时获得所述网页中嵌入的发布用户ID;或者,当用户点击链 接到内容结构的标识时获得嵌入的ID ;或者,当用户点击检索按钮时获得嵌入的发布用户 ID。5.如权利要求4所述的方法,其特征在于,获得当前网页中嵌入的发布用户ID的步骤 包括通过网页标识与发布该网页的发布用户ID的对应关系获得发布用户ID ;或者触发点击链接到内容结构的标识或点击检索按钮的事件时,通过该事件获...

【专利技术属性】
技术研发人员:刘莎
申请(专利权)人:北京思在信息技术有限责任公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1