当前位置: 首页 > 专利查询>华天清专利>正文

信息对象搜索的方法和装置制造方法及图纸

技术编号:3872783 阅读:213 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种信息对象搜索的方法和装置,所述信息对象是有语义结构的信息内容,包括多个存在语义关联关系的信息属性构成,所述信息属性是信息对象不同语义方面内容的单元,所述语义结构是语义元数据的集合。通过建设语义结构和网络资源URI或其前缀的关联库,能够使用目标网页URI查询关联库,获得语义结构;在语义结构的指导下格式化网页信息并建立索引;响应用户搜索请求,按相关性排序提供搜索结果的同时提供层次化语义导航树;并在用户点击语义导航树的节点时,给用户提供精炼的搜索结果。本发明专利技术属于计算机科学技术领域,适用于网络信息提取、全文搜索和语义搜索、手机搜索等应用领域。

【技术实现步骤摘要】

本专利技术属于计算机科学
语义搜索分支,具体涉及一种信息对象搜索的方法和装 置,适用于网络信息提取、全文搜索和语义搜索、商业情报挖掘、信息聚合、网络知识库建 立、手机搜索等应用领域。
技术介绍
査准率和查全率是衡量搜索引擎的两个重要指标,但是对于海量的综合的搜索引擎来说, 由于互联网信息过剩,重复率很高,对于一般的检索请求,在上述两个指标并不是很优秀的 情况下,仍然能够给客户提供较满意的搜索结果。但是,如果用户要检索一些强结构化的信 息(下文将其称为信息对象,或简称对象,就像面向对象编程里面的对象一样,是强结构化 的,其结构由可嵌套的对象属性(property)构造),普通的综合搜索引擎很难给出满意的结 果,例如,用户搜索最近发布的跟PHP编程有关的威客项目,或者近期将在深圳举办的个人 钢琴表演活动,几乎当前所有的主流搜索引擎不能给出满意的结果。这类信息一方面是强结 构化的,其信息结构表达丰富的语义信息但是信息内容文字数量很小,而普通的综合搜索引 擎难于有效利用这些语义信息;另一方面,这类信息对象往往是有生命周期的,普通的搜索 引擎的索引策略,例如,经典的PageRank,没本文档来自技高网...

【技术保护点】
一种信息对象搜索的方法,所述信息对象是有语义结构的信息内容,包括多个存在语义关联关系的信息属性构成,所述信息属性是信息对象不同语义方面内容的单元,所述语义结构是语义元数据的集合,元数据包括信息对象的特性、信息属性的特性、信息对象和信息属性之间的语义关系、信息属性之间的语义关系、本信息对象与其它有语义关联的信息对象的关系等。其特征在于,所述方法包括: (1)建设语义结构和网络资源URI或其前缀的关联库; (2)使用目标网页URI查询关联库,获得语义结构; (3 )根据语义结构,提取网页信息并建立索引; (4)响应用户搜索请求,按相关性排序提供搜索结果的同时提供层...

【技术特征摘要】

【专利技术属性】
技术研发人员:华天清曹鸿钧齐勇挺宋栋
申请(专利权)人:华天清齐勇挺
类型:发明
国别省市:94[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1