一种基于整数映射的XML数据库全文索引方法技术

技术编号:8744567 阅读:271 留言:0更新日期:2013-05-29 22:06
本发明专利技术公开了一种基于整数映射的XML数据库全文索引方法,所述方法包括:a对XML文档集合建立全文索引;b利用建好的全文索引进行全文检索;所述步骤a具体包括:计算并存储XML文档中数据节点对应的信息;解析用户输入的XPath路径表达式,获取对应的节点集;建立持久化的整数映射,将节点集中的每个节点映射到一个唯一的整数;对节点内容进行全文索引;所述步骤b具体包括:解析用户输入的XML全文查询语句;在关系表全文索引中查询关键字并返回虚拟列号整数;在B树中查询虚拟列号整数,将匹配的节点结构信息与全文信息返回给用户。本发明专利技术提供的索引占用物理空间小,不存在重复存储的路径信息,提高了查询效率。

【技术实现步骤摘要】

【技术保护点】
一种基于整数映射的XML数据库全文索引方法,其特征在于,所述方法包括:a对XML文档集合建立全文索引;b利用建好的全文索引进行全文检索;所述步骤a具体包括:计算并存储XML文档中数据节点对应的信息;解析用户输入的XPath路径表达式,获取对应的节点集;建立持久化的整数映射,将节点集中的每个节点映射到一个唯一的整数;对节点内容进行全文索引;所述步骤b具体包括:解析用户输入的XML全文查询语句;在关系表全文索引中查询关键字并返回虚拟列号整数;在B树中查询虚拟列号整数,将匹配的节点结构信息与全文信息返回给用户。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈琳王奎张学伟夏冬
申请(专利权)人:同方知网北京技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1