一种基于XML的信息搜索方法技术

技术编号:11424880 阅读:82 留言:0更新日期:2015-05-07 03:54
随着Internet上信息量的与日俱增,传统的基于HTML的信息检索已经无法满足人们不断变化的信息需求。本发明专利技术涉及一种基于XML的信息搜索方法,属于计算机技术领域。该方法提出了一套完整的XML结构化查询代价估计体系SXM,包括对简单路径表达进行查询代价估计的动态XML数据统计模型XMap,对复杂路径表达进行查询代价估计的双焦点例举法,以及对值匹配条件进行查询代价估计的基于小波的多维直方图方法,并能将多种查询表达的查询代价估计结果结合在一起,以给出一个完整的XPath查询的代价估计,有效解决了XML结构化查询代价估计中存在的结构不规则、查询表达复杂、数据间相互依赖关系复杂等问题。

【技术实现步骤摘要】

【技术保护点】
本专利技术介绍了一种基于XML的信息搜索方法,具体过程如下:(1)分析XML信息检索系统中的结构索引算法设计和结构化查询优化中的查询代价估计问题,以及查询结果和查询条件间的相关度算法,提出了一种高效的动态XML结构索引算法,它采用动态后向结构相似性的概念,可根据实际查询需求以及索引最优化的要求动态决定索引中保存的结构信息;(2)为考虑XML数据中的结构信息对查询结果相关度值的影响,利用综合考虑关键字频率分布特征和结构分布特征的查询结果相关度算法,以及一种基于节点的关键字权重计算法,以便取得更优的检索性能;(3)分析XML结构化查询优化中的查询代价估计问题与传统关系型数据库中的查询代价估计问题的区别,利用完整的XML结构化查询代价估计体系SXM,包括对简单路径表达进行查询代价估计的动态XML数据统计模型XMap,对复杂路径表达进行查询代价估计的双焦点例举法,以及对值匹配条件进行查询代价估计的基于小波的多维直方图方法,并能将多种查询表达的查询代价估计结果结合在一起,以给出一个完整的XPath查询的代价估计。

【技术特征摘要】

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:南京思润软件有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1