【技术实现步骤摘要】
本专利技术涉及信息检索
,特别是指一种检索排序方法及系统。
技术介绍
近年来,随着互联网的普及以及信息产生媒体的多样化,信息资源总量以指数级速度不断增长,一项针对2000年至2007年的互联网页总数的研究统计表明,参考附图1,网页数目增速也在不断提高。同时普遍以非结构化形式存储于节点上。对用户而言,如何有效获取信息,急需相应的理论和方法来解决。因此,学术界和工业界对信息检索也掀起了一个新的研究高潮,成为当前信息处理领域的一个研究热点。目前信息检索领域已经形成了一些检索模型,其中影响较大的有布尔模型、向量空间模型、语言模型、BM25模型等,不断提高信息检索性能,推动信息检索研究的发展。这·些方法在其特定应用中都体现出一定的优越性,但是它们仍有可改进之处。其主要问题是,算法无法自适应选取参数,运行过程中需手动调整模型参数,为此产生了基于机器学习的检索算法,称为排序学习,即系统根据用户提交的查询短语自动判断存储库中文档与查询的相关度大小,并给出排序列表,位置越靠前表示返回结果与查询越相关。同时,检索系统面临如下问题当用户构造一个好的查询有困难时,检索结果往往不尽 ...
【技术保护点】
一种检索排序方法,其特征在于,包括:接收查询短语并检索;返回检索结果;提取文档库中所有文档的低维特征;获取检索结果中多个文档的相关度反馈信息;生成相关度判断模型;计算检索结果中所有文档的相关度得分;返回按相关度得分高低排序的再次检索结果。
【技术特征摘要】
【专利技术属性】
技术研发人员:陈洪辉,蔡飞,舒振,马建威,
申请(专利权)人:中国人民解放军国防科学技术大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。