【技术实现步骤摘要】
本专利技术涉及一种迭代查询方法,具体为一种基于TFIDF的迭代查询扩展方法。
技术介绍
目前,查询扩展可以分为以下几种,基于用户反馈,基于关键词排名,基于全局分析和基于搜素引擎日志。基于用户反馈的查询扩展是根据用户反馈来分析查询意图。用户使用搜索功能时,系统会返回相关的所有文档,根据用户的标记来分析返回结果,根据用户的标记可以从文档中选出用户认为相关的文档,作为用户查询词的扩展。基于局部分析的查询扩展是根据搜索引擎搜索査询词的返回结果来进行扩展,和基于用户反馈的查询扩展相似。基于全局分析的査询扩展是根据所有网络资源来做查询扩展,局部査询扩展是利用局部文档来做查询扩展。基于全局分析的查询扩展主要有两种:基于相似词典的査询扩展和基于统计词典的查询扩展。基于搜索引擎日志的查询扩展是根据搜索引擎日志进行査询扩展。基于搜索引擎日志的査询扩展与其他几种査询扩展方法相比更直接,更能很好的反映用户的需求,因为搜索引擎中的查询词都是搜索引擎用户查询时使用的关键词。基于局部分析的查询扩展在现有的研究中取得了较好的结果,因此本专利技术也是基于局部分析的查询扩展。基于局部分析的查询扩展虽然取得了较好的结果,但是对搜索结果进行处理时不能很好的处理噪音,不能区分相关结果和相关结果,这对产生的扩展词的准确度有不好的影响。
技术实现思路
本专利技术的目的在于提供一种基于TFIDF的迭代查询扩展方法及其制作方法,以解决上述
技术介绍
中提出的问题。本专利技术的目的是通过下述技术方案予以实现:一种基于TFIDF的迭代查询扩展方法,包括原始数据的输入、数据分析和数据特征提取以及数据的迭代,具体步骤如 ...
【技术保护点】
一种基于TFIDF的迭代查询扩展方法,其特征在于:包括原始数据的输入、数据分析和数据特征提取以及数据的迭代,具体步骤如下:(1)定义用户原查询词为Q,用户通过输入装置输入查询词Q;(2)通过微博搜索功能搜索查询词Q;(3)随后查询装置对搜索结果进行聚类、标记;(4)随后统计聚类、标记中的每个词的TFIDF值,选取TFIDF值最大的前N个词作为扩展次Qt1。
【技术特征摘要】
1.一种基于TFIDF的迭代查询扩展方法,其特征在于:包括原始数据的输入、数据分析和数据特征提取以及数据的迭代,具体步骤如下:(1)定义用户原查询词为Q,用户通过输入装置输入查询词Q;(2)通过微博搜索功能搜索查询词Q;(3)随后查询装置对搜索结果进行聚类、标记;(4)随后统计聚类、标记中的每个词的TFIDF值,选取TFIDF值最大的前N个词作为扩展次Qt1。2.根据权利要求1所述的一种基于TFIDF的迭代查询扩展方法,其特征在...
【专利技术属性】
技术研发人员:范科峰,刘贤刚,姚相振,王凯,周睿康,高林,李琳,
申请(专利权)人:中国电子技术标准化研究院,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。