一种文本检索的方法及装置制造方法及图纸

技术编号:3852237 阅读:374 留言:0更新日期:2012-04-11 18:40
一种文本检索的方法及装置,首先,生成编码信息,并根据文本库中的文本权重确定文本地址,然后,根据生成的编码信息和确定的文本地址建立索引项,所述索引项包括标题索引、全文索引、高频词标题位图、高频词全文位图和超高频词文本偏移地址位图,最后,根据查询的语素通过标题索引并根据超高频词文本偏移地址位图进行过滤后检索出对应文本,若检索的结果满足预定的要求,则结束检索;若检索的结果不满足预定的要求,则根据查询的语素通过全文索引并根据高频词标题位图和高频词全文位图进行过滤后检索出对应文本。本发明专利技术实施方式提供的技术方案能够加快检索的速度,从而提高了检索的准确率和系统的检索性能。

【技术实现步骤摘要】

本专利技术涉及一种文本检索的方法及装置,属于网络通讯

技术介绍
目前常用的文本检索的方法有归并查找的方法和位图打点的方法,这两种方法都是根 据各文本的编码顺序确定文本地址,且只建立了标题索引和全文索引,并同时根据标题索 引和全文索引进行检索,由于文本地址只是由编码顺序确定,导致在文本读取不完全的情 况下,有些重要的文本没有被检索到,从而影响了检索的准确率,采用对标题索引和全文 索引一起检索的方式,导致检索时间过长,从而影响了系统的检索性能。
技术实现思路
本专利技术提供了一种文本检索的方法及装置,以解决现有技术中存在在文本读取不完全 的情况下,有些重要的文本不能被检索到,同时采用标题索引和全文索引一起检索的方式, 导致检索时间过长,从而影响了检索的准确率和系统的检索性能的问题,为此本专利技术采用 如下的技术方案本专利技术实施例提供了一种文本检索的方法,包括,生成编码信息,并根据文本库中的文本权重确定文本地址,所述编码信息用于指示文 本的顺序;根据生成的编码信息和确定的文本地址建立索引项,所述索引项包括标题索引、全文索引、高频词标题位图、高频词全文位图和超高频词文本偏移地址位本文档来自技高网...

【技术保护点】
一种文本检索的方法,其特征在于,包括, 生成编码信息,并根据文本库中的文本权重确定文本地址,所述编码信息用于指示文本的顺序; 根据生成的编码信息和确定的文本地址建立索引项,所述索引项包括标题索引、全文索引、高频词标题位图、高频词 全文位图和超高频词文本偏移地址位图; 根据查询的语素通过标题索引并根据超高频词文本偏移地址位图进行过滤后检索出对应文本,若检索的结果不满足预定的要求,则根据查询的语素通过全文索引并根据高频词标题位图和高频词全文位图进行过滤后检索出对应 文本。

【技术特征摘要】

【专利技术属性】
技术研发人员:袁哲
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1