一种聊天信息的检索方法及检索系统技术方案

技术编号:3496853 阅读:170 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种聊天信息的检索方法,包括:将预设数量的聊天信息处理成索引文件,记录所述索引文件中索引词与聊天信息的序号之间的对应关系;将所述索引词保存到创建的第一索引库;在所述第一索引库中查找与检索关键词相匹配的索引词;获取该索引词对应的序号,并调取该序号对应的聊天信息。同时本发明专利技术还公开一种聊天信息的检索系统。本发明专利技术能够快速在聊天信息中检索到所需信息,减少用户的等待时间,提高用户的体验感。

【技术实现步骤摘要】

本专利技术涉及即时通讯领域,特别是涉及一种聊天信息的检索方法及检索系统
技术介绍
网络即时通讯系统是人们在网上进行沟通、联系的重要工具之一。许多用户在固定的客户端使用某一即时通讯系统与好友沟通,一段时间后,即时通讯系统就积累了相当数量的聊天信息。如果该用户还加入一些人数较多的群组,聊天信息在短时间就可能达到几十万、甚至上百万条。用户有时要在以往的聊天信息中检索所需信息,这就需要一种针对聊天信息的检索方法,能够在数据量庞大的聊天信息中准确、迅速地检索到所需信息。参阅图1,为现有的聊天信息的检索方法流程图,具体步骤如下所述。步骤S101、将用户的聊天信息保存到数据库中。即时通讯系统将用户所有的聊天信息保存到一个固定的数据库中,并将该数据库与检索系统建立链接。步骤S102、用户使用关键词进行检索。用户启动检索系统,输入检索关键词,在保存聊天信息的数据库中进行检索。如,用户输入关键词“买房”进行检索。步骤S103、检索系统遍历所有的聊天信息,查找与关键词相匹配的聊天信息。为不漏掉所需的信息,检索系统通常采用模糊匹配法,将与关键词相关的信息都检索出来。如,关键词是“买房”,检索系统将包括“买车”、“买礼品”、“住房”、“租房”等词语的信息都检索出来,显示给用户。上述方法是在保存全部聊天信息的数据库中进行检索,检索时,需扫描的数据量极其庞大,因此检索速度相对较慢,有时要在10秒以上,造成用户等待时间过长,降低用户的体验感。
技术实现思路
本专利技术所要解决的技术问题是提供一种聊天信息的检索方法,该方法能够快速在聊天信息中检索到所需信息,减少用户的等待时间,提高用户的体验感。本专利技术的另一个目的是提供一种聊天信息的检索系统,该系统能够快速在聊天信息中检索到所需信息,减少用户的等待时间,提高用户的体验感。本专利技术公开一种聊天信息的检索方法,包括将预设数量的聊天信息处理成索引文件,记录所述索引文件中索引词与聊天信息的序号之间的对应关系;将所述索引词保存到创建的第一索引库;在所述第一索引库中查找与检索关键词相匹配的索引词;获取该索引词对应的序号,并调取该序号对应的聊天信息。优选的,还包括将达到预置数量的新生成聊天信息处理成索引文件;记录上述索引文件的索引词与聊天信息的序号之间的对应关系;将上述索引词保存到创建的第二索引库。优选的,还包括在第二索引库中查找与检索关键词相匹配的索引词。优选的,还包括合并第一索引库与第二索引库,作为第一索引库。优选的,还包括获取没有建立索引的聊天信息;在上述聊天信息中调取包含检索关键词的聊天信息。优选的,按下述步骤,将预设数量的聊天信息处理成索引文件在聊天信息中不重复地提取各个词语,并将上述各个词语与包含该词语的聊天信息的序号建立对应关系。优选的,调取该序号对应的聊天信息之后,还包括调取该聊天信息之前及之后设置数量的聊天信息。优选的,还包括对索引文件中的索引词进行加密处理。本专利技术还公开一种聊天信息的检索系统,包括索引文件处理单元、第一索引词保存单元、检索单元、及聊天信息获取单元所述索引文件处理单元,用于将预设数量的聊天信息处理成索引文件,记录所述索引文件中索引词与聊天信息的序号之间的对应关系;所述第一索引词保存单元,用于将所述索引词保存到创建的第一索引库;所述检索单元,用于在所述第一索引库中查找与检索关键词相匹配的索引词;所述聊天信息获取单元,用于获取该索引词对应的序号,并调取该序号对应的聊天信息。优选的,还包括聊天信息发送单元,用于将达到预置数量的、新生成的聊天信息发送到所述索引文件处理单元;所述第二索引词保存单元,用于将所述索引文件处理单元返回的索引词保存到创建的第二索引库。与现有技术相比,本专利技术具有以下优点本专利技术将预设数量的聊天信息处理成索引文件,记录所述索引文件中索引词与聊天信息的序号之间的对应关系,将索引词保存到创建的第一索引库,在第一索引库中查找与检索关键词相匹配的索引词,获取该索引词对应的序号,并调取该序号对应的聊天信息。检索时,本专利技术是在第一索引库中查找与检索关键词相匹配的索引词,再根据该索引词对应的聊天信息序号调取聊天信息。相对于现有技术在保存全部聊天信息的数据库中查找包含检索关键词的聊天信息,本专利技术因第一索引库只保存预设数量聊天信息的索引词,其数据量相对较小,系统在检索时所需扫描的数据量相对较少,因此检索时间就相对较短,使用户等待的时间减少,提高用户的体验感。附图说明图1为现有的聊天信息的检索方法流程图;图2为本专利技术第一实施例提供的聊天信息的检索方法流程图;图3为本专利技术第二实施例提供的聊天信息的检索方法流程图;图4为本专利技术第三实施例提供的聊天信息的检索方法流程图;图5为本专利技术第四实施例提供的聊天信息的检索方法流程图;图6为本专利技术第五实施例提供的聊天信息的检索系统示意图;图7为本专利技术第六实施例提供的聊天信息的检索系统示意图。具体实施例方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。本专利技术将预设数量的聊天信息处理成索引文件,记录所述索引文件中索引词与聊天信息的序号之间的对应关系,将索引词保存到创建的第一索引库,在第一索引库中查找与检索关键词相匹配的索引词,获取该索引词对应的序号,并调取该序号对应的聊天信息。参照图2,为本专利技术第一实施例提供的聊天信息的检索方法流程图,具体步骤如下所述。步骤S201、将预设数量的聊天信息处理成索引文件。即时通讯系统中的聊天系统将预设数量的、生成时间相对靠前的聊天信息发送给索引系统,索引系统在聊天信息中不重复地提取各个词语,并将上述各个词语与包含该词语的聊天信息的序号建立对应关系。上述各个词语作为索引词,将索引词与聊天信息序号建立对应关系的聊天信息作为索引文件。聊天信息包括文字记录、生成时间、及发送用户和接收用户,每条聊天信息都对应一个唯一的序号。序号可以按聊天信息的生成时间顺序排列。预设数量为1万条聊天信息。步骤S202、记录索引文件中索引词与聊天信息的序号之间的对应关系。每个索引词可能对应一个或多个聊天信息序号。索引系统记录各个索引词与聊天信息序号的对应关系,并保存该对应关系。步骤S203、将索引词保存到创建的第一索引库。创建一用于保存索引词的数据库,作为第一索引库。将索引词按一定的顺序保存在第一索引库。一定的顺序包括按索引词首个字母的排序、按索引词字数排序、及按索引词的笔画排序等方式。为保证聊天信息的保密性,本专利技术对索引词进行加密,加密后再保存到第一索引库。步骤S204、在第一索引库中查找与检索关键词相匹配的索引词。检索时,系统获取检索关键词,在第一索引库中查找与该检索关键词相匹配的索引词。相匹配是指索引词与检索关键词相同。步骤S205、获取该索引词对应的序号,并调取该序号对应的聊天信息。获取查找到的索引词对应的聊天信息序号,再调取上述序号对应的聊天信息。本专利技术是在第一索引库中查找与检索关键词相匹配的索引词,再根据该索引词对应的聊天信息序号调取聊天信息。因第一索引库只保存预设数量聊天信息的索引词,系统在检索时所需扫描的数据量相对较少,因此检索时间就相对较短,使用户等待的时间减少,提高用户的体验感。本专利技术即时通讯系统中的聊天系统在最新生成的聊天信息达到预置数量时,将新生成的聊天信息发本文档来自技高网...

【技术保护点】
一种聊天信息的检索方法,其特征在于,包括:    将预设数量的聊天信息处理成索引文件,记录所述索引文件中索引词与聊天信息的序号之间的对应关系;    将所述索引词保存到创建的第一索引库;    在所述第一索引库中查找与检索关键词相匹配的索引词;    获取该索引词对应的序号,并调取该序号对应的聊天信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:唐年鹏孙良李强
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1