一种纠错对自动生成方法及系统技术方案

技术编号：8300820 阅读：182 留言：0更新日期：2013-02-07 04:17

本发明专利技术适用于计算机技术领域，提供了一种纠错对自动生成方法及系统，所述方法包括下述步骤：获取存储的预设时间长度内用户输入的相邻搜索词；计算所述相邻搜索词为纠错对的置信度；当所述置信度大于第一阈值时，将所述相邻搜索词设置为候选纠错对；当所述候选纠错对符合所述预设条件时，确定所述相邻搜索词为纠错对。本发明专利技术实现了纠错对的自动生成，解决了对于尚未存在的搜索词难以提供正确的、更为准确的搜索词的问题，提高了用户搜索信息时搜索词的准确度，缩短了获取信息的时间，进而提高了用户的搜索效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机
，尤其涉及一种纠错对自动生成方法及系统。
技术介绍
随着互联网的普及，互联网的信息资源成指数增长，搜索引擎为用户提供了一个从海量的信息资源中获取需要的资源的重要途径，然而，对于大多数用户来说，在进行初始搜索时，输入的搜索词是比较模糊的，有时搜索词还存在一定的错误，用户无法用较为准确的搜索词来搜索自己所需要的信息，只有通过不断地筛选和提炼才可能获得最终的搜索词，现有搜索引擎在检测到用户的搜索词时，可以根据用户输入的搜索词向用户提供纠正后的搜索词，用户输入的搜索词(模糊的、不正确的搜索词)和纠正后的搜索词构成了一个纠错对，然而该纠错对主要是依靠在已存储的搜索记录、日志等中进行查询匹配后向用户反馈的，对于尚未存在的搜索词难以提供正确的、更为准确的搜索词，导致信息搜索时间长，信息查准确率低，搜索效率低下。
技术实现思路
本专利技术实施例的目的在于提供一种纠错对自动生成方法及系统，旨在解决由于现有搜索引擎难以向用户提供更为准确的搜索词，导致信息查准确率低，搜索效率低下的问题。本专利技术实施例是这样实现的，一种纠错对自动生成方法，所述方法包括下述步骤获取预设时间内用户输入的相邻搜索词；计算所述相邻搜索词为纠错对的置信度；当所述置信度大于第一阈值时，将所述相邻搜索词设置为候选纠错对；当所述候选纠错对符合所述预设条件时，确定所述相邻搜索词为纠错对。本专利技术实施例的另一目的在于提供一种搜索候选词自动生成系统，所述系统包括搜索词获取单元，用于获取存储的预设时间长度内用户输入的相邻搜索词；置信度计算单元，用于计算所述相邻搜索词为纠错对的置信度；候选...

【技术保护点】
一种纠错对自动生成方法，其特征在于，所述方法包括下述步骤：获取预设时间内用户输入的相邻搜索词；计算所述相邻搜索词为纠错对的置信度；当所述置信度大于第一阈值时，将所述相邻搜索词设置为候选纠错对；当所述候选纠错对符合预设条件时，确定所述相邻搜索词为纠错对。

【技术特征摘要】

【专利技术属性】
技术研发人员：李超，田里，宋国龙，贾自艳，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人