【技术实现步骤摘要】
本专利技术涉及网络信息处理领域,特别涉及。
技术介绍
随着网络在全球的普及,用户与搜索引擎进行交互的方式主要是用户将所要寻找的信 息转换成几个査询词,再将这些查询词输入到搜索引擎中,由搜索引擎完成信息的检索并提 交给用户。目前,对于中文搜索引擎用户来说,使用英文已经成为越来越不可避免的趋势。大量的 软件名、地名以及网络中不断出现的新兴词语很多都需要用英文表达。用英文辅助中文表达 用户的检索需求逐渐成为中文搜索引擎用户的一种习惯。然而,在这个过程中如果用户向搜 索引擎提交的査询词含有拼写错误,搜索引擎就会按照错误的査询词进行信息的检索,最后 的结果是搜索引擎检索不到用户实际需要的信息,或者根本检索不到信息。据统计,输入搜 索引擎的査询词中有10%-15%含有拼写错误。对于输入中文搜索引擎的英文査询词,拼写错误的比例要大于15%,这是由于中文搜索引擎用户的母语一般为中文,英文作为非母语出错的可能性要比中文大很多。另外在中文搜索引擎中,用户输入的英文查询词不完全是英文单词,其中相当一部分是 拼音串。出错的拼音串也会影响搜索引擎的检索,导致搜索引擎检索不到用户实际需要 ...
【技术保护点】
一种中文搜索引擎中查询词的拼写校正方法,其特征在于,所述方法包括: 判断输入中文搜索引擎的英文查询词是否为正确的英文查询词; 对非正确的英文查询词,生成所述非正确的英文查询词的候选形式,按照预设规则将所述候选形式列入候选集合; 对所述候选集合中的所有候选形式进行评分,将分值最高的候选形式作为校正后的形式返回给用户。
【技术特征摘要】
【专利技术属性】
技术研发人员:周博,刘奕群,张敏,金奕江,马少平,茹立平,佟子健,
申请(专利权)人:清华大学,北京搜狗科技发展有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。