一种拼音搜索系统技术方案

技术编号:41857527 阅读:22 留言:0更新日期:2024-06-27 18:32
本发明专利技术涉及拼音搜索技术领域,且公开了一种拼音搜索系统。该拼音搜索系统,通过构建数据库和redis存储组件,实现拼音的高速模糊搜索;将所有待搜索数据缓存RMAP,唯一键为ID;将汉字转化为拼音全拼,为所指向数据的ID拼接,以单个汉字为单位,将拼音进行分解为多个字符串,存储于前缀树中,通过输入字符串查询,以数据库和redis进行存储的拼音模糊匹配,定位到该节点,从缓存查询结果,利用后缀树思想,以单个汉字为单位,将拼音进行分解为多个字符串,存储于前缀树中,能够快速查找到储存于前缀树中的字符,解决了数据库模糊搜索速度较快和拼音搜索不够全面效果,实现了该系统的对拼音的高速模糊搜索效果。

【技术实现步骤摘要】

本专利技术涉及拼音搜索,具体为一种拼音搜索系统


技术介绍

1、当前拼音模糊搜索方案主流方案都是基于搜索引擎如solr、elasticsearch,在数据量没那么大,存储介质使用mysql和redis情况下拼音搜索的速度较慢、搜索结果不够全面,数据库模糊搜索速度比较慢,使用前缀树构造字符串的拼音搜索不够全面。

2、redis存储方面有可能占用较多,字符串比较长时利用后缀树思想转化为多个字符串可能过长,若转换出来的拼音字符串前缀相似度低,则占用新的节点存储。


技术实现思路

1、本专利技术的目的在于提供一种拼音搜索系统,以解决上述
技术介绍
中提出的问题。

2、为了解决上述技术问题,本专利技术提供如下技术方案:一种拼音搜索系统,通过构建数据库和redis存储组件,实现拼音的高速模糊搜索;

3、将所有待搜索数据缓存rmap,唯一键为id;

4、将汉字转化为拼音全拼,以及首字母拼写;

5、首字母以及全拼以字为单位按后缀树思想生成多个字符串;</p>

6、分解本文档来自技高网...

【技术保护点】

1.一种拼音搜索系统,其特征在于通过构建数据库和redis存储组件,实现拼音的高速模糊搜索;

2.根据权利要求1所述的一种拼音搜索系统,其特征在于:所述前缀树存储字符串,实现以下能力;

3.根据权利要求1所述的一种拼音搜索系统,其特征在于将汉字转化为全拼和首字母拼写之后,将所有数据缓存;使用后缀树的思想生成字符串,将这些字符串存入前缀树中。

4.根据权利要求1所述的一种拼音搜索系统,其特征在于包括:通过所述前缀树所有路径节点存储该原字符串ID拼接,将前缀树存入redis中。

5.根据权利要求4所述的一种拼音搜索系统,其特征在于通过将被搜索数...

【技术特征摘要】

1.一种拼音搜索系统,其特征在于通过构建数据库和redis存储组件,实现拼音的高速模糊搜索;

2.根据权利要求1所述的一种拼音搜索系统,其特征在于:所述前缀树存储字符串,实现以下能力;

3.根据权利要求1所述的一种拼音搜索系统,其特征在于将汉字转化为全拼和首字母拼写之后,将所有数据缓存;使用后缀树的思想生成字符串,将这些字符串存入前缀树中。

4.根据权利要求1所述的一种拼音搜索系统,其特征在于包括:通过所述前缀树所有路径节点存储该原字符串id拼接,将前缀树存入redis中。<...

【专利技术属性】
技术研发人员:何斌李立峰蔡玉峰
申请(专利权)人:上海自然而然信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1