一种基于管理系统的全文搜索引擎方法及系统技术方案

技术编号:26342554 阅读:14 留言:0更新日期:2020-11-13 20:35
本发明专利技术实施例提供一种基于管理系统的全文搜索引擎方法,包括以下步骤:步骤一:对数据库使用sql模糊匹配方法,从所述数据库的数据表中对目标词汇进行检索;步骤二:将目标文档中的目标词汇进行分词处理,得到单个词汇;步骤三:根据所述单个目标数据出现的频率建立索引文件;步骤四:根据所述索引文件建立相应的索引库,以便用户检索得到所述单个目标数据。本发明专利技术实施例减少频繁访问数据库的次数,很大程度降低数据库的压力,进而提高检索效率。

A method and system of full text search engine based on management system

【技术实现步骤摘要】
一种基于管理系统的全文搜索引擎方法及系统
本专利技术涉及数据库
,更具体地说,涉及到一种基于管理系统的全文搜索引擎方法及系统。
技术介绍
客户使用本管理系统,无法准确的输入具体词汇例如商户名/用户名/付款人等,经常要对上述字段进行模糊查询。随着应用的数据量成倍增长,数据库应用的数量已达百万级别,由于oracle等关系数据库索引原则,对于like的前后匹配的查询不支持索引,导致查询效率极低,影响系统使用体验,对此做出优化。本
技术实现思路
为了克服现有技术的不足,本专利技术提供一种基于管理系统的全文搜索引擎方法用来解决减少频繁访问数据库的次数,很大程度降低数据库访问的压力的问题。本专利技术解决其技术问题所采用的技术方案是:基于管理系统的全文搜索引擎方法,包括以下步骤:步骤一:对数据库使用sql模糊匹配方法,从所述数据库的数据表中对目标词汇进行检索;步骤二:将目标文档中的目标词汇进行分词处理,得到单个词汇;步骤三:根据所述单个目标数据出现的频率建立索引文件;步骤四:根据所述索引文件建立相应的索引库,以便用户检索得到所述单个目标数据。优选地,所述对数据库使用sql模糊匹配方法,从所述数据库的数据表中对目标数据进行检索之前,步骤还包括:预先配置xml文件,所述xml文件包括sql查询语句;将现有的数据表导入数据库。优选地,所述根据所述索引文件建立相应的索引库,以便用户检索得到所述单个目标数据之后,步骤还包括:当用户输入第一目标词汇时,将第一目标词汇进行分词,得到分词之后的查询树;分词之后的单个词汇根据所述查询树进行搜索索引,得到查询树中单个词汇的文档链表。优选地,所述分词之后的单个词汇根据所述查询树进行搜索索引,得到查询树中单个词汇的文档链表之后,步骤还包括:对于数据库中的增量词汇,设置定时定量进行查询;定时使用sql模糊匹配方法查询增量词汇,以便加载出新的词汇。优选地,所述将目标文档中的目标词汇进行分词处理,得到单个词汇之前,对数据库使用sql模糊匹配方法,从所述数据库的数据表中对目标词汇进行检索之后,步骤还包括:将所述目标词汇存储至所述目标文档中。一种基于管理系统的全文搜索引擎系统,所述系统包括:检索单元,用于对数据库使用sql模糊匹配方法,从所述数据库的数据表中对目标词汇进行检索;第一分词单元,用于将目标文档中的目标词汇进行分词处理,得到单个词汇;索引文件建立单元,用于根据所述单个目标数据出现的频率建立索引文件;数据库建立单元,用于根据所述索引文件建立相应的索引库,以便用户检索得到所述单个目标数据。优选地,所述系统还包括:配置单元,用于预先配置xml文件,所述xml文件包括sql查询语句;数据库导入单元,将现有的数据表导入数据库。优选地,所述系统还包括第二分词单元,用于当用户输入第一目标词汇时,将第一目标词汇进行分词,得到分词之后的查询树;索引单元,用于分词之后的单个词汇根据所述查询树进行搜索索引,得到查询树中单个词汇的文档链表。优选地,所述系统还包括:设置单元,用于对于数据库中的增量词汇,设置定时定量进行查询;查询单元,用于定时使用sql模糊匹配方法查询增量词汇,以便加载出新的词汇。优选地,所述系统还包括:存储单元,用于将所述目标词汇存储至所述目标文档中。本专利技术的有益效果是:对数据库使用sql模糊匹配方法,从所述数据库的数据表中对目标词汇进行检索;将目标文档中的目标词汇进行分词处理,得到单个词汇;根据所述单个目标数据出现的频率建立索引文件;根据所述索引文件建立相应的索引库,以便用户检索得到所述单个目标数据,减少频繁访问数据库的次数,很大程度降低数据库访问的压力进而提高用户体验。附图说明图1是基于管理系统的全文搜索引擎方法的流程示意图。图2是基于管理系统的全文搜索引擎系统的功能模块图。图3是基于管理系统的全文搜索引擎系统的另一功能模块图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。以下结合具体实施例对本专利技术的具体实现进行详细描述:实施例一:图1示出了本专利技术实施例一提供的基于管理系统的全文搜索引擎方法的实现流程,为了便于说明,仅示出了与本专利技术实施例相关的部分,详述如下:在步骤S101中,对数据库使用sql模糊匹配方法,从所述数据库的数据表中对目标词汇进行检索;本专利技术实施例适用于数据库
,根据项目需求,客户可能输入的词汇,比如客户经常会对商户名称,客户名称,收款人名称等作为查询条件进行筛选数据,我们先用sql模糊匹配办法对,从商户表,客户信息表等数据表,把相关词汇从各个数据表搜索出来,以便把相关词汇进行后续的分词处理。优选地,在对数据库使用sql模糊匹配方法,从数据库的数据表中对目标词汇进行检索之前,预先配置xml文件,所述xml文件包括sql查询语句,以便sql查询语句写入到xml配置文件当中,此后系统根据xml配置文件执行相关的sql查询语句,将现有的数据表导入数据库,便于获取现有数据表当中的商户名称,客户名称,收款人名称等数据。在步骤S102中,将目标文档中的目标词汇进行分词处理,得到单个词汇;本专利技术实施例中,将文档中的数据分成单个词汇,例如A文档的商户名为“深圳百胜集团肯德基”“深圳百胜集团”和B文档的“广东深圳百胜集团必胜客”,那么将分割成“深圳”,“广东”,“百胜”,“肯德基”,“必胜客”,忽视标点和停词。优选地,在将目标文档中的目标词汇进行分词处理,得到单个词汇之前,对数据库使用sql模糊匹配方法,从所述数据库的数据表中对目标词汇进行检索之后,将所述目标词汇存储至所述目标文档中。在步骤S103中,根据所述单个目标数据出现的频率建立索引文件;在本专利技术实施中,根据步骤S102分割出来的单个词汇,再根据单个词汇在文档中出现的频率,为文档建立索引文件,比如“深圳”出现了3次,分布在不同文档,那么索引文件记录“深圳”这个词汇就是(A:2:0),表示既在A文档出现2次,在词组第1个位置;(B:1:1)表示既在B文档出现1次,在词组第2个位置。根据词汇出现频率进行由高到低排序,所以A文档比B文档更靠前,更早被搜索出来。在步骤S104中,根据所述索引文件建立相应的索引库,以便用户检索得到所述单个目标数据。本实施例中,根据建立好的索引文件建立相应的索引库,索引库可以看做是检索对应文档的目录,便于用户在检索时,快速定位相关词汇对应的文档。优选地,所述根据所述索引文件建立相应的索引库,以便用户检索得到所述单个目标数据之后,当用户输入第一目标词汇时,将第一目标词汇进行分词,得到分词之后的查询树,分词之本文档来自技高网
...

【技术保护点】
1.一种基于管理系统的全文搜索引擎方法,其特征在于,包括以下步骤:/n步骤一:对数据库使用sql模糊匹配方法,从所述数据库的数据表中对目标词汇进行检索;/n步骤二:将目标文档中的目标词汇进行分词处理,得到单个词汇;/n步骤三:根据所述单个目标数据出现的频率建立索引文件;/n步骤四:根据所述索引文件建立相应的索引库,以便用户检索得到所述单个目标数据。/n

【技术特征摘要】
1.一种基于管理系统的全文搜索引擎方法,其特征在于,包括以下步骤:
步骤一:对数据库使用sql模糊匹配方法,从所述数据库的数据表中对目标词汇进行检索;
步骤二:将目标文档中的目标词汇进行分词处理,得到单个词汇;
步骤三:根据所述单个目标数据出现的频率建立索引文件;
步骤四:根据所述索引文件建立相应的索引库,以便用户检索得到所述单个目标数据。


2.根据权利要求1所述的一种基于管理系统的全文搜索引擎方法,其特征在于,所述对数据库使用sql模糊匹配方法,从所述数据库的数据表中对目标数据进行检索之前,所述步骤还包括:
预先配置xml文件,所述xml文件包括sql查询语句;
将现有的数据表导入数据库。


3.根据权利要求2所述的一种基于管理系统的全文搜索引擎方法,其特征在于,所述根据所述索引文件建立相应的索引库,以便用户检索得到所述单个目标数据之后,所述步骤还包括:
当用户输入第一目标词汇时,将第一目标词汇进行分词,得到分词之后的查询树;
分词之后的单个词汇根据所述查询树进行搜索索引,得到查询树中单个词汇的文档链表。


4.根据权利要求3所述的一种基于管理系统的全文搜索引擎方法,其特征在于,所述分词之后的单个词汇根据所述查询树进行搜索索引,得到查询树中单个词汇的文档链表之后,所述步骤还包括:
对于数据库中的增量词汇,设置定时定量进行查询;
定时使用sql模糊匹配方法查询增量词汇,以便加载出新的词汇。


5.根据权利要求3所述的一种基于管理系统的全文搜索引擎方法,其特征在于,所述将目标文档中的目标词汇进行分词处理,得到单个词汇之前,对数据库使用sql模糊匹配方法,从...

【专利技术属性】
技术研发人员:陈思达郭勇郭倩吴海波刘进
申请(专利权)人:银盛支付服务股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1