The invention discloses a Migo search engine, which comprises an index database, a full-text search module, an accurate search module, a space-time analysis module and a relationship expansion module. The beneficial effect of the invention is that under the same hardware configuration, using Migo search engine, the hardware cost is cheaper, the retrieval efficiency is faster, and the low cost memory database with more efficient application is analyzed.
【技术实现步骤摘要】
一种Migo搜索引擎
本专利技术涉及搜索引擎改进,特别是一种Migo搜索引擎。
技术介绍
公安信息在情报的应用主要基于大数据的实时分析和处理,而目前大部分公安系统使用的仍是以长驻磁盘的传统数据库,随着数据的增长和规模化应用,传统的数据库已达到了维持系统高效运转的瓶颈,在服务器配置有限的情况下,Oracle数据库在数十亿数据量中检索效率低下;数据维护困难复杂,当数据字段发生变化,数据与数据之间原有的关系代码无法适用,需要重新调整代码,成本高,且不利于维护。
技术实现思路
本专利技术的目的是为了解决上述问题,设计了一种Migo搜索引擎。实现上述目的本专利技术的技术方案为,一种Migo搜索引擎,包括,索引数据库,用于储存数据索引信息,供搜索引擎使用;全文检索模块,利用Key-Value的格式分别对词与行ID集合的存储,Value中只存储锚点信息,锚点信息标识ID集的开始位置与结始位置,对检索的关键字进行判断是否能分词,若可以分词,则将关键词分开进行检索,若不能分词,则直接检索;精确检索模块,用于应用到批量比对,无需分词;时空分析模块,用于通过把时间的粒度大小和空间的广度进行预设,再通过聚合索引分析出人的同行关系,以此分析与主体对象的伴随关系;关系扩展模块,用于提供标识对象的功能,当两个对象在同一条记录中,则认为可建立关系。作为优选,所述全文检索模块,利用Key-Value的格式分别对词与行ID集合的存储,Value中只存储锚点信息,锚点信息标识ID集的开始位置与结始位置,对检索的关键字进行判断是否能分词,若可以分词,则将关键词分开进行检索,若不能分词,则直接检索,其 ...
【技术保护点】
1.一种Migo搜索引擎,其特征在于,包括,索引数据库,用于储存数据索引信息,供搜索引擎使用;全文检索模块,利用Key‑Value的格式分别对词与行ID集合的存储,Value中只存储锚点信息,锚点信息标识ID集的开始位置与结始位置,对检索的关键字进行判断是否能分词,若可以分词,则将关键词分开进行检索,若不能分词,则直接检索;精确检索模块,用于应用到批量比对,无需分词;时空分析模块,用于通过把时间的粒度大小和空间的广度进行预设,再通过聚合索引分析出人的同行关系,以此分析与主体对象的伴随关系;关系扩展模块,用于提供标识对象的功能,当两个对象在同一条记录中,则认为可建立关系。
【技术特征摘要】
1.一种Migo搜索引擎,其特征在于,包括,索引数据库,用于储存数据索引信息,供搜索引擎使用;全文检索模块,利用Key-Value的格式分别对词与行ID集合的存储,Value中只存储锚点信息,锚点信息标识ID集的开始位置与结始位置,对检索的关键字进行判断是否能分词,若可以分词,则将关键词分开进行检索,若不能分词,则直接检索;精确检索模块,用于应用到批量比对,无需分词;时空分析模块,用于通过把时间的粒度大小和空间的广度进行预设,再通过聚合索引分析出人的同行关系,以此分析与主体对象的伴随关系;关系扩展模块,用于提供标识对象的功能,当两个对象在同一条记录中,则认为可建立关系。2.根据权利要求1所述的一种Migo搜索引擎,其特征在于,所述全文检索模块,利用Key-Value的格式分别对词与行ID集合的存储,Value中只存储锚点信息,锚点信息标识ID集的开始位置与结始位置,对检索的关键字进行判断是否能分词,若可以分词,则将关键词分开进行检索,若不能分词,则直接检索,其具体为,系统会根据词表对检索的关键字进行判断是否能分词,判断该关键字能否分词,若可以分词,则根据分词的个数各自进行操作,通过索引块数据表读取字节流,取得行号,再回到数据锚点表,查对应的字节流位置,并将各个分词的搜索结果进行交集从数据明细表中获取详细记录;若未取到行号,则停止操作。3.根据权利要求1所述的一种Migo搜索引擎,其特征在于,所述时空分析模块根据人...
【专利技术属性】
技术研发人员:冯少龙,梁镜泉,
申请(专利权)人:珠海市新德汇信息技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。