一种业务系统非结构化数据全文检索方法及系统技术方案

技术编号:41496462 阅读:34 留言:0更新日期:2024-05-30 14:40
本发明专利技术提供了一种业务系统非结构化数据全文检索方法及系统,包括:定期采集企业的非结构化数据,并将所述企业的非结构化数据导入预先构建的分布式非结构化数据检索平台进行更新;获取查询请求;将查询请求代入更新后的预先构建的分布式非结构化数据检索平台,输出检索结果;其中,所述分布式非结构化数据检索平台是在服务器中部署OpenStack的Swift和Solr软件框架构建的。本发明专利技术通过定期更新分布式非结构化数据检索平台,使得非结构化数据更全面,而且采用OpenStack的Swift和Solr软件框架可高效、便捷地检索出所需的数据。

【技术实现步骤摘要】

本专利技术涉及数据检索领域,具体涉及一种业务系统非结构化数据全文检索方法及系统


技术介绍

1、随着业务系统建设的深入,使得普遍存在大量的word、excel和pdf等文档数据,这些数据是企业运营最主要、最普遍的数据组织管理内容之一,企业众多的生产、经营决策及日常管理也主要依赖这些文档数据开展,员工们查找数据信息极为不便。

2、现有技术对非结构化数据查询方法一般有以下两种:

3、(1)顺序扫描法(serial scanning)

4、所谓顺序扫描,比如要找内容包含某一个字符串的文件,就是一个文档一个文档的看,对于每一个文档,从头看到尾,如果此文档包含此字符串,则此文档为我们要找的文件,接着看下一个文件,直到扫描完所有的文件。但搜索速度是相当的慢。

5、(2)全文检索(full-text search)

6、将非结构化数据中的一部分信息提取出来,重新组织,使其变得有一定结构,然后对此有一定结构的数据进行搜索,从而达到搜索相对较快的目的。这部分从非结构化数据中提取出的然后重新组织的信息,我们称之索引。本文档来自技高网...

【技术保护点】

1.一种业务系统非结构化数据全文检索方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述分布式非结构化数据检索平台的构建包括:

3.如权利要求2所述的方法,其特征在于,所述在服务器上部署OpenStack的Swift软件框架和Solr软件框架,包括:

4.如权利要求2所述的方法,其特征在于,所述将企业内的非结构化数据导入所述Swift软件框架内进行存储,包括:

5.如权利要求2所述的方法,其特征在于,所述通过Solr软件框架对存储在所述Swift软件框架内的非结构化数据并行创建索引,包括:

6.如权利要求5所述...

【技术特征摘要】

1.一种业务系统非结构化数据全文检索方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述分布式非结构化数据检索平台的构建包括:

3.如权利要求2所述的方法,其特征在于,所述在服务器上部署openstack的swift软件框架和solr软件框架,包括:

4.如权利要求2所述的方法,其特征在于,所述将企业内的非结构化数据导入所述swift软件框架内进行存储,包括:

5.如权利要求2所述的方法,其特征在于,所述通过solr软件框架对存储在所述swift软件框架内的非结构化数据并行...

【专利技术属性】
技术研发人员:文洪昌万雅萌王晓牛浩荆智豪张莹孙鹏孙鑫李磊杨婧路文
申请(专利权)人:北京国电通网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1