【技术实现步骤摘要】
本专利技术涉及数据检索领域,具体涉及一种业务系统非结构化数据全文检索方法及系统。
技术介绍
1、随着业务系统建设的深入,使得普遍存在大量的word、excel和pdf等文档数据,这些数据是企业运营最主要、最普遍的数据组织管理内容之一,企业众多的生产、经营决策及日常管理也主要依赖这些文档数据开展,员工们查找数据信息极为不便。
2、现有技术对非结构化数据查询方法一般有以下两种:
3、(1)顺序扫描法(serial scanning)
4、所谓顺序扫描,比如要找内容包含某一个字符串的文件,就是一个文档一个文档的看,对于每一个文档,从头看到尾,如果此文档包含此字符串,则此文档为我们要找的文件,接着看下一个文件,直到扫描完所有的文件。但搜索速度是相当的慢。
5、(2)全文检索(full-text search)
6、将非结构化数据中的一部分信息提取出来,重新组织,使其变得有一定结构,然后对此有一定结构的数据进行搜索,从而达到搜索相对较快的目的。这部分从非结构化数据中提取出的然后重新组织的
...【技术保护点】
1.一种业务系统非结构化数据全文检索方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述分布式非结构化数据检索平台的构建包括:
3.如权利要求2所述的方法,其特征在于,所述在服务器上部署OpenStack的Swift软件框架和Solr软件框架,包括:
4.如权利要求2所述的方法,其特征在于,所述将企业内的非结构化数据导入所述Swift软件框架内进行存储,包括:
5.如权利要求2所述的方法,其特征在于,所述通过Solr软件框架对存储在所述Swift软件框架内的非结构化数据并行创建索引,包括:
...
【技术特征摘要】
1.一种业务系统非结构化数据全文检索方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述分布式非结构化数据检索平台的构建包括:
3.如权利要求2所述的方法,其特征在于,所述在服务器上部署openstack的swift软件框架和solr软件框架,包括:
4.如权利要求2所述的方法,其特征在于,所述将企业内的非结构化数据导入所述swift软件框架内进行存储,包括:
5.如权利要求2所述的方法,其特征在于,所述通过solr软件框架对存储在所述swift软件框架内的非结构化数据并行...
【专利技术属性】
技术研发人员:文洪昌,万雅萌,王晓,牛浩,荆智豪,张莹,孙鹏,孙鑫,李磊,杨婧,路文,
申请(专利权)人:北京国电通网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。