一种基于solr实现的办公自动化OA搜索方法及设备技术

技术编号:21004055 阅读:25 留言:0更新日期:2019-04-30 21:31
本发明专利技术公开了一种基于solr实现的办公自动化OA搜索方法及设备,所述方法包括:建立用于表征OA系统中源数据库的原字段与目标数据库中的目标字段之间的映射关系的配置文件;在到达数据抽取任务的开始时间时,根据所述配置文件抽取所述源数据库中原字段对应的原始数据,以及将所述原始数据存放到与所述原字段对应的目标字段所在目标数据库中,形成与所述目标字段对应的目标数据;调用solr服务器,建立用于搜索所述目标数据库中所述目标数据的索引。

An Office Automation OA Search Method and Equipment Based on Solr

【技术实现步骤摘要】
一种基于solr实现的办公自动化OA搜索方法及设备
本专利技术涉及数据库
,尤其涉及一种基于solr实现的办公自动化OA搜索方法及设备。
技术介绍
OA(OfficeAutomation,办公自动化)系统是将现代化办公和计算机网络功能结合起来的一种新型的办公方式,利用先进的信息处理技术,使“办公”这一传统的原本由人来具体实施的活动逐渐演变成由各种设备、各种系统来协助完成操作,OA系统具有强大的查阅检索功能,可以通过设置检索条件,实现关键字的全文搜索,为员工快速查找资料、数据等提供便利,从而提高搜集文献资料的效率。目前的办公自动化OA搜索方式的主要包括两种:第一种是基于对数据库字段的模糊匹配检索,也即通过关键词,直接从源数据库中查询,该方法有很强的耦合,查询效率低;第二种方法主要依赖外部全文检索工具包来进行实现,这种方法需要根据具体的应用场景和业务,制定相应的抽取和清洗数据的逻辑,与业务的耦合度较高,需要定制服务,从而导致程序无法复用,工作量大,效率低。所以,现有技术中,存在办公自动化OA搜索效率低的技术问题。
技术实现思路
本专利技术实施例提供一种基于solr实现的办公自动化OA搜索方法及设备,用于解决现有技术中,存在办公自动化OA搜索效率低的技术问题。为此,本专利技术实施例提供的一种基于solr实现的办公自动化OA搜索方法的具体技术方案如下:建立用于表征OA系统中源数据库的原字段与目标数据库中的目标字段之间的映射关系的配置文件;在到达数据抽取任务的开始时间时,根据所述配置文件抽取所述源数据库中原字段对应的原始数据,以及将所述原始数据存放到与所述原字段对应的目标字段所在目标数据库中,形成与所述目标字段对应的目标数据;调用solr服务器,建立用于搜索所述目标数据库中所述目标数据的索引。可选的,所述调用solr服务器,建立用于搜索所述目标数据库中所述目标数据的索引,具体包括:调用solr服务器对所述目标数据进行分词处理,获得至少一个分词数据;建立所述至少一个分词数据与所述目标数据的对应关系,以便在所述solr服务器的搜索接口中通过所述至少一个分词数据搜索到所述目标数据。可选的,在所述根据配置文件获取所述源数据库中原字段对应的原始数据之前,包括:确定所述源数据库对应的驱动;通过加载所述驱动连接所述源数据库。可选的,在所述数据抽取任务为周期任务时,所述方法包括:在到达所述数据抽取任务的周期间隔时,抽取所述原始数据中更新的数据;利用所述更新的数据更新所述目标数据;调用所述solr服务器,建立用于搜索更新后的目标数据的索引。可选的,所述数据抽取任务中还包括所述目标数据的存储时间,所述方法包括:在所述目标数据的存储时间达到时,删除所述目标数据。可选的,在所述建立用于表征OA系统中源数据库原字段与目标字段之间的映射关系的配置文件之前,还包括:确定所述目标数据库中的目标字段,所述目标字段的字段名称以及字段类型。另一方面,本申请实施例还提供一种基于solr实现的办公自动化OA搜索设备,包括:建立模块,用于建立用于表征OA系统中源数据库的原字段与目标数据库中的目标字段之间的映射关系的配置文件;抽取模块,用于在到达数据抽取任务的开始时间时,根据所述配置文件抽取所述源数据库中原字段对应的原始数据,以及将所述原始数据存放到与所述原字段对应的目标字段所在目标数据库中,形成与所述目标字段对应的目标数据;调用模块,用于调用solr服务器,建立用于搜索所述目标数据库中所述目标数据的索引。可选的,所述调用模块还用于:调用solr服务器对所述目标数据进行分词处理,获得至少一个分词数据;建立所述至少一个分词数据与所述目标数据的对应关系,以便在所述solr服务器的搜索接口中通过所述至少一个分词数据搜索到所述目标数据。可选的,所述设备还包括:确定模块,用于确定所述源数据库对应的驱动;加载模块,用于通过加载所述驱动连接所述源数据库。可选的,所述设备还包括:第一抽取子模块,用于在到达所述数据抽取任务的周期间隔时,抽取所述原始数据中更新的数据;更新模块,用于利用所述更新的数据更新所述目标数据;第一调用子模块,用于调用所述solr服务器,建立用于搜索更新后的目标数据的索引。可选的,所述设备还包括:删除模块,用于在所述目标数据的存储时间达到时,删除所述目标数据。可选的,所述设备还包括:第二确定子模块,用于确定所述目标数据库中的目标字段,所述目标字段的字段名称以及字段类型。再一方面,本专利技术实施例还提供一种基于solr实现的办公自动化OA搜索设备,包括:至少一个处理器,以及与所述至少一个处理器连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令,执行如上所述的基于solr实现的办公自动化OA搜索方法。再一方面,本专利技术实施例还提供一种计算机可读存储介质:所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如上所述的基于solr实现的办公自动化OA搜索方法。由于本申请实施例中的技术方案,在对源数据抽取前,先针对OA系统中源数据库建立用于数据抽取的配置文件,通过配置文件实现源数据原字段和检索字段的映射,进而在到达数据抽取任务的开始时间时,能够自动根据配置文件对相应的源数据库中原字段对应的原始数据进行,以及将所述原始数据存放到与所述原字段对应的目标字段所在目标数据库中,形成与所述目标字段对应的目标数据,然后再调用solr服务器,建立用于搜索所述目标数据库中所述目标数据的索引,进而可以通过solr服务器的搜索结合搜索目标数据,所以,有效的解决了现有技术中存在的办公自动化OA搜索效率低的技术问题,实现提高办公自动化OA搜索效率的有益效果。又由于本方法可以自由配置数据抽取任务的执行时间、周期间隔时间、抽取数据的存放路径等参数,使得各个抽取任务有序进行,无需人工干预,同时还可以通过可视化界面查看任务进度、详情、状态和报错信息,所以,相比现有技术更加方便灵活自动化,同时也进一步提高了办公自动化OA搜索效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例。图1为本申请实施例提供的一种基于solr实现的办公自动化OA搜索方法的流程图;图2为本申请实施例中提供的数据抽取过程中原字段与目标字段之间映射的结构示意图;图3为本申请实施例中在执行步骤S102之前还可执行的一些步骤的流程图;图4为本申请实施例中步骤S103的具体实现方式的流程图;图5为本申请实施例中还可执行的另一些步骤的流程图;图6为本申请实施例提供的一种基于solr实现的办公自动化OA搜索设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术技术方案的一部分实施例,而不是全部的实施例。基于本申请文件中记载的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术技术方案保护的范围。请参考图1,为本申请实施例提供的一种基于solr实现的办公自动化OA搜索方法本文档来自技高网...

【技术保护点】
1.一种基于solr实现的办公自动化OA搜索方法,其特征在于,包括:建立用于表征OA系统中源数据库的原字段与目标数据库中的目标字段之间的映射关系的配置文件;在到达数据抽取任务的开始时间时,根据所述配置文件抽取所述源数据库中原字段对应的原始数据,以及将所述原始数据存放到与所述原字段对应的目标字段所在目标数据库中,形成与所述目标字段对应的目标数据;调用solr服务器,建立用于搜索所述目标数据库中所述目标数据的索引。

【技术特征摘要】
1.一种基于solr实现的办公自动化OA搜索方法,其特征在于,包括:建立用于表征OA系统中源数据库的原字段与目标数据库中的目标字段之间的映射关系的配置文件;在到达数据抽取任务的开始时间时,根据所述配置文件抽取所述源数据库中原字段对应的原始数据,以及将所述原始数据存放到与所述原字段对应的目标字段所在目标数据库中,形成与所述目标字段对应的目标数据;调用solr服务器,建立用于搜索所述目标数据库中所述目标数据的索引。2.如权利要求1所述的方法,其特征在于,所述调用solr服务器,建立用于搜索所述目标数据库中所述目标数据的索引,具体包括:调用solr服务器对所述目标数据进行分词处理,获得至少一个分词数据;建立所述至少一个分词数据与所述目标数据的对应关系,以便在所述solr服务器的搜索接口中通过所述至少一个分词数据搜索到所述目标数据。3.如权利要求1或2所述的方法,其特征在于,在所述根据配置文件获取所述源数据库中原字段对应的原始数据之前,包括:确定所述源数据库对应的驱动;通过加载所述驱动连接所述源数据库。4.如权利要求1或2所述的方法,其特征在于,在所述数据抽取任务为周期任务时,所述方法包括:在到达所述数据抽取任务的周期间隔时,抽取所述原始数据中更新的数据;利用所述更新的数据更新所述目标数据;调用所述solr服务器,建立用于搜索更新后的目标数据的索引。5.如权利要求1所述的方法,其特征在...

【专利技术属性】
技术研发人员:胡小克刘婷郑林峰全兵
申请(专利权)人:中移苏州软件技术有限公司中国移动通信集团公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1