数据抽取方法及基于地理信息的数据展示方法技术

技术编号:20221703 阅读:69 留言:0更新日期:2019-01-28 20:14
本发明专利技术提供一种数据抽取方法,属于计算机技术领域,该方法包括:获取用户配置的抽取规则;将所述抽取规则转换成SQL查询语句;根据所述SQL查询语句,从全文搜索引擎中抽取目标数据。另外,将抽取到的所述目标数据渲染到地图上,实现所述目标数据的可视化展示。本发明专利技术提供的数据抽取方法,通过将用户配置的抽取规则转换成结构化的SQL查询语句,避免了复杂的查询对象使用字符串格式组织,该方法灵活可配置,支持各个领域的抽取规则的定制,在全文搜索引擎中支持SQL查询语句,极大的方便了技术人员对全文搜索引擎中索引数据的检索,提高了开发效率,缩短了开发周期,降低了开发成本。

【技术实现步骤摘要】
数据抽取方法及基于地理信息的数据展示方法
本专利技术涉及计算机
,尤其涉及一种数据抽取方法及基于地理信息的数据展示方法。
技术介绍
在计算机
,数据抽取是各行各业定制化自身业务的重要手段,如何可视化抽取数据也是业务需求的重要内容。现有技术中的数据抽取方法,通常使用数据库模糊查询进行检索,当数据量增大时,检索速度越来越慢,而基于大数据搜索引擎进行数据抽取能极大提升数据抽取速度,现有方法中通常使用全文检索工具进行检索,将各种复杂的查询对象使用字符串格式组织,构建查询语句来抽取数据,以实现各业务需求。但是现有技术中的方法存在如下技术问题:一是组装复杂的字符串格式对象查询语句用于从全文检索工具中抽取数据,极大的限制了开发效率;二是每次数据传输到全文检索工具中需要额外的调用接口,耦合性太高;三是全文检索工具自带的分词器的分词粒度太粗,造成抽取的数据的准确度不高,四是抽取的数据多数用于列表和报告展示,缺少丰富的可视化图表和地理信息展示支撑。
技术实现思路
本专利技术的目的是提供一种数据抽取方法及基于地理信息的数据展示方法,解决了现有技术中的上述技术问题。为了解决上述技术问题,一方面,本专本文档来自技高网...

【技术保护点】
1.一种数据抽取方法,其特征在于,包括:获取用户配置的抽取规则;将所述抽取规则转换成SQL查询语句;根据所述SQL查询语句,从全文搜索引擎中抽取目标数据。

【技术特征摘要】
1.一种数据抽取方法,其特征在于,包括:获取用户配置的抽取规则;将所述抽取规则转换成SQL查询语句;根据所述SQL查询语句,从全文搜索引擎中抽取目标数据。2.根据权利要求1所述的方法,其特征在于,所述抽取规则至少包含领域、关键词和关键词间的逻辑连接关系中的任一种。3.根据权利要求1所述的方法,其特征在于,所述根据所述SQL查询语句,从全文搜索引擎中抽取目标数据,具体包括:使用预设的分词器对所述SQL查询语句中包含的文本数据进行分词处理,获取若干个分词结果;将所述若干个分词结果输入至全文搜索引擎中,输出抽取到的目标数据。4.根据权利要求1所述的方法,其特征在于,所述根据所述SQL查询语句,从全文搜索引擎中抽取目标数据之前,还包括:实时监测目标数据库的存储状态;若判断获知所述目标数据库中的数据进行了更新,则将更新后的数据同步到所述全文搜索引擎中,以供所述全文搜索引擎更新索引。5.一种基于地理信息的数据展示方法,其特征在于,包括:抽取目标数据,所述目标数据的抽取方法为权利要求1-4任一项所述的方法;将所述目标数据渲染到地图上,实现所述目标数据的可视化展示。6.一种数据抽取装置,其特征在于...

【专利技术属性】
技术研发人员:左琦巫禄成刘彤郭燕燕代宝乾汪彤周扬凡谢昱姝
申请(专利权)人:北京市计算中心北京市劳动保护科学研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1